JP2020144264A - Agent device, control method of agent device, and program - Google Patents

Agent device, control method of agent device, and program Download PDF

Info

Publication number
JP2020144264A
JP2020144264A JP2019041639A JP2019041639A JP2020144264A JP 2020144264 A JP2020144264 A JP 2020144264A JP 2019041639 A JP2019041639 A JP 2019041639A JP 2019041639 A JP2019041639 A JP 2019041639A JP 2020144264 A JP2020144264 A JP 2020144264A
Authority
JP
Japan
Prior art keywords
agent
unit
function
function unit
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019041639A
Other languages
Japanese (ja)
Inventor
真也 安原
Shinya Yasuhara
真也 安原
裕介 大井
Yusuke Oi
裕介 大井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Honda Motor Co Ltd
Original Assignee
Honda Motor Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Honda Motor Co Ltd filed Critical Honda Motor Co Ltd
Priority to JP2019041639A priority Critical patent/JP2020144264A/en
Publication of JP2020144264A publication Critical patent/JP2020144264A/en
Pending legal-status Critical Current

Links

Images

Abstract

To provide an agent device, a control method of the agent device, and a program that can improve an agent function into a more easy-to-use one.SOLUTION: An agent device (100) comprises: an agent function unit (150) for providing a service including a voice response to speech of an occupant of a vehicle; and a reception unit (119) for receiving an instruction by the occupant. When the reception unit receives a predetermined instruction, a part of the function of the agent function unit is limited.SELECTED DRAWING: Figure 2

Description

本発明は、エージェント装置、エージェント装置の制御方法、およびプログラムに関する。 The present invention relates to an agent device, a control method for the agent device, and a program.

従来、車両の乗員と対話を行いながら、乗員の要求に応じた運転支援に関する情報や車両の制御、その他のアプリケーション等を提供するエージェント機能に関する技術が開示されている(例えば、特許文献1参照)。 Conventionally, a technology related to an agent function that provides information on driving support according to a request of a occupant, vehicle control, other applications, etc. while interacting with a vehicle occupant has been disclosed (see, for example, Patent Document 1). ..

特開2006−335231号公報Japanese Unexamined Patent Publication No. 2006-335231

近年では、エージェント機能を車両に搭載することについて実用化が進められているが、例えば、乗員が発話内容をエージェント機能に聞かれたくない場合や、エージェント機能に対しての発話ではないのにエージェント機能から応答があると煩わしく感じる場合などがあり、このような場合について十分に検討されていなかった。このため、従来の技術では、乗員がエージェント機能を使い勝手が悪いと感じる場面があった。 In recent years, practical application of installing the agent function in a vehicle has been promoted. For example, when the occupant does not want the agent function to hear the utterance content, or when the utterance is not for the agent function, the agent There are cases where it is annoying to receive a response from a function, and such cases have not been fully considered. For this reason, in the conventional technology, there are cases where the occupant feels that the agent function is not easy to use.

本発明は、このような事情を考慮してなされたものであり、エージェント機能をより使いやすいものに改善することができるエージェント装置、エージェント装置の制御方法、およびプログラムを提供することを目的の一つとする。 The present invention has been made in consideration of such circumstances, and an object of the present invention is to provide an agent device, a control method of the agent device, and a program capable of improving the agent function to be easier to use. I will.

この発明に係るエージェント装置、エージェント装置の制御方法、およびプログラムは、以下の構成を採用した。
(1):この発明の一態様に係るエージェント装置は、車両の乗員の発話に応じて、音声による応答を含むサービスを提供するエージェント機能部と、前記乗員による指示を受け付ける受付部と、を備え、前記受付部が所定の指示を受け付けた場合、前記エージェント機能部が有する一部の機能が制限されるものである。
The agent device, the control method of the agent device, and the program according to the present invention have adopted the following configurations.
(1): The agent device according to one aspect of the present invention includes an agent function unit that provides a service including a voice response in response to an utterance of a vehicle occupant, and a reception unit that receives instructions from the occupant. When the reception unit receives a predetermined instruction, some functions of the agent function unit are restricted.

(2):上記(1)の態様において、前記エージェント機能部が有する一部の機能を制限する制限管理部をさらに備えるものである。 (2): In the aspect of (1) above, the restriction management unit that limits some functions of the agent function unit is further provided.

(3):上記(1)の態様において、前記エージェント機能部は、前記受付部が前記所定の指示を受け付けた場合、前記一部の機能を自ら制限するものである。 (3): In the aspect of (1) above, the agent function unit limits some of the functions by itself when the reception unit receives the predetermined instruction.

(4):上記(1)〜(3)の態様において、前記受付部が前記所定の指示を受け付けた場合、前記エージェント機能部への音声入力が停止されることで、前記エージェント機能部が有する音声に対する応答機能が制限されるものである。 (4): In the above aspects (1) to (3), when the reception unit receives the predetermined instruction, the voice input to the agent function unit is stopped, so that the agent function unit has The response function to voice is limited.

(5):上記(1)〜(4)の態様において、前記受付部が前記所定の指示を受け付けた場合、前記エージェント機能部と協働してエージェントを仮想的に出現させるエージェントサーバへのアップロードが停止されることで、前記一部の機能が制限されるものである。 (5): In the above aspects (1) to (4), when the reception unit receives the predetermined instruction, uploading to the agent server in which the agent virtually appears in cooperation with the agent function unit. Is stopped, so that some of the functions are restricted.

(6):上記(1)〜(5)の態様において、前記受付部が前記所定の指示を受け付けた場合、前記乗員の発話に対する応答の音声出力が停止されることで、前記エージェント機能部が有する音声に対する応答機能が制限されるものである。 (6): In the above aspects (1) to (5), when the reception unit receives the predetermined instruction, the voice output of the response to the utterance of the occupant is stopped, so that the agent function unit causes the agent function unit. The response function to the voice possessed is limited.

(7):上記(1)〜(6)の態様において、前記エージェント機能部は、前記エージェント機能部が有する一部の機能が制限された場合、起動状態を継続するものである。 (7): In the above aspects (1) to (6), the agent function unit continues the activated state when some functions of the agent function unit are restricted.

(8):上記(1)〜(7)の態様において、前記受付部は、前記乗員による操作を受け付けるスイッチからの出力に基づいて、前記所定の指示を受け付けるものである。 (8): In the aspects (1) to (7) above, the reception unit receives the predetermined instruction based on the output from the switch that receives the operation by the occupant.

(9):上記(1)〜(8)の態様において、前記受付部は、音声認識の技術を用いて、前記乗員の発話による前記所定の指示を受け付けるものである。 (9): In the above aspects (1) to (8), the reception unit receives the predetermined instruction by the utterance of the occupant by using the technique of voice recognition.

(10):上記(1)〜(9)の態様において、前記エージェント機能部が起動している状態で、前記受付部が前記所定の指示を受け付けた場合、前記エージェント機能部が有する音声入力の機能、前記エージェント機能部が有する発話機能、および前記エージェント機能部が有するサーバへのアップロードの機能が、所定の順番で段階的に制限されるものである。 (10): In the aspects (1) to (9) above, when the reception unit receives the predetermined instruction while the agent function unit is activated, the voice input of the agent function unit is input. The function, the speech function of the agent function unit, and the upload function of the agent function unit to the server are gradually restricted in a predetermined order.

(11):本発明の他の態様に係るエージェント装置の制御方法は、コンピュータが、車両の乗員の発話に応じて、音声による応答を含むエージェントによるサービスを提供し、前記乗員による所定の指示を受け付けた場合、前記エージェントが有する一部の機能を制限するものである。 (11): In the control method of the agent device according to another aspect of the present invention, the computer provides a service by the agent including a voice response in response to the utterance of the occupant of the vehicle, and gives a predetermined instruction by the occupant. When accepted, it limits some of the functions of the agent.

(12):本発明の他の態様に係るプログラムは、コンピュータに、車両の乗員の発話に応じて、音声による応答を含むエージェントによるサービスを提供する処理と、前記乗員による指示を受け付ける処理と、所定の指示を受け付けた場合、前記エージェントが有する一部の機能を制限する処理と、を実行させるものである。 (12): The program according to another aspect of the present invention includes a process of providing a computer with a service by an agent including a voice response in response to an utterance of a vehicle occupant, and a process of receiving an instruction by the occupant. When a predetermined instruction is received, a process of limiting some functions of the agent is executed.

(1)〜(12)の態様によれば、エージェント機能をより使いやすいものに改善することができる。 According to the aspects (1) to (12), the agent function can be improved to be easier to use.

エージェント装置100を含むエージェントシステム1の構成図である。It is a block diagram of the agent system 1 including the agent apparatus 100. 第1実施形態に係るエージェント装置100の構成と、車両Mに搭載された機器とを示す図である。It is a figure which shows the structure of the agent apparatus 100 which concerns on 1st Embodiment, and the apparatus mounted on the vehicle M. 表示・操作装置20の配置例を示す図である。It is a figure which shows the arrangement example of the display / operation apparatus 20. スピーカユニット30の配置例を示す図である。It is a figure which shows the arrangement example of a speaker unit 30. エージェントサーバ200の構成と、エージェント装置100の構成の一部とを示す図である。It is a figure which shows the configuration of the agent server 200, and a part of the configuration of the agent apparatus 100. エージェント機能部150が有する一部の機能が制限されていない状態の処理例について説明するための参考図である。It is a reference figure for demonstrating the processing example of the state in which some functions of the agent function part 150 are not restricted. エージェント機能部150が有する「音声に対する応答機能」が制限されている状態の処理例について説明するための参考図である。It is a reference figure for demonstrating the processing example of the state in which the "response function to voice" which the agent function part 150 has is limited. エージェント機能部150が有する「音声に対する応答機能」が制限されている状態の他の処理例について説明するための参考図である。It is a reference figure for demonstrating another processing example in the state which the "response function to voice" which the agent function part 150 has is limited. エージェント機能部150が有する「アップロード機能」が制限されている状態の処理例について説明するための参考図である。It is a reference figure for demonstrating the processing example of the state in which the "upload function" which the agent function part 150 has is restricted. エージェント機能部150の一部機能が制限されていない状態におけるエージェント画像の一例を示す図である。It is a figure which shows an example of the agent image in the state which the partial function of the agent function part 150 is not restricted. エージェント機能部150の一部機能が制限されている状態におけるエージェント画像の一例を示す図である。It is a figure which shows an example of the agent image in the state which a part function of the agent function part 150 is restricted. エージェント装置100による制限処理の一例を示すフローチャートである。It is a flowchart which shows an example of the restriction processing by an agent apparatus 100. エージェント装置100によるタイムアウト処理の一例を示すフローチャートである。It is a flowchart which shows an example of the time-out processing by the agent apparatus 100.

以下、図面を参照し、本発明のエージェント装置、エージェント装置の制御方法、およびプログラムの実施形態について説明する。エージェント装置は、エージェントシステムの一部または全部を実現する装置である。以下では、エージェント装置の一例として、車両(以下、車両M)に搭載され、複数種類のエージェント機能を備えたエージェント装置について説明する。エージェント機能とは、例えば、車両Mの乗員と対話をしながら、乗員の発話の中に含まれる要求(コマンド)に基づく各種の情報提供を行ったり、ネットワークサービスを仲介したりする機能である。複数種類のエージェントはそれぞれに果たす機能、処理手順、制御、出力態様・内容がそれぞれ異なってもよい。また、エージェント機能の中には、車両内の機器(例えば運転制御や車体制御に関わる機器)の制御等を行う機能を有するものがあってよい。 Hereinafter, the agent device of the present invention, the control method of the agent device, and the embodiment of the program will be described with reference to the drawings. An agent device is a device that realizes a part or all of an agent system. Hereinafter, as an example of the agent device, an agent device mounted on a vehicle (hereinafter referred to as a vehicle M) and having a plurality of types of agent functions will be described. The agent function is, for example, a function of providing various information based on a request (command) included in the utterance of the occupant or mediating a network service while interacting with the occupant of the vehicle M. The functions, processing procedures, controls, output modes and contents of each of the plurality of types of agents may be different. In addition, some of the agent functions may have a function of controlling equipment in the vehicle (for example, equipment related to driving control and vehicle body control).

エージェント機能は、例えば、乗員の音声を認識する音声認識機能(音声をテキスト化する機能)に加え、自然言語処理機能(テキストの構造や意味を理解する機能)、対話管理機能、ネットワークを介して他装置を検索し、或いは自装置が保有する所定のデータベースを検索するネットワーク検索機能等を統合的に利用して実現される。これらの機能の一部または全部は、AI(Artificial Intelligence)技術によって実現されてよい。また、これらの機能を行うための構成の一部(特に、音声認識機能や自然言語処理解釈機能)は、車両Mの車載通信装置または車両Mに持ち込まれた汎用通信装置と通信可能なエージェントサーバ(外部装置)に搭載されてもよい。以下の説明では、構成の一部がエージェントサーバに搭載されており、エージェント装置とエージェントサーバが協働してエージェントシステムを実現することを前提とする。また、エージェント装置とエージェントサーバが協働して仮想的に出現させるサービス提供主体(サービス・エンティティ)をエージェントと称する。 Agent functions include, for example, a voice recognition function that recognizes the voice of an occupant (a function that converts voice into text), a natural language processing function (a function that understands the structure and meaning of text), a dialogue management function, and a network. It is realized by integratedly using a network search function or the like that searches for another device or a predetermined database owned by the own device. Some or all of these functions may be realized by AI (Artificial Intelligence) technology. In addition, a part of the configuration for performing these functions (particularly, the voice recognition function and the natural language processing interpretation function) is an agent server capable of communicating with the in-vehicle communication device of the vehicle M or the general-purpose communication device brought into the vehicle M. It may be mounted on (external device). In the following description, it is assumed that a part of the configuration is installed in the agent server, and the agent device and the agent server cooperate to realize the agent system. Further, a service provider (service entity) in which an agent device and an agent server cooperate to appear virtually is called an agent.

<全体構成>
図1は、エージェント装置100を含むエージェントシステム1の構成図である。エージェントシステム1は、例えば、エージェント装置100と、複数のエージェントサーバ200−1、200−2、200−3、…とを備える。符号の末尾のハイフン以下数字は、エージェントを区別するための識別子であるものとする。いずれのエージェントサーバであるかを区別しない場合、単にエージェントサーバ200と称する場合がある。図1では3つのエージェントサーバ200を示しているが、エージェントサーバ200の数は2つであってもよいし、4つ以上であってもよい。それぞれのエージェントサーバ200は、互いに異なるエージェントシステムの提供者が運営するものである。従って、本発明におけるエージェントは、互いに異なる提供者により実現されるエージェントである。提供者としては、例えば、自動車メーカー、ネットワークサービス事業者、電子商取引事業者、携帯端末の販売者や製造者などが挙げられ、任意の主体(法人、団体、個人等)がエージェントシステムの提供者となり得る。
<Overall configuration>
FIG. 1 is a configuration diagram of an agent system 1 including an agent device 100. The agent system 1 includes, for example, an agent device 100 and a plurality of agent servers 200-1, 200-2, 200-3, .... The number after the hyphen at the end of the code shall be an identifier for distinguishing agents. When it is not distinguished which agent server it is, it may be simply referred to as an agent server 200. Although three agent servers 200 are shown in FIG. 1, the number of agent servers 200 may be two or four or more. Each agent server 200 is operated by a provider of agent systems different from each other. Therefore, the agents in the present invention are agents realized by different providers. Examples of providers include automobile manufacturers, network service providers, e-commerce businesses, sellers and manufacturers of mobile terminals, and any entity (corporation, group, individual, etc.) is the provider of the agent system. Can be.

エージェント装置100は、ネットワークNWを介してエージェントサーバ200と通信する。ネットワークNWは、例えば、インターネット、セルラー網、Wi−Fi網、WAN(Wide Area Network)、LAN(Local Area Network)、公衆回線、電話回線、無線基地局などのうち一部または全部を含む。ネットワークNWには、各種ウェブサーバ300が接続されており、エージェントサーバ200またはエージェント装置100は、ネットワークNWを介して各種ウェブサーバ300からウェブページを取得することができる。 The agent device 100 communicates with the agent server 200 via the network NW. The network NW includes, for example, a part or all of the Internet, a cellular network, a Wi-Fi network, a WAN (Wide Area Network), a LAN (Local Area Network), a public line, a telephone line, a wireless base station, and the like. Various web servers 300 are connected to the network NW, and the agent server 200 or the agent device 100 can acquire web pages from the various web servers 300 via the network NW.

エージェント装置100は、車両Mの乗員と対話を行い、乗員からの音声をエージェントサーバ200に送信し、エージェントサーバ200から得られた回答を、音声出力や画像表示の形で乗員に提示する。 The agent device 100 interacts with the occupant of the vehicle M, transmits the voice from the occupant to the agent server 200, and presents the answer obtained from the agent server 200 to the occupant in the form of voice output or image display.

<第1実施形態>
[車両]
図2は、第1実施形態に係るエージェント装置100の構成と、車両Mに搭載された機器とを示す図である。車両Mには、例えば、一以上のマイク10と、表示・操作装置20と、スピーカユニット30と、ナビゲーション装置40と、車両機器50と、車載通信装置60と、乗員認識装置80と、エージェント装置100とが搭載される。また、スマートフォンなどの汎用通信装置70が車室内に持ち込まれ、通信装置として使用される場合がある。これらの装置は、CAN(Controller Area Network)通信線等の多重通信線やシリアル通信線、無線通信網等によって互いに接続される。なお、図2に示す構成はあくまで一例であり、構成の一部が省略されてもよいし、更に別の構成が追加されてもよい。
<First Embodiment>
[vehicle]
FIG. 2 is a diagram showing the configuration of the agent device 100 according to the first embodiment and the equipment mounted on the vehicle M. The vehicle M includes, for example, one or more microphones 10, a display / operation device 20, a speaker unit 30, a navigation device 40, a vehicle device 50, an in-vehicle communication device 60, an occupant recognition device 80, and an agent device. 100 and are installed. Further, a general-purpose communication device 70 such as a smartphone may be brought into the vehicle interior and used as a communication device. These devices are connected to each other by a multiplex communication line such as a CAN (Controller Area Network) communication line, a serial communication line, a wireless communication network, or the like. The configuration shown in FIG. 2 is merely an example, and a part of the configuration may be omitted or another configuration may be added.

マイク10は、車室内で発せられた音声を収集する収音部である。表示・操作装置20は、画像を表示すると共に、入力操作を受付可能な装置(或いは装置群)である。表示・操作装置20は、例えば、タッチパネルとして構成されたディスプレイ装置を含む。表示・操作装置20は、更に、HUD(Head Up Display)や機械式の入力装置を含んでもよい。スピーカユニット30は、例えば、車室内の互いに異なる位置に配設された複数のスピーカ(音出力部)を含む。表示・操作装置20は、エージェント装置100とナビゲーション装置40とで共用されてもよい。これらの詳細については後述する。 The microphone 10 is a sound collecting unit that collects sounds emitted in the vehicle interior. The display / operation device 20 is a device (or device group) capable of displaying an image and accepting an input operation. The display / operation device 20 includes, for example, a display device configured as a touch panel. The display / operation device 20 may further include a HUD (Head Up Display) or a mechanical input device. The speaker unit 30 includes, for example, a plurality of speakers (sound output units) arranged at different positions in the vehicle interior. The display / operation device 20 may be shared by the agent device 100 and the navigation device 40. Details of these will be described later.

ナビゲーション装置40は、ナビHMI(Human machine Interface)と、GPS(Global Positioning System)などの位置測位装置と、地図情報を記憶した記憶装置と、経路探索などを行う制御装置(ナビゲーションコントローラ)とを備える。マイク10、表示・操作装置20、およびスピーカユニット30のうち一部または全部がナビHMIとして用いられてもよい。ナビゲーション装置40は、位置測位装置によって特定された車両Mの位置から、乗員によって入力された目的地まで移動するための経路(ナビ経路)を探索し、経路に沿って車両Mが走行できるように、ナビHMIを用いて案内情報を出力する。経路探索機能は、ネットワークNWを介してアクセス可能なナビゲーションサーバにあってもよい。この場合、ナビゲーション装置40は、ナビゲーションサーバから経路を取得して案内情報を出力する。なお、エージェント装置100は、ナビゲーションコントローラを基盤として構築されてもよく、その場合、ナビゲーションコントローラとエージェント装置100は、ハードウェア上は一体に構成される。 The navigation device 40 includes a navigation HMI (Human machine Interface), a positioning device such as a GPS (Global Positioning System), a storage device that stores map information, and a control device (navigation controller) that performs route search and the like. .. A part or all of the microphone 10, the display / operation device 20, and the speaker unit 30 may be used as the navigation HMI. The navigation device 40 searches for a route (navigation route) for moving from the position of the vehicle M specified by the positioning device to the destination input by the occupant, so that the vehicle M can travel along the route. , Navi HMI is used to output guidance information. The route search function may be provided in a navigation server accessible via the network NW. In this case, the navigation device 40 acquires a route from the navigation server and outputs guidance information. The agent device 100 may be constructed based on the navigation controller. In that case, the navigation controller and the agent device 100 are integrally configured on the hardware.

車両機器50は、例えば、エンジンや走行用モータなどの駆動力出力装置、エンジンの始動モータ、ドアロック装置、ドア開閉装置、窓、窓の開閉装置及び窓の開閉制御装置、シート、シート位置の制御装置、ルームミラー及びその角度位置制御装置、車両内外の照明装置及びその制御装置、ワイパーやデフォッガー及びそれぞれの制御装置、方向指示灯及びその制御装置、空調装置、走行距離やタイヤの空気圧の情報や燃料の残量情報などの車両情報装置などを含む。 The vehicle equipment 50 includes, for example, a driving force output device such as an engine or a traveling motor, an engine start motor, a door lock device, a door opening / closing device, a window, a window opening / closing device, a window opening / closing control device, a seat, and a seat position. Control device, room mirror and its angle position control device, lighting device inside and outside the vehicle and its control device, wiper and defogger and their respective control devices, direction indicator and its control device, air conditioner, mileage and tire pressure information And vehicle information devices such as fuel level information.

車載通信装置60は、例えば、セルラー網やWi−Fi網を利用してネットワークNWにアクセス可能な無線通信装置である。 The in-vehicle communication device 60 is, for example, a wireless communication device that can access the network NW using a cellular network or a Wi-Fi network.

乗員認識装置80は、例えば、着座センサ、車室内カメラ、画像認識装置などを含む。着座センサは座席の下部に設けられた圧力センサ、シートベルトに取り付けられた張力センサなどを含む。車室内カメラは、車室内に設けられたCCD(Charge Coupled Device)カメラやCMOS(Complementary Metal Oxide Semiconductor)カメラである。画像認識装置は、車室内カメラの画像を解析し、座席ごとの乗員の有無、顔向きなどを認識する。本実施形態において、乗員認識装置80は、着座位置認識部の一例である。 The occupant recognition device 80 includes, for example, a seating sensor, a vehicle interior camera, an image recognition device, and the like. The seating sensor includes a pressure sensor provided at the bottom of the seat, a tension sensor attached to the seat belt, and the like. The vehicle interior camera is a CCD (Charge Coupled Device) camera or a CMOS (Complementary Metal Oxide Semiconductor) camera installed in the vehicle interior. The image recognition device analyzes the image of the vehicle interior camera and recognizes the presence or absence of a occupant for each seat, the face orientation, and the like. In the present embodiment, the occupant recognition device 80 is an example of the seating position recognition unit.

図3は、表示・操作装置20の配置例を示す図である。表示・操作装置20は、例えば、第1ディスプレイ22と、第2ディスプレイ24と、操作スイッチASSY26と、ミュートボタン27とを含む。表示・操作装置20は、更に、HUD28を含んでもよい。 FIG. 3 is a diagram showing an arrangement example of the display / operation device 20. The display / operation device 20 includes, for example, a first display 22, a second display 24, an operation switch ASSY 26, and a mute button 27. The display / operation device 20 may further include a HUD 28.

車両Mには、例えば、ステアリングホイールSWが設けられた運転席DSと、運転席DSに対して車幅方向(図中Y方向)に設けられた助手席ASとが存在する。第1ディスプレイ22は、インストルメントパネルにおける運転席DSと助手席ASとの中間辺りから、助手席ASの左端部に対向する位置まで延在する横長形状のディスプレイ装置である。第2ディスプレイ24は、運転席DSと助手席ASとの車幅方向に関する中間あたり、且つ第1ディスプレイの下方に設置されている。例えば、第1ディスプレイ22と第2ディスプレイ24は、共にタッチパネルとして構成され、表示部としてLCD(Liquid Crystal Display)や有機EL(Electroluminescence)、プラズマディスプレイなどを備えるものである。操作スイッチASSY26は、ダイヤルスイッチやボタン式スイッチなどが集積されたものである。ミュートボタン27は、例えば、ステアリングホイールSWの一部に設けられている。これに限られず、ミュートボタン27は、操作スイッチASSY26に含まれる構成であってもよい。表示・操作装置20は、乗員によってなされた操作の内容をエージェント装置100に出力する。第1ディスプレイ22または第2ディスプレイ24が表示する内容は、エージェント装置100によって決定されてよい。 The vehicle M includes, for example, a driver's seat DS provided with a steering wheel SW and a passenger seat AS provided in the vehicle width direction (Y direction in the drawing) with respect to the driver's seat DS. The first display 22 is a horizontally long display device extending from an intermediate portion between the driver's seat DS and the passenger's seat AS on the instrument panel to a position facing the left end of the passenger's seat AS. The second display 24 is installed at the middle of the driver's seat DS and the passenger's seat AS in the vehicle width direction and below the first display. For example, both the first display 22 and the second display 24 are configured as a touch panel, and include an LCD (Liquid Crystal Display), an organic EL (Electroluminescence), a plasma display, and the like as display units. The operation switch ASSY26 is a combination of dial switches, button-type switches, and the like. The mute button 27 is provided, for example, on a part of the steering wheel SW. Not limited to this, the mute button 27 may have a configuration included in the operation switch ASSY 26. The display / operation device 20 outputs the content of the operation performed by the occupant to the agent device 100. The content displayed by the first display 22 or the second display 24 may be determined by the agent device 100.

図4は、スピーカユニット30の配置例を示す図である。スピーカユニット30は、例えば、スピーカ30A〜30Hを含む。スピーカ30Aは、運転席DS側の窓柱(いわゆるAピラー)に設置されている。スピーカ30Bは、運転席DSに近いドアの下部に設置されている。スピーカ30Cは、助手席AS側の窓柱に設置されている。スピーカ30Dは、助手席ASに近いドアの下部に設置されている。スピーカ30Eは、右側後部座席BS1側に近いドアの下部に設置されている。スピーカ30Fは、左側後部座席BS2側に近いドアの下部に設置されている。スピーカ30Gは、第2ディスプレイ24の近傍に設置されている。スピーカ30Hは、車室の天井(ルーフ)に設置されている。 FIG. 4 is a diagram showing an arrangement example of the speaker unit 30. The speaker unit 30 includes, for example, speakers 30A to 30H. The speaker 30A is installed on a window pillar (so-called A pillar) on the driver's seat DS side. The speaker 30B is installed under the door near the driver's seat DS. The speaker 30C is installed on the window pillar on the passenger seat AS side. The speaker 30D is installed at the bottom of the door near the passenger seat AS. The speaker 30E is installed at the lower part of the door near the right rear seat BS1 side. The speaker 30F is installed at the lower part of the door near the left rear seat BS2 side. The speaker 30G is installed in the vicinity of the second display 24. The speaker 30H is installed on the ceiling (roof) of the vehicle interior.

係る配置において、例えば、専らスピーカ30Aおよび30Bに音を出力させた場合、音像は運転席DS付近に定位することになる。また、専らスピーカ30Cおよび30Dに音を出力させた場合、音像は助手席AS付近に定位することになる。また、専らスピーカ30Eに音を出力させた場合、音像は右側後部座席BS1付近に定位することになる。また、専らスピーカ30Fに音を出力させた場合、音像は左側後部座席BS2付近に定位することになる。また、専らスピーカ30Gに音を出力させた場合、音像は車室の前方付近に定位することになり、専らスピーカ30Hに音を出力させた場合、音像は車室の上方付近に定位することになる。これに限らず、スピーカユニット30は、ミキサーやアンプを用いて各スピーカの出力する音の配分を調整することで、車室内の任意の位置に音像を定位させることができる。 In such an arrangement, for example, when the speakers 30A and 30B exclusively output sound, the sound image is localized in the vicinity of the driver's seat DS. Further, when the sound is output exclusively to the speakers 30C and 30D, the sound image is localized in the vicinity of the passenger seat AS. Further, when the sound is output exclusively to the speaker 30E, the sound image is localized in the vicinity of the right rear seat BS1. Further, when the sound is output exclusively to the speaker 30F, the sound image is localized in the vicinity of the left rear seat BS2. Further, when the sound is output exclusively to the speaker 30G, the sound image is localized near the front of the passenger compartment, and when the sound is output exclusively to the speaker 30H, the sound image is localized near the upper part of the passenger compartment. Become. Not limited to this, the speaker unit 30 can localize the sound image at an arbitrary position in the vehicle interior by adjusting the distribution of the sound output from each speaker by using a mixer or an amplifier.

[エージェント装置]
図2に戻り、エージェント装置100は、管理部110と、エージェント機能部150−1、150−2、150−3と、ペアリングアプリ実行部152とを備える。管理部110は、例えば、音響処理部112と、エージェントごとWU(Wake Up)判定部114と、表示制御部116と、音声制御部118と、指示受付部119と、制限管理部120と、タイムアウト管理部122と、を備える。いずれのエージェント機能部であるか区別しない場合、単にエージェント機能部150と称する。3つのエージェント機能部150を示しているのは、図1におけるエージェントサーバ200の数に対応させた一例に過ぎず、エージェント機能部150の数は、2つであってもよいし、4つ以上であってもよい。図2に示すソフトウェア配置は説明のために簡易に示しており、実際には、例えば、エージェント機能部150と車載通信装置60の間に管理部110が介在してもよいように、任意に改変することができる。
[Agent device]
Returning to FIG. 2, the agent device 100 includes a management unit 110, agent function units 150-1, 150-2, 150-3, and a pairing application execution unit 152. The management unit 110 includes, for example, an acoustic processing unit 112, a WU (Wake Up) determination unit 114 for each agent, a display control unit 116, a voice control unit 118, an instruction reception unit 119, a restriction management unit 120, and a time-out. It includes a management unit 122. When it is not distinguished which agent function unit it is, it is simply referred to as an agent function unit 150. The three agent function units 150 are shown only as an example corresponding to the number of agent servers 200 in FIG. 1, and the number of agent function units 150 may be two or four or more. It may be. The software layout shown in FIG. 2 is simply shown for the sake of explanation, and is actually modified arbitrarily so that, for example, the management unit 110 may intervene between the agent function unit 150 and the in-vehicle communication device 60. can do.

エージェント装置100の各構成要素は、例えば、CPU(Central Processing Unit)などのハードウェアプロセッサがプログラム(ソフトウェア)を実行することにより実現される。これらの構成要素のうち一部または全部は、LSI(Large Scale Integration)やASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)、GPU(Graphics Processing Unit)などのハードウェア(回路部;circuitryを含む)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。プログラムは、予めHDD(Hard Disk Drive)やフラッシュメモリなどの記憶装置(非一過性の記憶媒体を備える記憶装置)に格納されていてもよいし、DVDやCD−ROMなどの着脱可能な記憶媒体(非一過性の記憶媒体)に格納されており、記憶媒体がドライブ装置に装着されることでインストールされてもよい。 Each component of the agent device 100 is realized, for example, by executing a program (software) by a hardware processor such as a CPU (Central Processing Unit). Some or all of these components are hardware such as LSI (Large Scale Integration), ASIC (Application Specific Integrated Circuit), FPGA (Field-Programmable Gate Array), GPU (Graphics Processing Unit), etc. It may be realized by (including circuits), or it may be realized by the cooperation of software and hardware. The program may be stored in advance in a storage device (a storage device including a non-transient storage medium) such as an HDD (Hard Disk Drive) or a flash memory, or a removable storage device such as a DVD or a CD-ROM. It is stored in a medium (non-transient storage medium) and may be installed by mounting the storage medium in a drive device.

管理部110は、OS(Operating System)やミドルウェアなどのプログラムが実行されることで機能する。 The management unit 110 functions by executing a program such as an OS (Operating System) or middleware.

管理部110の音響処理部112は、エージェントごとに予め設定されているウエイクアップワードを認識するのに適した状態になるように、入力された音に対して音響処理を行う。 The sound processing unit 112 of the management unit 110 performs sound processing on the input sound so as to be in a state suitable for recognizing a wakeup word preset for each agent.

エージェントごとWU判定部114は、エージェント機能部150−1、150−2、150−3のそれぞれに対応して存在し、エージェントごとに予め定められているウエイクアップワードを認識する。エージェントごとWU判定部114は、音響処理が行われた音声(音声ストリーム)から音声の意味を認識する。まず、エージェントごとWU判定部114は、音声ストリームにおける音声波形の振幅と零交差に基づいて音声区間を検出する。エージェントごとWU判定部114は、混合ガウス分布モデル(GMM;Gaussian mixture model) に基づくフレーム単位の音声識別および非音声識別に基づく区間検出を行ってもよい。 The WU determination unit 114 for each agent exists corresponding to each of the agent function units 150-1, 150-2, and 150-3, and recognizes a wakeup word predetermined for each agent. The WU determination unit 114 for each agent recognizes the meaning of the voice from the voice (voice stream) subjected to the acoustic processing. First, the WU determination unit 114 for each agent detects a voice section based on the amplitude and zero intersection of the voice waveform in the voice stream. The WU determination unit 114 for each agent may perform frame-by-frame speech recognition based on a mixture Gaussian mixture model (GMM) and section detection based on non-speech recognition.

次に、エージェントごとWU判定部114は、検出した音声区間における音声をテキスト化し、文字情報とする。そして、エージェントごとWU判定部114は、テキスト化した文字情報がウエイクアップワードに該当するか否かを判定する。ウエイクアップワードであると判定した場合、エージェントごとWU判定部114は、対応するエージェント機能部150を起動させる。なお、エージェントごとWU判定部114に相当する機能がエージェントサーバ200に搭載されてもよい。この場合、管理部110は、音響処理部112によって音響処理が行われた音声ストリームをエージェントサーバ200に送信し、エージェントサーバ200がウエイクアップワードであると判定した場合、エージェントサーバ200からの指示に従ってエージェント機能部150が起動する。なお、各エージェント機能部150は、常時起動しており且つウエイクアップワードの判定を自ら行うものであってよい。この場合、管理部110がエージェントごとWU判定部114を備える必要はない。 Next, the WU determination unit 114 for each agent converts the voice in the detected voice section into text and converts it into character information. Then, the WU determination unit 114 for each agent determines whether or not the textual character information corresponds to the wakeup word. When it is determined that the word is a wakeup word, the WU determination unit 114 for each agent activates the corresponding agent function unit 150. The agent server 200 may be equipped with a function corresponding to the WU determination unit 114 for each agent. In this case, when the management unit 110 transmits the voice stream to which the sound processing has been performed by the sound processing unit 112 to the agent server 200 and determines that the agent server 200 is a wakeup word, the management unit 110 follows an instruction from the agent server 200. The agent function unit 150 starts. It should be noted that each agent function unit 150 may be always activated and may determine the wakeup word by itself. In this case, the management unit 110 does not need to include the WU determination unit 114 for each agent.

エージェント機能部150は、対応するエージェントサーバ200と協働してエージェントを仮想的に出現させ、車両の乗員の発話に応じて、音声による応答を含むサービスを提供する。エージェント機能部150には、車両機器50を制御する権限が付与されたものが含まれてよい。また、エージェント機能部150には、ペアリングアプリ実行部152を介して汎用通信装置70と連携し、エージェントサーバ200と通信するものがあってよい。例えば、エージェント機能部150−1には、車両機器50を制御する権限が付与されている。エージェント機能部150−1は、車載通信装置60を介してエージェントサーバ200−1と通信する。エージェント機能部150−2は、車載通信装置60を介してエージェントサーバ200−2と通信する。エージェント機能部150−3は、ペアリングアプリ実行部152を介して汎用通信装置70と連携し、エージェントサーバ200−3と通信する。ペアリングアプリ実行部152は、例えば、Bluetooth(登録商標)によって汎用通信装置70とペアリングを行い、エージェント機能部150−3と汎用通信装置70とを接続させる。なお、エージェント機能部150−3は、USB(Universal Serial Bus)などを利用した有線通信によって汎用通信装置70に接続されるようにしてもよい。以下、エージェント機能部150−1とエージェントサーバ200−1が協働して出現させるエージェントをエージェント1、エージェント機能部150−2とエージェントサーバ200−2が協働して出現させるエージェントをエージェント2、エージェント機能部150−3とエージェントサーバ200−3が協働して出現させるエージェントをエージェント3と称する場合がある。 The agent function unit 150 virtually causes an agent to appear in cooperation with the corresponding agent server 200, and provides a service including a voice response in response to a vehicle occupant's utterance. The agent function unit 150 may include one to which the authority to control the vehicle device 50 is granted. Further, the agent function unit 150 may be one that cooperates with the general-purpose communication device 70 via the pairing application execution unit 152 and communicates with the agent server 200. For example, the agent function unit 150-1 is given the authority to control the vehicle device 50. The agent function unit 150-1 communicates with the agent server 200-1 via the vehicle-mounted communication device 60. The agent function unit 150-2 communicates with the agent server 200-2 via the vehicle-mounted communication device 60. The agent function unit 150-3 cooperates with the general-purpose communication device 70 via the pairing application execution unit 152, and communicates with the agent server 200-3. The pairing application execution unit 152 pairs with the general-purpose communication device 70 by, for example, Bluetooth (registered trademark), and connects the agent function unit 150-3 and the general-purpose communication device 70. The agent function unit 150-3 may be connected to the general-purpose communication device 70 by wired communication using USB (Universal Serial Bus) or the like. Hereinafter, the agent 1 in which the agent function unit 150-1 and the agent server 200-1 collaborate to appear, the agent 2 in which the agent function unit 150-2 and the agent server 200-2 collaborate to appear. An agent that the agent function unit 150-3 and the agent server 200-3 collaborate to appear may be referred to as an agent 3.

表示制御部116は、エージェント機能部150からの指示に応じて第1ディスプレイ22または第2ディスプレイ24に画像を表示させる。以下では、第1ディスプレイ22を使用するものとする。表示制御部116は、一部のエージェント機能部150の制御により、例えば、車室内で乗員とのコミュニケーションを行う擬人化されたエージェントの画像(以下、エージェント画像と称する)を生成し、生成したエージェント画像を第1ディスプレイ22に表示させる。エージェント画像は、例えば、乗員に対して話しかける態様の画像である。エージェント画像は、例えば、少なくとも観者(乗員)によって表情や顔向きが認識される程度の顔画像を含んでよい。例えば、エージェント画像は、顔領域の中に目や鼻に擬したパーツが表されており、顔領域の中のパーツの位置に基づいて表情や顔向きが認識されるものであってよい。また、エージェント画像は、立体的に感じられ、観者によって三次元空間における頭部画像を含むことでエージェントの顔向きが認識されたり、本体(胴体や手足)の画像を含むことで、エージェントの動作や振る舞い、姿勢等が認識されるものであってもよい。また、エージェント画像は、アニメーション画像であってもよい。 The display control unit 116 causes the first display 22 or the second display 24 to display an image in response to an instruction from the agent function unit 150. In the following, it is assumed that the first display 22 is used. The display control unit 116 generates, for example, an image of an anthropomorphic agent (hereinafter referred to as an agent image) that communicates with an occupant in the vehicle interior under the control of a part of the agent function unit 150, and the generated agent. The image is displayed on the first display 22. The agent image is, for example, an image of a mode of talking to an occupant. The agent image may include, for example, a facial image such that the facial expression and the facial orientation are recognized by the viewer (occupant) at least. For example, in the agent image, parts imitating eyes and nose are represented in the face area, and the facial expression and face orientation may be recognized based on the positions of the parts in the face area. In addition, the agent image is felt three-dimensionally, and the viewer can recognize the face orientation of the agent by including the head image in the three-dimensional space, or the agent's image can be included by including the image of the main body (body and limbs). The movement, behavior, posture, etc. may be recognized. Further, the agent image may be an animation image.

音声制御部118は、エージェント機能部150からの指示に応じて、スピーカユニット30に含まれるスピーカのうち一部または全部に音声を出力させる。音声制御部118は、複数のスピーカユニット30を用いて、エージェント画像の表示位置に対応する位置にエージェント音声の音像を定位させる制御を行ってもよい。エージェント画像の表示位置に対応する位置とは、例えば、エージェント画像がエージェント音声を喋っていると乗員が感じると予測される位置であり、具体的には、エージェント画像の表示位置付近(例えば、2〜3[cm]以内)の位置である。また、音像が定位するとは、例えば、乗員の左右の耳に伝達される音の大きさを調節することにより、乗員が感じる音源の空間的な位置を定めることである。 The voice control unit 118 causes a part or all of the speakers included in the speaker unit 30 to output voice in response to an instruction from the agent function unit 150. The voice control unit 118 may use a plurality of speaker units 30 to control the localization of the sound image of the agent voice at a position corresponding to the display position of the agent image. The position corresponding to the display position of the agent image is, for example, a position where the occupant is expected to feel that the agent image is speaking the agent voice. Specifically, the position is near the display position of the agent image (for example, 2). It is within ~ 3 [cm]). Further, localization of the sound image means, for example, determining the spatial position of the sound source felt by the occupant by adjusting the loudness of the sound transmitted to the left and right ears of the occupant.

指示受付部119は、乗員による指示を受け付ける。例えば、指示受付部119は、エージェント機能部150の一部の機能が制限されていない状態で、表示・操作装置20に含まれるミュートボタン27が乗員により操作された場合、エージェントの一部制限指示を受け付ける。例えば、指示受付部119は、エージェント機能部150の一部の機能が制限されている状態で、ミュートボタン27が乗員により操作された場合、エージェントの解除指示を受け付ける。 The instruction reception unit 119 receives instructions from the occupants. For example, when the mute button 27 included in the display / operation device 20 is operated by the occupant in a state where some functions of the agent function unit 150 are not restricted, the instruction receiving unit 119 gives a partial restriction instruction of the agent. Accept. For example, the instruction receiving unit 119 receives an agent release instruction when the mute button 27 is operated by an occupant while some functions of the agent function unit 150 are restricted.

また、指示受付部119は、音声認識機能を備え、車内音声に基づいて音声の意味を認識してもよい。車内音声には、マイク10から入力された音や、音響処理部112により音響処理が行われた音声(音声ストリーム)などが含まれる。指示受付部119は、認識した音声に、エージェントの一部機能を制御すること(あるいは、一部機能の制限を解除すること)を指示する内容が含まれるか否かを判定し、エージェントの一部機能を制御すること(あるいは、一部機能の制限を解除すること)を指示する内容が認識した音声に含まれる場合、エージェントの一部制限指示(あるいは、解除指示)を受け付ける。 Further, the instruction receiving unit 119 may have a voice recognition function and may recognize the meaning of the voice based on the voice in the vehicle. The voice in the vehicle includes a sound input from the microphone 10 and a voice (voice stream) that has been sound-processed by the sound processing unit 112. The instruction receiving unit 119 determines whether or not the recognized voice includes a content instructing to control some functions of the agent (or to release the restriction of some functions), and one of the agents. When the recognized voice contains the content instructing to control a part function (or to release the restriction of a part of the function), the agent partially restricts the restriction instruction (or the release instruction) is accepted.

また、指示受付部119は、エージェントの一部制限指示や解除指示を受け付けた場合、その旨を、制限管理部120に通知してもよく、エージェント機能部150に通知してもよい。 Further, when the instruction receiving unit 119 receives a partial restriction instruction or a release instruction of the agent, the instruction receiving unit 119 may notify the restriction management unit 120 or the agent function unit 150 to that effect.

制限管理部120は、指示受付部119がエージェントの一部制限指示を受け付けた場合、エージェント機能部150が有する一部の機能を制限する。指示受付部119がエージェントの制限の解除指示を受け付けた場合、制限管理部120は、制限されているエージェント機能部150の機能の制限を解除する。詳細については、後述する。なお、エージェント機能部150が有する一部の機能が制限された場合であっても、エージェント機能部150の起動状態は継続される。 When the instruction receiving unit 119 receives a partial restriction instruction of the agent, the restriction management unit 120 limits some functions of the agent function unit 150. When the instruction receiving unit 119 receives the instruction to release the restriction of the agent, the restriction management unit 120 releases the restriction on the function of the restricted agent function unit 150. Details will be described later. Even if some functions of the agent function unit 150 are restricted, the activation state of the agent function unit 150 is continued.

タイムアウト管理部122は、起動中のエージェント機能部150のタイムアウトを管理する。例えば、タイムアウト管理部122は、エージェント機能部150が起動したとき、エージェント機能部150が乗員の発話に応じたサービスを提供したときなどを開始点として、一定時間(以下、タイムアウト時間と記す)が経過した場合、エージェント機能部150を停止させる。タイムアウト時間が経過した後に、エージェント機能部150を停止させる主体は、タイムアウト管理部122であってもよく、エージェントごとWU判定部114であってもよく、エージェント機能部150自身であってもよい。開始点は、上述したものに限られず、乗員の発話が終了したとき、エージェント機能部150が乗員の発話に応じたサービスの提供を開始したとき、エージェント機能部150の一部制限の解除指示を受け付けたときなどであってもよい。 The time-out management unit 122 manages the timeout of the agent function unit 150 that is running. For example, the time-out management unit 122 has a fixed time (hereinafter referred to as a time-out time) as a starting point when the agent function unit 150 is activated, when the agent function unit 150 provides a service according to the utterance of the occupant, and the like. When the elapse has passed, the agent function unit 150 is stopped. The main body that stops the agent function unit 150 after the timeout time has elapsed may be the time-out management unit 122, the WU determination unit 114 for each agent, or the agent function unit 150 itself. The starting point is not limited to the above, and when the occupant's utterance ends, when the agent function unit 150 starts providing the service according to the occupant's utterance, the agent function unit 150 issues a partial restriction release instruction. It may be when it is accepted.

タイムアウト管理部122は、指示受付部119がエージェント機能部150の一部制限指示を受け付けた場合、タイムアウトタイマーを停止する。指示受付部119がエージェント機能部150の一部制限の解除指示を受け付けた場合、タイムアウト管理部122は、タイムアウトタイマーを再開する。こうすることにより、エージェント機能部150の一部機能が制限されている期間において、タイムアウトしてしまうことを防止することができる。 The time-out management unit 122 stops the time-out timer when the instruction receiving unit 119 receives a partial restriction instruction of the agent function unit 150. When the instruction receiving unit 119 receives the instruction to release the partial restriction of the agent function unit 150, the time-out management unit 122 restarts the timeout timer. By doing so, it is possible to prevent a time-out from occurring during a period in which some functions of the agent function unit 150 are restricted.

[エージェントサーバ]
図5は、エージェントサーバ200の構成と、エージェント装置100の構成の一部とを示す図である。以下、エージェントサーバ200の構成と共にエージェント機能部150等の動作について説明する。ここでは、エージェント装置100からネットワークNWまでの物理的な通信についての説明を省略する。
[Agent server]
FIG. 5 is a diagram showing a configuration of the agent server 200 and a part of the configuration of the agent device 100. Hereinafter, the operation of the agent function unit 150 and the like together with the configuration of the agent server 200 will be described. Here, the description of the physical communication from the agent device 100 to the network NW will be omitted.

エージェントサーバ200は、通信部210を備える。通信部210は、例えばNIC(Network Interface Card)などのネットワークインターフェースである。更に、エージェントサーバ200は、例えば、音声認識部220と、自然言語処理部222と、対話管理部224と、ネットワーク検索部226と、応答文生成部228とを備える。これらの構成要素は、例えば、CPUなどのハードウェアプロセッサがプログラム(ソフトウェア)を実行することにより実現される。これらの構成要素のうち一部または全部は、LSIやASIC、FPGA、GPUなどのハードウェア(回路部;circuitryを含む)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。プログラムは、予めHDDやフラッシュメモリなどの記憶装置(非一過性の記憶媒体を備える記憶装置)に格納されていてもよいし、DVDやCD−ROMなどの着脱可能な記憶媒体(非一過性の記憶媒体)に格納されており、記憶媒体がドライブ装置に装着されることでインストールされてもよい。 The agent server 200 includes a communication unit 210. The communication unit 210 is a network interface such as a NIC (Network Interface Card). Further, the agent server 200 includes, for example, a voice recognition unit 220, a natural language processing unit 222, a dialogue management unit 224, a network search unit 226, and a response sentence generation unit 228. These components are realized, for example, by a hardware processor such as a CPU executing a program (software). Some or all of these components may be realized by hardware such as LSI, ASIC, FPGA, GPU (including circuit part; circuitry), or realized by collaboration between software and hardware. May be good. The program may be stored in advance in a storage device such as an HDD or flash memory (a storage device including a non-transient storage medium), or a removable storage medium such as a DVD or a CD-ROM (non-transient). It is stored in a sex storage medium) and may be installed by attaching the storage medium to a drive device.

エージェントサーバ200は、記憶部250を備える。記憶部250は、上記の各種記憶装置により実現される。記憶部250には、パーソナルプロファイル252、辞書DB(データベース)254、知識ベースDB256、応答規則DB258などのデータやプログラムが格納される。 The agent server 200 includes a storage unit 250. The storage unit 250 is realized by the above-mentioned various storage devices. Data and programs such as a personal profile 252, a dictionary DB (database) 254, a knowledge base DB 256, and a response rule DB 258 are stored in the storage unit 250.

エージェント装置100において、エージェント機能部150は、音声ストリーム、或いは圧縮や符号化などの処理を行った音声ストリームを、エージェントサーバ200に送信する。エージェント機能部150は、ローカル処理(エージェントサーバ200を介さない処理)が可能な音声コマンドを認識した場合は、音声コマンドで要求された処理を行ってよい。ローカル処理が可能な音声コマンドとは、エージェント装置100が備える記憶部(不図示)を参照することで回答可能な音声コマンドであったり、エージェント機能部150−1の場合は車両機器50を制御する音声コマンド(例えば、空調装置をオンにするコマンドなど)であったりする。従って、エージェント機能部150は、エージェントサーバ200が備える機能の一部を有してもよい。 In the agent device 100, the agent function unit 150 transmits a voice stream or a voice stream that has undergone processing such as compression or coding to the agent server 200. When the agent function unit 150 recognizes a voice command capable of local processing (processing that does not go through the agent server 200), the agent function unit 150 may perform the processing requested by the voice command. The voice command capable of local processing is a voice command that can be answered by referring to a storage unit (not shown) included in the agent device 100, or in the case of the agent function unit 150-1, the vehicle device 50 is controlled. It may be a voice command (for example, a command to turn on the air conditioner). Therefore, the agent function unit 150 may have a part of the functions provided in the agent server 200.

音声ストリームを取得すると、音声認識部220が音声認識を行ってテキスト化された文字情報を出力し、自然言語処理部222が文字情報に対して辞書DB254を参照しながら意味解釈を行う。辞書DB254は、文字情報に対して抽象化された意味情報が対応付けられたものである。辞書DB254は、同義語や類義語の一覧情報を含んでもよい。音声認識部220の処理と、自然言語処理部222の処理は、段階が明確に分かれるものではなく、自然言語処理部222の処理結果を受けて音声認識部220が認識結果を修正するなど、相互に影響し合って行われてよい。 When the voice stream is acquired, the voice recognition unit 220 performs voice recognition and outputs textual character information, and the natural language processing unit 222 interprets the character information with reference to the dictionary DB 254. The dictionary DB 254 is associated with abstract semantic information with respect to character information. The dictionary DB 254 may include list information of synonyms and synonyms. The processing of the voice recognition unit 220 and the processing of the natural language processing unit 222 are not clearly separated in stages, and the voice recognition unit 220 corrects the recognition result in response to the processing result of the natural language processing unit 222. It may be done by influencing each other.

自然言語処理部222は、例えば、認識結果として、「今日の天気は」、「天気はどうですか」等の意味が認識された場合、標準文字情報「今日の天気」に置き換えたコマンドを生成する。これにより、リクエストの音声に文字揺らぎがあった場合にも要求にあった対話をし易くすることができる。また、自然言語処理部222は、例えば、確率を利用した機械学習処理等の人工知能処理を用いて文字情報の意味を認識したり、認識結果に基づくコマンドを生成してもよい。 For example, when the natural language processing unit 222 recognizes the meanings such as "today's weather" and "how is the weather" as the recognition result, the natural language processing unit 222 generates a command replaced with the standard character information "today's weather". As a result, even if there is a character fluctuation in the voice of the request, it is possible to facilitate the dialogue according to the request. Further, the natural language processing unit 222 may recognize the meaning of character information by using artificial intelligence processing such as machine learning processing using probability, or may generate a command based on the recognition result.

対話管理部224は、自然言語処理部222の処理結果(コマンド)に基づいて、パーソナルプロファイル252や知識ベースDB256、応答規則DB258を参照しながら車両Mの乗員に対する発話の内容を決定する。パーソナルプロファイル252は、乗員ごとに保存されている乗員の個人情報、趣味嗜好、過去の対話の履歴などを含む。知識ベースDB256は、物事の関係性を規定した情報である。応答規則DB258は、コマンドに対してエージェントが行うべき動作(回答や機器制御の内容など)を規定した情報である。 The dialogue management unit 224 determines the content of the utterance to the occupant of the vehicle M based on the processing result (command) of the natural language processing unit 222 with reference to the personal profile 252, the knowledge base DB 256, and the response rule DB 258. The personal profile 252 includes the personal information of the occupants, hobbies and preferences, the history of past dialogues, etc. stored for each occupant. The knowledge base DB 256 is information that defines the relationships between things. The response rule DB 258 is information that defines the actions (answers, device control contents, etc.) that the agent should perform in response to the command.

また、対話管理部224は、音声ストリームから得られる特徴情報を用いて、パーソナルプロファイル252と照合を行うことで、乗員を特定してもよい。この場合、パーソナルプロファイル252には、例えば、音声の特徴情報に、個人情報が対応付けられている。音声の特徴情報とは、例えば、声の高さ、イントネーション、リズム(音の高低のパターン)等の喋り方の特徴や、メル周波数ケプストラム係数(Mel Frequency Cepstrum Coefficients)等による特徴量に関する情報である。音声の特徴情報は、例えば、乗員の初期登録時に所定の単語や文章等を乗員に発声させ、発声させた音声を認識することで得られる情報である。 Further, the dialogue management unit 224 may identify the occupant by collating with the personal profile 252 using the feature information obtained from the voice stream. In this case, in the personal profile 252, for example, personal information is associated with voice feature information. The voice feature information is, for example, information on the characteristics of how to speak such as voice pitch, intonation, and rhythm (sound pitch pattern), and the feature amount based on the Mel Frequency Cepstrum Coefficients. .. The voice feature information is, for example, information obtained by having the occupant utter a predetermined word or sentence at the time of initial registration of the occupant and recognizing the uttered voice.

対話管理部224は、コマンドが、ネットワークNWを介して検索可能な情報を要求するものである場合、ネットワーク検索部226に検索を行わせる。ネットワーク検索部226は、ネットワークNWを介して各種ウェブサーバ300にアクセスし、所望の情報を取得する。「ネットワークNWを介して検索可能な情報」とは、例えば、車両Mの周辺にあるレストランの一般ユーザによる評価結果であったり、その日の車両Mの位置に応じた天気予報であったりする。 The dialogue management unit 224 causes the network search unit 226 to perform a search when the command requests information that can be searched via the network NW. The network search unit 226 accesses various web servers 300 via the network NW and acquires desired information. The "information searchable via the network NW" may be, for example, an evaluation result by a general user of a restaurant in the vicinity of the vehicle M, or a weather forecast according to the position of the vehicle M on that day.

応答文生成部228は、対話管理部224により決定された発話の内容が車両Mの乗員に伝わるように、応答文を生成し、エージェント装置100に送信する。応答文生成部228は、乗員がパーソナルプロファイルに登録された乗員であることが特定されている場合に、乗員の名前を呼んだり、乗員の話し方に似せた話し方にした応答文を生成してもよい。 The response sentence generation unit 228 generates a response sentence and transmits it to the agent device 100 so that the content of the utterance determined by the dialogue management unit 224 is transmitted to the occupant of the vehicle M. The response sentence generation unit 228 may call the occupant's name or generate a response sentence that resembles the occupant's speech when the occupant is identified as a registered occupant in the personal profile. Good.

エージェント機能部150は、応答文を取得すると、音声合成を行って音声を出力するように音声制御部118に指示する。また、エージェント機能部150は、音声出力に合わせてエージェントの画像を表示するように表示制御部116に指示する。このようにして、仮想的に出現したエージェントが車両Mの乗員に応答するエージェント機能が実現される。 When the agent function unit 150 acquires the response sentence, the agent function unit 150 instructs the voice control unit 118 to perform voice synthesis and output the voice. Further, the agent function unit 150 instructs the display control unit 116 to display the image of the agent in accordance with the audio output. In this way, the agent function in which the virtually appearing agent responds to the occupant of the vehicle M is realized.

[エージェント機能部の制限について]
次に、制限管理部120は、指示受付部119がエージェントの一部制限指示を受け付けた場合、エージェント機能部150が有する一部の機能を制限する。以下、図6〜9を参照して、エージェント機能部150が有する一部の機能を制限する処理の一例について説明する。
[Restrictions on agent functions]
Next, when the instruction receiving unit 119 receives a partial restriction instruction of the agent, the restriction management unit 120 limits some functions of the agent function unit 150. Hereinafter, an example of processing for limiting some functions of the agent function unit 150 will be described with reference to FIGS. 6 to 9.

まず、図6を参照して、エージェント機能部150が有する一部の機能が制限されていない例について説明する。図6は、エージェント機能部150が有する一部の機能が制限されていない状態の処理例について説明するための参考図である。管理部110は、マイク10から入力した音等(車内音声)を、エージェント機能部150に出力する。エージェント機能部150は、単独で(あるいは、エージェントサーバ200と協働して)、例えば、入力した車内音声に基づいて乗員の発話に応答する音声を生成して、生成した音声をスピーカユニット30から出力させる。また、エージェント機能部150は、例えば、入力した車内音声(あるいは、生成した乗員の発話に応答する音声)のテキストデータを、エージェントサーバ200にアップロードする。 First, with reference to FIG. 6, an example in which some functions of the agent function unit 150 are not restricted will be described. FIG. 6 is a reference diagram for explaining a processing example in a state in which some functions of the agent function unit 150 are not restricted. The management unit 110 outputs the sound or the like (in-vehicle voice) input from the microphone 10 to the agent function unit 150. The agent function unit 150 alone (or in cooperation with the agent server 200) generates, for example, a voice that responds to the occupant's utterance based on the input in-vehicle voice, and generates the generated voice from the speaker unit 30. Output. Further, the agent function unit 150 uploads, for example, the text data of the input in-vehicle voice (or the generated voice that responds to the utterance of the occupant) to the agent server 200.

次に、図7〜9を参照して、エージェント機能部150が有する一部の機能が制限されている例について説明する。以下、エージェント機能部150の一部の機能が制限される例として、制限管理部120がエージェント機能部150の一部の機能を制限する例について主に説明するが、これに限られない。例えば、エージェント機能部150が一部の機能を自ら制限するものであってもよい。 Next, an example in which some functions of the agent function unit 150 are restricted will be described with reference to FIGS. 7 to 9. Hereinafter, as an example in which some functions of the agent function unit 150 are restricted, an example in which the restriction management unit 120 restricts a part of the functions of the agent function unit 150 will be mainly described, but the present invention is not limited to this. For example, the agent function unit 150 may limit some functions by itself.

図7は、エージェント機能部150が有する「音声に対する応答機能」が制限されている状態の処理例について説明するための参考図である。ここでは、「音声に対する応答機能」に含まれる「音声入力の機能」が制限される例について説明する。例えば、制限管理部120は、エージェント機能部150への音声入力を停止することで、「音声入力の機能」を制限する。例えば、制限管理部120は、マイク10から入力された音(車内音声)を破棄すること、エージェント機能部150に対して音声を出力する機能を停止すること等で、「音声入力の機能」を制限する。一方、エージェント機能部150が一部の機能を自ら制限するものである場合、エージェント機能部150は、管理部110から音声を入力する機能を停止すること、管理部110から入力する車内音声を破棄すること等で、「音声入力の機能」を制限してもよい。 FIG. 7 is a reference diagram for explaining a processing example in a state in which the “voice response function” of the agent function unit 150 is limited. Here, an example in which the "voice input function" included in the "voice response function" is limited will be described. For example, the restriction management unit 120 limits the "voice input function" by stopping the voice input to the agent function unit 150. For example, the restriction management unit 120 cancels the sound input from the microphone 10 (voice in the vehicle), stops the function of outputting the voice to the agent function unit 150, and the like, thereby performing the "voice input function". Restrict. On the other hand, when the agent function unit 150 limits some functions by itself, the agent function unit 150 stops the function of inputting voice from the management unit 110 and discards the in-vehicle voice input from the management unit 110. By doing so, the "voice input function" may be restricted.

図8は、エージェント機能部150が有する「音声に対する応答機能」が制限されている状態の他の処理例について説明するための参考図である。ここでは、「音声に対する応答機能」に含まれる「発話機能」が制限される例について説明する。例えば、制限管理部120は、乗員の発話に対する応答の音声出力が停止されることで、「発話機能」を制限してもよい。例えば、制限管理部120は、エージェント機能部150に対して乗員の発話に対する応答をしないように指示すること(応答機能の停止を指示すること)、エージェント機能部150に対して発話しないように指示すること(発話機能の停止を指示すること)等で、「発話機能」を制限してもよい。一方、エージェント機能部150が一部の機能を自ら制限するものである場合、エージェント機能部150は、管理部110から車内音声が入力された場合であっても入力された車内音声に対する応答を作成しないこと、スピーカユニット30を用いた何らかの応答の出力を停止すること等で、「発話機能」を制限してもよい。 FIG. 8 is a reference diagram for explaining another processing example in a state in which the “voice response function” of the agent function unit 150 is limited. Here, an example in which the "speech function" included in the "speech response function" is restricted will be described. For example, the restriction management unit 120 may limit the "utterance function" by stopping the voice output of the response to the utterance of the occupant. For example, the restriction management unit 120 instructs the agent function unit 150 not to respond to the occupant's utterance (instructs the agent function unit 150 to stop the response function), and instructs the agent function unit 150 not to speak. The "speech function" may be restricted by doing (instructing the stop of the utterance function) or the like. On the other hand, when the agent function unit 150 limits some functions by itself, the agent function unit 150 creates a response to the input in-vehicle voice even when the in-vehicle voice is input from the management unit 110. The "speech function" may be restricted by not doing so or by stopping the output of some response using the speaker unit 30.

図9は、エージェント機能部150が有する「アップロード機能」が制限されている状態の処理例について説明するための参考図である。例えば、制限管理部120は、エージェントサーバ200へのアップロードを停止することで、エージェント機能部150が有する「アップロード機能」を制限してもよい。例えば、エージェント機能部150に対して車内音声を出力する機能を停止すること、車載通信装置60を介してエージェントサーバ200へ車内音声を送信する機能(アップロード機能)を停止するようにエージェント機能部150に指示すること等で、「アップロード機能」を制限してもよい。一方、エージェント機能部150が一部の機能を自ら制限するものである場合、エージェント機能部150は、管理部110から入力した車内音声をエージェントサーバ200にアップロードしないこと、管理部110から入力した車内音声に対する応答をエージェントサーバ200にアップロードしないこと等で、「アップロード機能」を制限してもよい。 FIG. 9 is a reference diagram for explaining a processing example in a state in which the “upload function” of the agent function unit 150 is restricted. For example, the restriction management unit 120 may limit the "upload function" of the agent function unit 150 by stopping the upload to the agent server 200. For example, the agent function unit 150 stops the function of outputting the in-vehicle voice to the agent function unit 150 and stops the function (upload function) of transmitting the in-vehicle voice to the agent server 200 via the in-vehicle communication device 60. The "upload function" may be restricted by instructing. On the other hand, when the agent function unit 150 limits some functions by itself, the agent function unit 150 does not upload the in-vehicle voice input from the management unit 110 to the agent server 200, and the in-vehicle voice input from the management unit 110. The "upload function" may be restricted by not uploading the response to the voice to the agent server 200 or the like.

なお、エージェント機能部150が起動している状態で、指示受付部119が一部制限指示を受け付けた場合、エージェント機能部が有する「音声入力の機能」、「発話機能」、および「アップロードの機能」が、所定の順番で段階的に制限されてもよい。この所定の順番は、任意に設定可能であり、例えば、乗員により予め設定されている。例えば、制限管理部120(あるいは、エージェント機能部150)は、ミュートボタン27が最初に押された場合、順番が1番の機能を制限し、順番が1番の機能を制限している状態でミュートボタン27が押された場合、順番が2番の機能を制限し、順番が2番の機能を制限している状態でミュートボタン27が押された場合、順番が3番の機能を制限してもよい。 If the instruction receiving unit 119 receives a partial restriction instruction while the agent function unit 150 is activated, the agent function unit has a "voice input function", an "utterance function", and an "upload function". ", May be restricted stepwise in a predetermined order. This predetermined order can be arbitrarily set, and is preset by, for example, the occupant. For example, when the mute button 27 is pressed first, the restriction management unit 120 (or the agent function unit 150) restricts the function having the first order and restricts the function having the first order. When the mute button 27 is pressed, the function of the second order is restricted, and when the mute button 27 is pressed while the function of the second order is restricted, the function of the third order is restricted. You may.

また、エージェント機能部150が起動している状態で、指示受付部119が一部制限指示を受け付けた場合、エージェント機能部が有する「音声入力の機能」、「発話機能」、および「アップロードの機能」のうちいずれか一つを制限してもよく、一度に全ての機能を制限してもよい。 Further, when the instruction receiving unit 119 receives a partial restriction instruction while the agent function unit 150 is activated, the agent function unit has a "voice input function", an "utterance function", and an "upload function". You may limit any one of them, or you may limit all the functions at once.

また、指示受付部119は、受け付けた指示が、エージェント機能部が有する「音声入力の機能」、「発話機能」、および「アップロードの機能」のうちいずれかを制限する指示であるかを判定し、指示された機能の制限を、制限管理部120あるいはエージェント機能部150に通知してもよい。例えば、指示受付部119は、ミュートボタン27が押された回数や押されている時間長に応じて、指定された機能を判定してもよく、音声認識された車内音声の意味が示す機能が指示された機能であると判定してもよい。後者の場合、例えば、「音声入力を制限」、「エージェント、耳を塞いで」という場合、指示受付部119は、音声入力の機能の制限が指示されたと判定する。 Further, the instruction receiving unit 119 determines whether the received instruction is an instruction that limits any of the "voice input function", the "utterance function", and the "upload function" of the agent function unit. , The restriction of the instructed function may be notified to the restriction management unit 120 or the agent function unit 150. For example, the instruction receiving unit 119 may determine the specified function according to the number of times the mute button 27 is pressed and the length of time that the mute button 27 is pressed, and the function indicated by the meaning of the voice-recognized in-vehicle voice may be determined. It may be determined that the function is instructed. In the latter case, for example, in the case of "restrict voice input" or "agent, close ears", the instruction receiving unit 119 determines that the restriction of the voice input function has been instructed.

[表示例]
図10は、エージェント機能部150の一部機能が制限されていない状態におけるエージェント画像の一例を示す図である。画面301には、エージェントのアイコン311と、マイクのアイコン312とが表示されている。エージェントのアイコン311は、例えば、エージェントが周囲の音声を聞いていることを表す画像である。マイクのアイコン312は、マイクがオンになっていることを表す画像である。エージェントのアイコンやマイクのアイコンは、静止画像であってもよく、動くアニメーションであってもよい。
[Display example]
FIG. 10 is a diagram showing an example of an agent image in a state where some functions of the agent function unit 150 are not restricted. The agent icon 311 and the microphone icon 312 are displayed on the screen 301. The agent icon 311 is, for example, an image showing that the agent is listening to surrounding sounds. The microphone icon 312 is an image indicating that the microphone is on. The agent icon and microphone icon may be a still image or a moving animation.

図11は、エージェント機能部150の一部機能が制限されている状態におけるエージェント画像の一例を示す図である。画面303には、エージェントのアイコン331と、マイクのアイコン332とが表示されている。エージェントのアイコン331は、例えば、エージェントが耳を塞いでおり、周囲の音声が聞こえていないことを表す画像である。マイクのアイコン332は、マイクがオフになっていることを表す画像である。 FIG. 11 is a diagram showing an example of an agent image in a state where some functions of the agent function unit 150 are restricted. The agent icon 331 and the microphone icon 332 are displayed on the screen 303. The agent icon 331 is, for example, an image showing that the agent is blocking his ears and cannot hear surrounding sounds. The microphone icon 332 is an image indicating that the microphone is turned off.

表示制御部116は、エージェント機能部150の一部機能が制限されていない状態において、画面301を第1ディスプレイ22等に表示させる。一方、エージェント機能部150の一部機能が制限されている状態において、表示制御部116は、画面303を第1ディスプレイ22等に表示させる。このように、エージェント機能部150の一部機能が制限されているかどうかに応じて、エージェント画像の表示を切り替えることにより、乗員はエージェント機能部150の一部機能の制限状態を簡単に認識することができる。 The display control unit 116 displays the screen 301 on the first display 22 or the like in a state where some functions of the agent function unit 150 are not restricted. On the other hand, in a state where some functions of the agent function unit 150 are restricted, the display control unit 116 causes the screen 303 to be displayed on the first display 22 or the like. In this way, by switching the display of the agent image according to whether or not some functions of the agent function unit 150 are restricted, the occupant can easily recognize the restricted state of some functions of the agent function unit 150. Can be done.

[フローチャート]
図12は、エージェント装置100による制限処理の一例を示すフローチャートである。ここでは、制限管理部120が、エージェント機能部150が有する一部の機能を制限する例について説明し、エージェント機能部150が一部の機能を自ら制限する処理の説明は省略する。
[flowchart]
FIG. 12 is a flowchart showing an example of restriction processing by the agent device 100. Here, an example in which the restriction management unit 120 limits some functions of the agent function unit 150 will be described, and the description of the process in which the agent function unit 150 limits some functions by itself will be omitted.

まず、エージェントごとWU判定部114(あるいは、エージェントサーバ200からの指示)によって、対応するエージェント機能部150が起動される(ステップS101)。この状態で、一部制限指示があった場合(ステップS102)、制限管理部120は、受け付けた一部制限指示が、音声入力の機能の制限であるか否かを判定する(ステップS103)。音声入力の機能の制限が指示された場合、制限管理部120は、例えば、エージェント機能部150への音声入力を停止する(ステップS104)。 First, the corresponding agent function unit 150 is activated by the WU determination unit 114 (or an instruction from the agent server 200) for each agent (step S101). In this state, when a partial restriction instruction is given (step S102), the restriction management unit 120 determines whether or not the received partial restriction instruction is a limitation of the voice input function (step S103). When the restriction of the voice input function is instructed, the restriction management unit 120 stops the voice input to the agent function unit 150, for example (step S104).

一方、受け付けた一部制限指示が、音声入力の機能の制限でない場合、制限管理部120は、受け付けた一部制限指示が、発話機能の制限であるか否かを判定する(ステップS105)。発話機能の制限が指示された場合、制限管理部120は、例えば、エージェント機能部150に対して応答しないように指示する(ステップS106)。 On the other hand, when the received partial restriction instruction is not a restriction of the voice input function, the restriction management unit 120 determines whether or not the received partial restriction instruction is a restriction of the utterance function (step S105). When the restriction of the utterance function is instructed, the restriction management unit 120 instructs, for example, the agent function unit 150 not to respond (step S106).

一方、受け付けた一部制限指示が、発話機能の制限でない場合、制限管理部120は、受け付けた一部制限指示が、アップロード機能の制限であるか否かを判定する(ステップS107)。アップロード機能の制限が指示された場合、制限管理部120は、例えば、エージェント機能部150に対してアップロード機能を停止するように指示する(ステップS108)。 On the other hand, when the received partial restriction instruction is not the restriction of the utterance function, the restriction management unit 120 determines whether or not the received partial restriction instruction is a restriction of the upload function (step S107). When the restriction of the upload function is instructed, the restriction management unit 120 instructs, for example, the agent function unit 150 to stop the upload function (step S108).

一方、受け付けた一部制限指示が、アップロード機能の制限でない場合、制限管理部120は、受け付けた一部制限指示が、音声入力の機能、発話機能、およびアップロード機能の全ての機能の制限であるか否かを判定する(ステップS109)。全ての機能の制限が指示された場合、制限管理部120は、エージェント機能部150への音声入力を停止し、エージェント機能部150に対して応答しないように指示するとともに、エージェント機能部150に対してアップロード機能を停止するように指示する(ステップS110)。 On the other hand, when the received partial restriction instruction is not the restriction of the upload function, the restriction management unit 120 limits the received partial restriction instruction to all the functions of the voice input function, the utterance function, and the upload function. Whether or not it is determined (step S109). When the restriction of all functions is instructed, the restriction management unit 120 stops the voice input to the agent function unit 150, instructs the agent function unit 150 not to respond, and instructs the agent function unit 150 not to respond. And instruct to stop the upload function (step S110).

図13は、エージェント装置100によるタイムアウト処理の一例を示すフローチャートである。ここでは、制限管理部120が、エージェント機能部150が有する一部の機能を制限する例について説明し、エージェント機能部150が一部の機能を自ら制限する処理の説明は省略する。 FIG. 13 is a flowchart showing an example of time-out processing by the agent device 100. Here, an example in which the restriction management unit 120 limits some functions of the agent function unit 150 will be described, and the description of the process in which the agent function unit 150 limits some functions by itself will be omitted.

まず、エージェントごとWU判定部114は、ウエイクアップワードが発話されたかどうかを判定する(ステップS201)。ウエイクアップワードが発話された場合、エージェントごとWU判定部114は、対応するエージェント機能部150を起動させる(ステップS202)。そして、タイムアウト管理部122は、タイムアウトタイマーによるタイムアウト時間のカウントを開始する(ステップS203)。 First, the WU determination unit 114 for each agent determines whether or not the wakeup word has been spoken (step S201). When the wakeup word is spoken, the WU determination unit 114 for each agent activates the corresponding agent function unit 150 (step S202). Then, the time-out management unit 122 starts counting the time-out time by the time-out timer (step S203).

次いで、エージェント機能部150は、乗員による発話があったか否かを判定する(ステップS204)。乗員による発話があった場合、エージェント機能部150は、乗員の発話に応じたサービスを提供する(ステップS205)。そして、タイムアウト管理部122は、タイムアウトタイマーによるカウントをリセットし、再びタイムアウト時間のカウントを開始する(ステップS206)。 Next, the agent function unit 150 determines whether or not there has been an utterance by the occupant (step S204). When there is an utterance by the occupant, the agent function unit 150 provides a service according to the utterance of the occupant (step S205). Then, the timeout management unit 122 resets the count by the timeout timer and starts counting the timeout time again (step S206).

一方、ステップS204において、乗員による発話がない場合、タイムアウト管理部122は、指示受付部119が一部制限指示を受け付けたか否かを判定する(ステップS207)。指示受付部119が一部制限指示を受け付けた場合、タイムアウト管理部122は、タイムアウトタイマーによるカウントを停止(あるいはリセット)する(ステップS208)。そして、タイムアウト管理部122は、解除指示を受け付けたと判定するまで、指示受付部119が一部制限の解除指示を受け付けたどうかを判定する(ステップS209)。一部制限の解除指示を受け付けた場合、ステップS206に移行し、タイムアウト管理部122は、タイムアウトタイマーによるカウントをリセットし、再びタイムアウト時間のカウントを開始する(ステップS206)。 On the other hand, in step S204, when there is no utterance by the occupant, the time-out management unit 122 determines whether or not the instruction receiving unit 119 has received the partial restriction instruction (step S207). When the instruction receiving unit 119 receives a partial restriction instruction, the timeout management unit 122 stops (or resets) the counting by the timeout timer (step S208). Then, the time-out management unit 122 determines whether or not the instruction receiving unit 119 has received the partial restriction release instruction until it is determined that the release instruction has been accepted (step S209). When the instruction to release the partial restriction is received, the process proceeds to step S206, the timeout management unit 122 resets the count by the timeout timer, and starts counting the timeout time again (step S206).

一方、ステップS207において、指示受付部119が一部制限指示を受け付けない場合、タイムアウト管理部122は、タイムアウトタイマーによりカウントを開始(あるいは再開)してからの時間が、タイムアウト時間を超えたか否か判定する(ステップS210)。タイムアウト時間を超えない場合、タイムアウト管理部122は、ステップS204に戻って処理を繰り返す。タイムアウト時間を超えた場合、エージェントごとWU判定部114は、起動中のエージェント機能部150を停止させる(ステップS211)。 On the other hand, in step S207, when the instruction receiving unit 119 does not accept a partial restriction instruction, whether or not the time after the time-out management unit 122 starts (or restarts) counting by the timeout timer exceeds the timeout time. Determine (step S210). If the time-out time is not exceeded, the time-out management unit 122 returns to step S204 and repeats the process. When the time-out time is exceeded, the WU determination unit 114 for each agent stops the activated agent function unit 150 (step S211).

上記説明した第1実施形態のエージェント装置100によれば、エージェント機能をより使いやすいものに改善されたエージェント機能を提供することができる。 According to the agent device 100 of the first embodiment described above, it is possible to provide an improved agent function that makes the agent function easier to use.

以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。 Although the embodiments for carrying out the present invention have been described above using the embodiments, the present invention is not limited to these embodiments, and various modifications and substitutions are made without departing from the gist of the present invention. Can be added.

10 マイク
20 表示・操作装置
30 スピーカユニット
40 ナビゲーション装置
50 車両機器
60 車載通信装置
70 汎用通信装置
80 乗員認識装置
100 エージェント装置
110 管理部
112 音響処理部
114 エージェントごとWU判定部
116 表示制御部
118 音声制御部
119 指示受付部
120 制限管理部
122 タイムアウト管理部
150 エージェント機能部
152 ペアリングアプリ実行部
200 エージェントサーバ
10 Microphone 20 Display / operation device 30 Speaker unit 40 Navigation device 50 Vehicle equipment 60 In-vehicle communication device 70 General-purpose communication device 80 Crew recognition device 100 Agent device 110 Management unit 112 Sound processing unit 114 WU judgment unit 116 Display control unit 118 for each agent Control unit 119 Instruction reception unit 120 Restriction management unit 122 Timeout management unit 150 Agent function unit 152 Pairing application execution unit 200 Agent server

Claims (12)

車両の乗員の発話に応じて、音声による応答を含むサービスを提供するエージェント機能部と、
前記乗員による指示を受け付ける受付部と、を備え、
前記受付部が所定の指示を受け付けた場合、前記エージェント機能部が有する一部の機能が制限される、
エージェント装置。
An agent function unit that provides services including voice responses in response to the utterances of vehicle occupants,
It is equipped with a reception section that receives instructions from the occupants.
When the reception unit receives a predetermined instruction, some functions of the agent function unit are restricted.
Agent device.
前記エージェント機能部が有する一部の機能を制限する制限管理部をさらに備える、
請求項1に記載のエージェント装置。
A restriction management unit that limits some functions of the agent function unit is further provided.
The agent device according to claim 1.
前記エージェント機能部は、
前記受付部が前記所定の指示を受け付けた場合、前記一部の機能を自ら制限する、
請求項1に記載のエージェント装置。
The agent function unit
When the reception unit receives the predetermined instruction, it limits some of the functions by itself.
The agent device according to claim 1.
前記受付部が前記所定の指示を受け付けた場合、前記エージェント機能部への音声入力が停止されることで、前記エージェント機能部が有する音声に対する応答機能が制限される、
請求項1から3のうちいずれか一項に記載のエージェント装置。
When the reception unit receives the predetermined instruction, the voice input to the agent function unit is stopped, so that the voice response function of the agent function unit is limited.
The agent device according to any one of claims 1 to 3.
前記受付部が前記所定の指示を受け付けた場合、前記エージェント機能部と協働してエージェントを仮想的に出現させるエージェントサーバへのアップロードが停止されることで、前記一部の機能が制限される、
請求項1から4のうちいずれか一項に記載のエージェント装置。
When the reception unit receives the predetermined instruction, the upload to the agent server that virtually causes the agent to appear in cooperation with the agent function unit is stopped, so that some of the functions are restricted. ,
The agent device according to any one of claims 1 to 4.
前記受付部が前記所定の指示を受け付けた場合、前記乗員の発話に対する応答の音声出力が停止されることで、前記エージェント機能部が有する音声に対する応答機能が制限される、
請求項1から5のうちいずれか一項に記載のエージェント装置。
When the reception unit receives the predetermined instruction, the voice output of the response to the utterance of the occupant is stopped, so that the voice response function of the agent function unit is limited.
The agent device according to any one of claims 1 to 5.
前記エージェント機能部は、
前記エージェント機能部が有する一部の機能が制限された場合、起動状態を継続する、
請求項1から6のうちいずれか一項に記載のエージェント装置。
The agent function unit
When some functions of the agent function unit are restricted, the activated state is continued.
The agent device according to any one of claims 1 to 6.
前記受付部は、
前記乗員による操作を受け付けるスイッチからの出力に基づいて、前記所定の指示を受け付ける、
請求項1から7のうちいずれか一項に記載のエージェント装置。
The reception department
The predetermined instruction is received based on the output from the switch that accepts the operation by the occupant.
The agent device according to any one of claims 1 to 7.
前記受付部は、
音声認識の技術を用いて、前記乗員の発話による前記所定の指示を受け付ける、
請求項1から8のうちいずれか一項に記載のエージェント装置。
The reception department
Using the technique of voice recognition, the predetermined instruction by the utterance of the occupant is accepted.
The agent device according to any one of claims 1 to 8.
前記エージェント機能部が起動している状態で、前記受付部が前記所定の指示を受け付けた場合、
前記エージェント機能部が有する音声入力の機能、前記エージェント機能部が有する発話機能、および前記エージェント機能部が有するサーバへのアップロードの機能が、所定の順番で段階的に制限される、
請求項1から9のうちいずれか一項に記載のエージェント装置。
When the reception unit receives the predetermined instruction while the agent function unit is activated,
The voice input function of the agent function unit, the utterance function of the agent function unit, and the upload function of the agent function unit to the server are gradually restricted in a predetermined order.
The agent device according to any one of claims 1 to 9.
コンピュータが、
車両の乗員の発話に応じて、音声による応答を含むエージェントによるサービスを提供し、
前記乗員による所定の指示を受け付けた場合、前記エージェントが有する一部の機能を制限する、
エージェント装置の制御方法。
The computer
Providing services by agents, including voice responses, in response to vehicle occupants' utterances,
When a predetermined instruction by the occupant is received, some functions of the agent are restricted.
How to control the agent device.
コンピュータに、
車両の乗員の発話に応じて、音声による応答を含むエージェントによるサービスを提供する処理と、
前記乗員による指示を受け付ける処理と、
所定の指示を受け付けた場合、前記エージェントが有する一部の機能を制限する処理と、
を実行させるプログラム。
On the computer
Processing to provide services by agents, including voice responses, in response to vehicle occupants' utterances,
The process of accepting instructions from the occupants and
When a predetermined instruction is received, a process of limiting some functions of the agent and a process of limiting some functions
A program that executes.
JP2019041639A 2019-03-07 2019-03-07 Agent device, control method of agent device, and program Pending JP2020144264A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019041639A JP2020144264A (en) 2019-03-07 2019-03-07 Agent device, control method of agent device, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019041639A JP2020144264A (en) 2019-03-07 2019-03-07 Agent device, control method of agent device, and program

Publications (1)

Publication Number Publication Date
JP2020144264A true JP2020144264A (en) 2020-09-10

Family

ID=72355564

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019041639A Pending JP2020144264A (en) 2019-03-07 2019-03-07 Agent device, control method of agent device, and program

Country Status (1)

Country Link
JP (1) JP2020144264A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112634887A (en) * 2020-12-08 2021-04-09 北京梧桐车联科技有限责任公司 Voice mode control method, device and system
KR102539191B1 (en) * 2022-08-05 2023-06-02 주식회사 실비아헬스 Cognitive state information providing method and electronic device for the same

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112634887A (en) * 2020-12-08 2021-04-09 北京梧桐车联科技有限责任公司 Voice mode control method, device and system
CN112634887B (en) * 2020-12-08 2024-01-23 北京梧桐车联科技有限责任公司 Voice mode control method, device and system
KR102539191B1 (en) * 2022-08-05 2023-06-02 주식회사 실비아헬스 Cognitive state information providing method and electronic device for the same
WO2024029800A1 (en) * 2022-08-05 2024-02-08 주식회사 실비아헬스 Method for providing cognitive state information and electronic device therefor

Similar Documents

Publication Publication Date Title
JP2020144663A (en) Agent device, control method of agent device, and program
JP7239366B2 (en) AGENT DEVICE, CONTROL METHOD OF AGENT DEVICE, AND PROGRAM
JP2020144260A (en) Vehicle agent system, control method of vehicle agent system, and program
JP2020144264A (en) Agent device, control method of agent device, and program
US20200317055A1 (en) Agent device, agent device control method, and storage medium
JP2020131805A (en) Agent device, control method of agent device, and program
JP2020160135A (en) Agent device, agent device control method and program
JP2020144274A (en) Agent device, control method of agent device, and program
JP2020144081A (en) Agent device, control method of agent device, and program
US11797261B2 (en) On-vehicle device, method of controlling on-vehicle device, and storage medium
JP7175221B2 (en) AGENT DEVICE, CONTROL METHOD OF AGENT DEVICE, AND PROGRAM
JP7340943B2 (en) Agent device, agent device control method, and program
US11542744B2 (en) Agent device, agent device control method, and storage medium
JP2020152298A (en) Agent device, control method of agent device, and program
JP2020160133A (en) Agent system, agent system control method, and program
JP2020157853A (en) In-vehicle agent system, control method of in-vehicle agent system, and program
JP2020142758A (en) Agent device, method of controlling agent device, and program
JP2020144712A (en) Agent device, control method of agent device, and program
JP2020154942A (en) Agent device, control method of agent device, and program
JP2020142721A (en) Agent system, on-vehicle equipment control method, and program
JP2020148583A (en) Agent device, method for controlling agent device, and program
JP2020160848A (en) Server apparatus, information providing system, information providing method, and program
JP2020154994A (en) Agent system, agent server, control method of agent server, and program
US11518399B2 (en) Agent device, agent system, method for controlling agent device, and storage medium
CN111559317B (en) Agent device, method for controlling agent device, and storage medium