WO2023073856A1 - 音声出力装置、音声出力方法、プログラム及び記憶媒体 - Google Patents

音声出力装置、音声出力方法、プログラム及び記憶媒体 Download PDF

Info

Publication number
WO2023073856A1
WO2023073856A1 PCT/JP2021/039782 JP2021039782W WO2023073856A1 WO 2023073856 A1 WO2023073856 A1 WO 2023073856A1 JP 2021039782 W JP2021039782 W JP 2021039782W WO 2023073856 A1 WO2023073856 A1 WO 2023073856A1
Authority
WO
WIPO (PCT)
Prior art keywords
output
audio
priority
user
output device
Prior art date
Application number
PCT/JP2021/039782
Other languages
English (en)
French (fr)
Inventor
高志 飯澤
敦博 山中
敬太 倉持
敬介 栃原
壮志 中川
裕達 新井
Original Assignee
パイオニア株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by パイオニア株式会社 filed Critical パイオニア株式会社
Priority to PCT/JP2021/039782 priority Critical patent/WO2023073856A1/ja
Publication of WO2023073856A1 publication Critical patent/WO2023073856A1/ja

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60RVEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
    • B60R16/00Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for
    • B60R16/02Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • B60W50/08Interaction between the driver and the control system
    • B60W50/10Interpretation of driver requests or demands
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • B60W50/08Interaction between the driver and the control system
    • B60W50/14Means for informing the driver, warning the driver or prompting a driver intervention

Definitions

  • the present invention relates to control of audio output.
  • Patent Literature 1 discloses a vehicle audio control device that outputs audio of an application with a higher priority when audio output from a dedicated application and an external application temporally overlap.
  • the present invention has been made to solve the above problems, and is primarily to provide an audio output device capable of appropriately controlling audio output from an application using criteria set by a user. purpose.
  • an audio output device comprising an acquisition means for acquiring audio data to be output and a priority of the audio data from an application executed by the audio output device; determining means for determining whether or not to output the audio data based on the information about the output criteria set by the user and the priority; and audio output for outputting the audio data determined to be output a means;
  • the claimed invention is an audio output method, in which audio data to be output and the priority of the audio data are obtained from an application executed by an audio output device, and the priority is determined by a user. determines whether or not to output the audio data based on the information on the output criteria set by and the priority, and outputs the audio data determined to be output.
  • the claimed invention is a program, which acquires audio data to be output and the priority of the audio data from an application executed by an audio output device, and sets the priority by the user. It determines whether or not the audio data should be output based on the information regarding the output criteria and the priority, and causes the computer to execute processing for outputting the audio data determined to be output.
  • FIG. 1 is a diagram illustrating a configuration example of an audio output system according to an embodiment
  • FIG. 1 is a block diagram showing a schematic configuration of an audio output device
  • FIG. It is a block diagram which shows schematic structure of a server apparatus. 1 illustrates a configuration for controlling audio output from multiple applications; An example of an output criteria table is shown.
  • 4 is a flowchart of output control of an audio file generated by an application;
  • an audio output device comprises: acquisition means for acquiring audio data to be output and a priority of the audio data from an application executed by the audio output device; determination means for determining whether or not to output the audio data based on information about an output criterion set by the user for the degree and the priority; and audio for outputting the audio data determined to be output. and output means.
  • the acquisition means acquires the audio data to be output and the priority of the audio data from the application executed by the audio output device.
  • the judging means judges whether or not the audio data should be output based on the information about the output criteria set by the user for the priority and the priority. Then, the audio output means outputs the audio data determined to be output. This controls the output of sounds generated by multiple applications according to criteria set by the user.
  • the output criteria are set by the user's mode selection.
  • the audio output device is mounted on a mobile body, and the output criteria are set in relation to the priority and the safety or comfort level of the mobile body.
  • Another aspect of the above audio output device includes determination means for determining the safety level or the comfort level based on sensor data output from a sensor, and the determination means determines the priority and the safety It is determined whether the audio data should be output based on the degree of comfort or the degree of comfort.
  • an audio output method acquires audio data to be output and a priority of the audio data from an application executed by an audio output device, and the user determines the priority. Based on the set output criteria information and the priority, it is determined whether or not the audio data should be output, and the audio data determined to be output is output. This controls the output of sounds generated by multiple applications according to criteria set by the user.
  • the program acquires audio data to be output and the priority of the audio data from an application executed on the audio output device, and the priority is set by the user. Based on the information on the output criteria and the priority, it is determined whether or not the audio data should be output, and the computer is caused to output the audio data determined to be output.
  • This program can be stored in a storage medium and used.
  • FIG. 1 is a diagram illustrating a configuration example of an audio output system according to an embodiment.
  • a voice output system 1 according to this embodiment includes a voice output device 100 and a server device 200 .
  • the audio output device 100 is mounted on the vehicle Ve.
  • the server device 200 communicates with a plurality of audio output devices 100 mounted on a plurality of vehicles Ve.
  • the voice output device 100 basically performs route guidance processing, information provision processing, etc. for the user who is a passenger of the vehicle Ve. For example, when a destination or the like is input by the user, the voice output device 100 transmits an upload signal S1 including position information of the vehicle Ve and information on the designated destination to the server device 200 . Server device 200 calculates the route to the destination by referring to the map data, and transmits control signal S2 indicating the route to the destination to audio output device 100 . The voice output device 100 provides route guidance to the user by voice output based on the received control signal S2.
  • the voice output device 100 provides various types of information to the user through interaction with the user.
  • the audio output device 100 supplies the server device 200 with an upload signal S1 including information indicating the content or type of the information request and information about the running state of the vehicle Ve.
  • the server device 200 acquires and generates information requested by the user, and transmits it to the audio output device 100 as a control signal S2.
  • the audio output device 100 provides the received information to the user by audio output.
  • the voice output device 100 moves together with the vehicle Ve and performs route guidance mainly by voice so that the vehicle Ve travels along the guidance route.
  • route guidance based mainly on voice refers to route guidance in which the user can grasp information necessary for driving the vehicle Ve along the guidance route at least from only voice, and the voice output device 100 indicates the current position. It does not exclude the auxiliary display of a surrounding map or the like.
  • the voice output device 100 outputs at least various information related to driving, such as points on the route that require guidance (also referred to as “guidance points”), by voice.
  • the guidance point corresponds to, for example, an intersection at which the vehicle Ve turns right or left, or other passing points important for the vehicle Ve to travel along the guidance route.
  • the voice output device 100 provides voice guidance regarding guidance points such as, for example, the distance from the vehicle Ve to the next guidance point and the traveling direction at the guidance point.
  • the voice regarding the guidance for the guidance route is also referred to as "route voice guidance”.
  • the audio output device 100 is installed, for example, on the upper part of the windshield of the vehicle Ve or on the dashboard. Note that the audio output device 100 may be incorporated in the vehicle Ve.
  • FIG. 2 is a block diagram showing a schematic configuration of the audio output device 100.
  • the audio output device 100 mainly includes a communication unit 111, a storage unit 112, an input unit 113, a control unit 114, a sensor group 115, a display unit 116, a microphone 117, a speaker 118, and an exterior camera 119. and an in-vehicle camera 120 .
  • Each element in the audio output device 100 is interconnected via a bus line 110 .
  • the communication unit 111 performs data communication with the server device 200 under the control of the control unit 114 .
  • the communication unit 111 may receive, for example, map data for updating the map database 4, which will be described later, from the server device 200.
  • FIG. 1
  • the storage unit 112 is composed of various memories such as RAM (Random Access Memory), ROM (Read Only Memory), and non-volatile memory (including hard disk drive, flash memory, etc.).
  • the storage unit 112 stores a program for the audio output device 100 to execute predetermined processing.
  • the above-mentioned programs may include an application program for route voice guidance, an application program for playing music, an application program for outputting content other than music (such as television), and the like.
  • Storage unit 112 is also used as a working memory for control unit 114 . Note that the program executed by the audio output device 100 may be stored in a storage medium other than the storage unit 112 .
  • the storage unit 112 also stores a map database (hereinafter, the database is referred to as "DB") 4. Various data required for route guidance are recorded in the map DB 4 .
  • the map DB 4 stores, for example, road data representing a road network by a combination of nodes and links, and facility data indicating facilities that are candidates for destinations, stop-off points, or landmarks.
  • the map DB 4 may be updated based on the map information received by the communication section 111 from the map management server under the control of the control section 114 .
  • the input unit 113 is a button, touch panel, remote controller, etc. for user operation.
  • the display unit 116 is a display or the like that displays based on the control of the control unit 114 .
  • the microphone 117 collects sounds inside the vehicle Ve, particularly the driver's utterances.
  • a speaker 118 outputs audio for route guidance to the driver or the like.
  • the sensor group 115 includes an external sensor 121 and an internal sensor 122 .
  • the external sensor 121 is, for example, one or more sensors for recognizing the surrounding environment of the vehicle Ve, such as a lidar, radar, ultrasonic sensor, infrared sensor, and sonar.
  • the internal sensor 122 is a sensor that performs positioning of the vehicle Ve, and is, for example, a GNSS (Global Navigation Satellite System) receiver, a gyro sensor, an IMU (Inertial Measurement Unit), a vehicle speed sensor, or a combination thereof.
  • GNSS Global Navigation Satellite System
  • IMU Inertial Measurement Unit
  • vehicle speed sensor or a combination thereof.
  • the sensor group 115 may have a sensor that allows the control unit 114 to directly or indirectly derive the position of the vehicle Ve from the output of the sensor group 115 (that is, by performing estimation processing).
  • the vehicle exterior camera 119 is a camera that captures the exterior of the vehicle Ve.
  • the exterior camera 119 may be a front camera that captures the front of the vehicle, or may include a rear camera that captures the rear of the vehicle in addition to the front camera. good too.
  • the in-vehicle camera 120 is a camera for photographing the interior of the vehicle Ve, and is provided at a position capable of photographing at least the vicinity of the driver's seat.
  • the control unit 114 includes a CPU (Central Processing Unit), a GPU (Graphics Processing Unit), etc., and controls the audio output device 100 as a whole. For example, the control unit 114 estimates the position (including the traveling direction) of the vehicle Ve based on the outputs of one or more sensors in the sensor group 115 . Further, when a destination is specified by the input unit 113 or the microphone 117, the control unit 114 generates route information indicating a guidance route to the destination, Based on the position information and the map DB 4, route voice guidance is provided. In this case, the control unit 114 causes the speaker 118 to output the guidance voice. Further, the control unit 114 controls the display unit 116 to display information about the music being played, video content, a map of the vicinity of the current position, or the like.
  • a CPU Central Processing Unit
  • GPU Graphics Processing Unit
  • control unit 114 is not limited to being implemented by program-based software, and may be implemented by any combination of hardware, firmware, and software. Also, the processing executed by the control unit 114 may be implemented using a user-programmable integrated circuit such as an FPGA (field-programmable gate array) or a microcomputer. In this case, this integrated circuit may be used to implement the program executed by the control unit 114 in this embodiment. Thus, the control unit 114 may be realized by hardware other than the processor.
  • FPGA field-programmable gate array
  • the configuration of the audio output device 100 shown in FIG. 2 is an example, and various changes may be made to the configuration shown in FIG.
  • the control unit 114 may receive information necessary for route guidance from the server device 200 via the communication unit 111 .
  • the audio output device 100 is electrically connected to an audio output unit configured separately from the audio output device 100, or by a known communication means, so as to output the audio. Audio may be output from the output unit.
  • the audio output unit may be a speaker provided in the vehicle Ve.
  • the audio output device 100 does not have to include the display section 116 .
  • the audio output device 100 does not need to perform display-related control at all. Display may be executed. Similarly, instead of including the sensor group 115, the audio output device 100 may acquire information output by sensors installed in the vehicle Ve based on a communication protocol such as CAN (Controller Area Network) from the vehicle Ve. .
  • CAN Controller Area Network
  • the server device 200 generates route information indicating a guidance route that the vehicle Ve should travel based on the upload signal S1 including the destination and the like received from the voice output device 100 .
  • the server device 200 then generates a control signal S2 relating to information output in response to the user's information request based on the user's information request indicated by the upload signal S1 transmitted by the audio output device 100 and the running state of the vehicle Ve.
  • the server device 200 then transmits the generated control signal S ⁇ b>2 to the audio output device 100 .
  • the server device 200 generates content for providing information to the user of the vehicle Ve and for interacting with the user, and transmits the content to the audio output device 100 .
  • the provision of information to the user mainly includes push-type information provision that is triggered by the server device 200 when the vehicle Ve reaches a predetermined driving condition.
  • the dialog with the user is basically a pull-type dialog that starts with a question or inquiry from the user.
  • the interaction with the user may start from push-type information provision.
  • FIG. 3 is a diagram showing an example of a schematic configuration of the server device 200.
  • the server device 200 mainly has a communication section 211 , a storage section 212 and a control section 214 .
  • Each element in the server device 200 is interconnected via a bus line 210 .
  • the communication unit 211 performs data communication with an external device such as the audio output device 100 under the control of the control unit 214 .
  • the storage unit 212 is composed of various types of memory such as RAM, ROM, nonvolatile memory (including hard disk drive, flash memory, etc.).
  • Storage unit 212 stores a program for server device 200 to execute a predetermined process.
  • storage part 212 contains map DB4.
  • storage unit 212 stores a plurality of application programs that operate on server device 200 .
  • the multiple applications include, for example, a route guidance application, a user interaction application, a recommendation application that proposes recommended facilities and shops, and the like.
  • the communication unit 211 is an example of an acquisition unit and an audio output unit.
  • the control unit 214 includes a CPU, GPU, etc., and controls the server device 200 as a whole. Further, the control unit 214 operates together with the audio output device 100 by executing a program stored in the storage unit 212, and executes route guidance processing, information provision processing, and the like for the user. For example, based on the upload signal S1 received from the audio output device 100 via the communication unit 211, the control unit 214 generates route information indicating a guidance route or a control signal S2 relating to information output in response to a user's information request. Then, the control unit 214 transmits the generated control signal S2 to the audio output device 100 through the communication unit 211 . It should be noted that the control unit 214 is an example of determination means and determination means.
  • a route guidance application outputs route guidance voice at guidance points such as intersections.
  • the interactive application outputs voices, etc., in response to voices from the user.
  • the recommendation application outputs a voice that recommends facilities and shops existing around the current position of the vehicle Ve or in the planned travel area.
  • the server apparatus 200 controls audio output from a plurality of applications based on the output criteria set by the user regarding priority.
  • FIG. 4 is a block diagram showing a configuration for controlling audio output from multiple applications. As illustrated, multiple applications are running on the server device 200 .
  • the server device 200 includes a situation grasping unit 222 and an information matching unit 223 as components for controlling voice output.
  • Each application operates independently, and outputs an audio file (audio data) generated with the operation of each application to the information matching unit 223 .
  • Each application outputs the priority of the audio file to the information matching unit 223 together with the audio file.
  • Each application determines the priority of the audio file to be output based on a rule uniformly determined for all applications, and outputs it to the information matching unit 223 together with the audio file. Therefore, the information matching unit 223 receives the priority set for each audio file by each application according to the unified rule together with the audio file.
  • voices that have a large impact on the running safety of the vehicle Ve e.g., warnings, alerts, etc.
  • voices that have a small impact on running safety e.g., facilities, etc.
  • voices that have a small impact on running safety e.g., facilities, etc.
  • the sensor data transmitted from the audio output device 100 mounted on the vehicle Ve is input to the situation grasping unit 222 .
  • the sensor data is data measured by the sensor group 115 mounted on the audio output device 100, and includes the current position of Ve of the vehicle.
  • the sensor data also includes the user's voice collected by the microphone 117, the image inside the vehicle captured by the in-vehicle camera 120, and the like.
  • the situation grasping unit 222 estimates the current safety level or comfort level of the vehicle Ve based on the sensor data, and outputs the estimated safety level or comfort level to the information matching unit 223 .
  • the "safety level” is related to the driving situation of the vehicle Ve and indicates the safety level of travel.
  • the safety level is high when the vehicle Ve is traveling straight on a road with relatively good visibility, and the safety level is low when the vehicle is traveling on a road with a heavy driving load such as a sharp curve or a mountain road.
  • the vehicle Ve reaches the guidance point during route guidance and turns right or left, the driver's load and attention are required, so the degree of safety is low.
  • the situation grasping unit 222 can estimate the degree of safety mainly based on the data (including the current position of the vehicle) measured by the sensor group 115 among the input sensor data.
  • “Comfort” indicates the degree to which the user's mental state is good. For example, when the user is irritated or stressed, the comfort level is low, and when the user is calm or relaxed, the comfort level is high.
  • the situation grasping unit 222 can estimate the comfort level mainly based on the in-vehicle voice collected by the microphone 117 and the state of the inside of the vehicle captured by the in-vehicle camera 120 among the input sensor data.
  • the information matching unit 223 uses the safety level or the comfort level input from the situation grasping unit 222 and the priority of the audio files input from the multiple applications to output the audio files input from the multiple applications. Control. Specifically, the information matching unit 223 refers to an output criteria table prepared in advance and determines whether or not to output the audio file from each application.
  • FIG. 5 shows an example of the output criteria table.
  • the output reference table indicates whether or not voice output is possible for each combination of safety or comfort level and priority with "o" and "x". Note that the output reference table is created for two modes, a normal mode and a silent mode.
  • the degree of safety or the degree of comfort has been described above, and in this example, both are shown in 5 levels.
  • the degree of safety the larger the numerical value, the higher the degree of safety, and the smaller the numerical value, the lower the degree of safety.
  • the degree of comfort the larger the numerical value, the higher the degree of comfort, and the smaller the numerical value, the lower the degree of comfort.
  • priority is also shown in five stages.
  • priority the smaller the number, the higher the priority, and the larger the number, the lower the priority. That is, priority "1" is the highest priority.
  • an audio file with a priority of "1” is a warning audio for the user's running
  • an audio file with a priority of "2" is a warning audio for the user's running.
  • a voice file with a priority of "3” is a guidance voice from a route guidance application
  • a voice file with a priority of "4" is voice from an interactive application, a system management application, or the like.
  • the audio file with the priority "5" is the audio of the recommendation application.
  • the information matching unit 223 refers to the output reference table, and based on the safety level or comfort level input from the situation grasping unit 222 and the priority input from each application, outputs the audio file output by each application. determine whether or not
  • the normal mode table or the silent mode table is applied based on the user's settings when judging whether or not to enable voice output.
  • "Normal mode” is the normal mode (the default mode)
  • "Silent mode” is the mode selected when the user does not want much audio output. The silent mode is different from the normal mode in the part surrounded by the dashed line X in FIG.
  • the safety The sound file is output for any value of the degree or comfort level.
  • the sound of the sound file output from the application is recommendation information (priority "5") and the degree of safety or comfort is "3" to "5", the sound file is output.
  • the silent mode is selected by the user, the sound of the sound file output from the application is recommended information (priority "5"), and safety or comfort is high “3" to “5 , the audio file is not output. That is, even if the priority of the audio file output from the application and the safety or comfort are the same, if the user selects the silent mode, the priority is low (priority "4"). and "5") are not output.
  • the output of voice data can be controlled according to the user's preferences and mood at the time. becomes possible.
  • FIG. 6 is a flow chart of output control of an audio file generated by an application. This processing is realized by the controller 214 shown in FIG. 3 executing a program prepared in advance and operating as elements shown in FIG.
  • the situation grasping unit 222 acquires sensor data transmitted from the audio output device 100 (step S11). Next, the situation grasping unit 222 calculates the degree of safety or comfort based on the sensor data (step S12). The calculated safety level or comfort level is output to the information matching unit 223 .
  • the information matching unit 223 acquires the audio file and the priority of the audio file from the application (step S13).
  • the information matching unit 223 refers to the output criteria table, and determines whether or not to output the audio file based on the safety or comfort level and the priority of the audio file (step S14).
  • the information matching unit 2234 considers whether the normal mode or the silent mode is selected by the user, and outputs the audio file according to the description in the output reference table corresponding to the mode selected by the user. determine whether or not As a result, when the user selects the silent mode, audio files with low priority, such as recommendation information, are not output.
  • step S15: No If it is determined that the audio file cannot be output (step S15: No), the audio file is not output, and the process returns to step S11. On the other hand, when it is determined that the audio file can be output (step S15: Yes), the information matching unit 223 transmits the audio file to the audio output device 100 (step S16). The audio output device 100 outputs the received audio file. As a result, the sound generated by the application is output to the user.
  • step S17 it is determined whether or not the termination condition is met. It should be noted that the case where the termination condition is met is, for example, the case where the user has finished driving the vehicle Ve and sensor data cannot be received from the audio output device 100 . If the termination condition is not satisfied (step S17: No), the process returns to step S11. On the other hand, if the end condition is satisfied (step S17: Yes), the process ends.
  • the application outputs five levels of priority, and the user sets the output criteria by selecting a mode.
  • the application outputs priority as a number
  • the user can set the output criteria by setting a threshold for that number. In this case, if the priority of the audio file output from the application is higher than the threshold set by the user, the audio file is output, and if it is lower than the threshold set by the user, the audio file is not output. become.
  • the user may set the priority level of the audio file to be output without using the above output criteria table. In this case, if the priority of the audio file output from the application is higher than the level set by the user, the audio file will be output, and if the priority is lower than the level set by the user, the audio file will not be output. Become.
  • Non-transitory computer-readable media include various types of tangible storage media.
  • Examples of non-transitory computer-readable media include magnetic storage media (e.g., flexible discs, magnetic tapes, hard disk drives), magneto-optical storage media (e.g., magneto-optical discs), CD-ROMs (Read Only Memory), CD-Rs, CD-R/W, semiconductor memory (eg, mask ROM, PROM (Programmable ROM), EPROM (Erasable PROM), flash ROM, RAM (Random Access Memory)).

Landscapes

  • Engineering & Computer Science (AREA)
  • Automation & Control Theory (AREA)
  • Mechanical Engineering (AREA)
  • Human Computer Interaction (AREA)
  • Transportation (AREA)
  • Navigation (AREA)

Abstract

音声出力装置において、取得手段は、音声出力装置で実行されるアプリケーションから、出力すべき音声データ、及び、当該音声データの優先度を取得する。判定手段は、優先度についてユーザが設定した出力基準に関する情報と、優先度とに基づいて、音声データを出力すべきか否かを判定する。音声出力手段は、出力すべきと判定された音声データを出力する。

Description

音声出力装置、音声出力方法、プログラム及び記憶媒体
 本発明は、音声出力の制御に関する。
 複数のアプリケーションが搭載され、アプリケーション毎の動作に基づいて音声出力を行う車載装置が知られている。例えば、特許文献1は、専用アプリケーションと外部アプリケーションからの音声出力が時間的に重なる場合に、優先度が高い方のアプリケーションの音声を出力する車両用音声制御装置を開示している。
特開2014-38188号公報
 特許文献1の手法では、複数のアプリケーションからの音声出力が重ならない場合には特別な制御は行われない。しかし、複数のアプリケーションの音声出力が重ならない場合であっても、ユーザは状況などに応じて特定のアプリケーションからの音声出力を制御したいと考えることがある。
 本発明は、上記の課題を解決するためになされたものであり、ユーザが設定した基準を用いて、アプリケーションからの音声出力を適切に制御することが可能な音声出力装置を提供することを主な目的とする。
 請求項に記載の発明は、音声出力装置であって、前記音声出力装置で実行されるアプリケーションから、出力すべき音声データ、及び、当該音声データの優先度を取得する取得手段と、前記優先度についてユーザが設定した出力基準に関する情報と、前記優先度とに基づいて、前記音声データを出力すべきか否かを判定する判定手段と、出力すべきと判定された前記音声データを出力する音声出力手段と、を備える。
 また、請求項に記載の発明は、音声出力方法であって、音声出力装置で実行されるアプリケーションから、出力すべき音声データ、及び、当該音声データの優先度を取得し、前記優先度についてユーザが設定した出力基準に関する情報と、前記優先度とに基づいて、前記音声データを出力すべきか否かを判定し、出力すべきと判定された前記音声データを出力する。
 また、請求項に記載の発明は、プログラムであって、音声出力装置で実行されるアプリケーションから、出力すべき音声データ、及び、当該音声データの優先度を取得し、前記優先度についてユーザが設定した出力基準に関する情報と、前記優先度とに基づいて、前記音声データを出力すべきか否かを判定し、出力すべきと判定された前記音声データを出力する処理をコンピュータに実行させる。
実施例に係る音声出力システムの構成例を示す図である。 音声出力装置の概略構成を示すブロック図である。 サーバ装置の概略構成を示すブロック図である。 複数のアプリケーションからの音声出力を制御するための構成を示す。 出力基準テーブルの一例を示す。 アプリケーションが生成した音声ファイルの出力制御のフローチャートである。
 本発明の1つの好適な実施形態では、音声出力装置は、前記音声出力装置で実行されるアプリケーションから、出力すべき音声データ、及び、当該音声データの優先度を取得する取得手段と、前記優先度についてユーザが設定した出力基準に関する情報と、前記優先度とに基づいて、前記音声データを出力すべきか否かを判定する判定手段と、出力すべきと判定された前記音声データを出力する音声出力手段と、を備える。
 上記の音声出力装置において、取得手段は、音声出力装置で実行されるアプリケーションから、出力すべき音声データ、及び、当該音声データの優先度を取得する。判定手段は、優先度についてユーザが設定した出力基準に関する情報と、優先度とに基づいて、音声データを出力すべきか否かを判定する。そして、音声出力手段は、出力すべきと判定された音声データを出力する。これにより、ユーザが設定した基準に従って、複数のアプリケーションで生成される音声の出力が制御される。
 上記の音声出力装置の一態様では、前記出力基準は、ユーザのモード選択により設定される。
 上記の音声出力装置の他の一態様では、前記音声出力装置は移動体に搭載され、前記出力基準は、前記優先度と、前記移動体に関する安全度又は快適度とに関連して設定されている。
 上記の音声出力装置の他の一態様は、センサから出力されたセンサデータに基づいて、前記安全度又は前記快適度を決定する決定手段を備え、前記判定手段は、前記優先度と、前記安全度又は前記快適度とに基づいて前記音声データを出力すべきか否かを判定する。
 本発明の他の好適な実施形態では、音声出力方法は、音声出力装置で実行されるアプリケーションから、出力すべき音声データ、及び、当該音声データの優先度を取得し、前記優先度についてユーザが設定した出力基準に関する情報と、前記優先度とに基づいて、前記音声データを出力すべきか否かを判定し、出力すべきと判定された前記音声データを出力する。これにより、ユーザが設定した基準に従って、複数のアプリケーションで生成される音声の出力が制御される。
 本発明の他の好適な実施形態では、プログラムは、音声出力装置で実行されるアプリケーションから、出力すべき音声データ、及び、当該音声データの優先度を取得し、前記優先度についてユーザが設定した出力基準に関する情報と、前記優先度とに基づいて、前記音声データを出力すべきか否かを判定し、出力すべきと判定された前記音声データを出力する処理をコンピュータに実行させる。このプログラムをコンピュータで実行することにより、上記の音声出力装置を実現することができる。このプログラムは記憶媒体に記憶して使用することができる。
 以下、図面を参照して本発明の好適な実施例について説明する。
 <システム構成>
 [全体構成]
 図1は、実施例に係る音声出力システムの構成例を示す図である。本実施例に係る音声出力システム1は、音声出力装置100と、サーバ装置200とを有する。音声出力装置100は、車両Veに搭載される。サーバ装置200は、複数の車両Veに搭載された複数の音声出力装置100と通信する。
 音声出力装置100は、基本的に車両Veの搭乗者であるユーザに対して、経路案内処理や情報提供処理などを行う。例えば、音声出力装置100は、ユーザにより目的地等が入力されると、車両Veの位置情報や指定された目的地に関する情報などを含むアップロード信号S1をサーバ装置200に送信する。サーバ装置200は、地図データを参照して目的地までの経路を算出し、目的地までの経路を示す制御信号S2を音声出力装置100へ送信する。音声出力装置100は、受信した制御信号S2に基づいて、音声出力によりユーザに対する経路案内を行う。
 また、音声出力装置100は、ユーザとの対話により各種の情報をユーザに提供する。例えば、音声出力装置100は、ユーザが情報要求を行うと、その情報要求の内容又は種類を示す情報、及び、車両Veの走行状態に関する情報などを含むアップロード信号S1をサーバ装置200に供給する。サーバ装置200は、ユーザが要求する情報を取得、生成し、制御信号S2として音声出力装置100へ送信する。音声出力装置100は、受信した情報を、音声出力によりユーザに提供する。
 [音声出力装置]
 音声出力装置100は、車両Veと共に移動し、案内経路に沿って車両Veが走行するように、音声を主とした経路案内を行う。なお、「音声を主とした経路案内」は、案内経路に沿って車両Veを運転するために必要な情報をユーザが少なくとも音声のみから把握可能な経路案内を指し、音声出力装置100が現在位置周辺の地図などを補助的に表示することを除外するものではない。本実施例では、音声出力装置100は、少なくとも、案内が必要な経路上の地点(「案内地点」とも呼ぶ。)など、運転に係る様々な情報を音声により出力する。ここで、案内地点は、例えば車両Veの右左折を伴う交差点、その他、案内経路に沿って車両Veが走行するために重要な通過地点が該当する。音声出力装置100は、例えば、車両Veから次の案内地点までの距離、当該案内地点での進行方向などの案内地点に関する音声案内を行う。以後では、案内経路に対する案内に関する音声を「経路音声案内」とも呼ぶ。
 音声出力装置100は、例えば車両Veのフロントガラスの上部、又は、ダッシュボード上などに取り付けられる。なお、音声出力装置100は、車両Veに組み込まれてもよい。
 図2は、音声出力装置100の概略構成を示すブロック図である。音声出力装置100は、主に、通信部111と、記憶部112と、入力部113と、制御部114と、センサ群115と、表示部116と、マイク117と、スピーカ118と、車外カメラ119と、車内カメラ120と、を有する。音声出力装置100内の各要素は、バスライン110を介して相互に接続されている。
 通信部111は、制御部114の制御に基づき、サーバ装置200とのデータ通信を行う。通信部111は、例えば、後述する地図データベース4を更新するための地図データをサーバ装置200から受信してもよい。
 記憶部112は、RAM(Random Access Memory)、ROM(Read Only Memory)、不揮発性メモリ(ハードディスクドライブ、フラッシュメモリなどを含む)などの各種のメモリにより構成される。記憶部112には、音声出力装置100が所定の処理を実行するためのプログラムが記憶される。上述のプログラムは、経路音声案内を行うためのアプリケーションプログラム、音楽を再生するためのアプリケーションプログラム、音楽以外のコンテンツ(テレビ等)を出力するためのアプリケーションプログラムなどを含んでもよい。また、記憶部112は、制御部114の作業メモリとしても使用される。なお、音声出力装置100が実行するプログラムは、記憶部112以外の記憶媒体に記憶されてもよい。
 また、記憶部112は、地図データベース(以下、データベースを「DB」と記す。)4を記憶する。地図DB4には、経路案内に必要な種々のデータが記録されている。地図DB4は、例えば、道路網をノードとリンクの組合せにより表した道路データ、及び、目的地、立寄地、又はランドマークの候補となる施設を示す施設データなどを記憶している。地図DB4は、制御部114の制御に基づき、通信部111が地図管理サーバから受信する地図情報に基づき更新されてもよい。
 入力部113は、ユーザが操作するためのボタン、タッチパネル、リモートコントローラ等である。表示部116は、制御部114の制御に基づき表示を行うディスプレイ等である。マイク117は、車両Veの車内の音声、特に運転手の発話などを集音する。スピーカ118は、運転手などに対して、経路案内のための音声を出力する。
 センサ群115は、外界センサ121と、内界センサ122とを含む。外界センサ121は、例えば、ライダ、レーダ、超音波センサ、赤外線センサ、ソナーなどの車両Veの周辺環境を認識するための1又は複数のセンサである。内界センサ122は、車両Veの測位を行うセンサであり、例えば、GNSS(Global Navigation Satellite System)受信機、ジャイロセンサ、IMU(Inertial Measurement Unit)、車速センサ、又はこれらの組合せである。なお、センサ群115は、制御部114がセンサ群115の出力から車両Veの位置を直接的に又は間接的に(即ち推定処理を行うことによって)導出可能なセンサを有していればよい。
 車外カメラ119は、車両Veの外部を撮影するカメラである。車外カメラ119は、車両の前方を撮影するフロントカメラのみでもよく、フロントカメラに加えて車両の後方を撮影するリアカメラを含んでもよく、車両Veの全周囲を撮影可能な全方位カメラであってもよい。一方、車内カメラ120は、車両Veの車内の様子を撮影するカメラであり、少なくとも運転席周辺を撮影可能な位置に設けられる。
 制御部114は、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)などを含み、音声出力装置100の全体を制御する。例えば、制御部114は、センサ群115の1又は複数のセンサの出力に基づき、車両Veの位置(進行方向の向きも含む)を推定する。また、制御部114は、入力部113又はマイク117により目的地が指定された場合に、当該目的地までの経路である案内経路を示す経路情報を生成し、当該経路情報と推定した車両Veの位置情報と地図DB4とに基づき、経路音声案内を行う。この場合、制御部114は、案内音声をスピーカ118から出力させる。また、制御部114は、表示部116を制御することで、再生中の音楽の情報、映像コンテンツ、又は現在位置周辺の地図などの表示を行う。
 なお、制御部114が実行する処理は、プログラムによるソフトウェアで実現することに限ることなく、ハードウェア、ファームウェア、及びソフトウェアのうちのいずれかの組み合わせ等により実現してもよい。また、制御部114が実行する処理は、例えばFPGA(field-programmable gate array)又はマイコン等の、ユーザがプログラミング可能な集積回路を用いて実現してもよい。この場合、この集積回路を用いて、制御部114が本実施例において実行するプログラムを実現してもよい。このように、制御部114は、プロセッサ以外のハードウェアにより実現されてもよい。
 図2に示す音声出力装置100の構成は一例であり、図2に示す構成に対して種々の変更がなされてもよい。例えば、地図DB4を記憶部112が記憶する代わりに、制御部114が通信部111を介して経路案内に必要な情報をサーバ装置200から受信してもよい。他の例では、音声出力装置100は、スピーカ118を備える代わりに、音声出力装置100とは別体に構成された音声出力部と電気的に又は公知の通信手段によって接続することで、当該音声出力部から音声を出力させてもよい。この場合、音声出力部は、車両Veに備えられたスピーカであってもよい。さらに別の例では、音声出力装置100は、表示部116を備えなくともよい。この場合、音声出力装置100は、表示に関する制御を全く行わなくともよく、有線又は無線により、車両Ve等に備えられた表示部、又は、ユーザのスマートフォンなどと電気的に接続することで所定の表示を実行させてもよい。同様に、音声出力装置100は、センサ群115を備える代わりに、車両Veに備え付けられたセンサが出力する情報を、車両VeからCAN(Controller Area Network)などの通信プロトコルに基づき取得してもよい。
 [サーバ装置]
 サーバ装置200は、音声出力装置100から受信する目的地等を含むアップロード信号S1に基づき、車両Veが走行すべき案内経路を示す経路情報を生成する。そして、サーバ装置200は、その後に音声出力装置100が送信するアップロード信号S1が示すユーザの情報要求及び車両Veの走行状態に基づき、ユーザの情報要求に対する情報出力に関する制御信号S2を生成する。そして、サーバ装置200は、生成した制御信号S2を、音声出力装置100に送信する。
 さらに、サーバ装置200は、車両Veのユーザに対する情報提供やユーザとの対話を行うためのコンテンツを生成し、音声出力装置100に送信する。ユーザに対する情報提供は、主として車両Veが所定の運転状況になったことをトリガとしてサーバ装置200側から開始するプッシュ型の情報提供を含む。また、ユーザとの対話は、基本的にユーザからの質問や問いかけから開始するプル型の対話である。但し、ユーザとの対話は、プッシュ型の情報提供から開始する場合もある。
 図3は、サーバ装置200の概略構成の一例を示す図である。サーバ装置200は、主に、通信部211と、記憶部212と、制御部214とを有する。サーバ装置200内の各要素は、バスライン210を介して相互に接続されている。
 通信部211は、制御部214の制御に基づき、音声出力装置100などの外部装置とのデータ通信を行う。記憶部212は、RAM、ROM、不揮発性メモリ(ハードディスクドライブ、フラッシュメモリなどを含む)などの各種のメモリにより構成される。記憶部212は、サーバ装置200が所定の処理を実行するためのプログラムが記憶される。また、記憶部212は、地図DB4を含んでいる。さらに、記憶部212には、サーバ装置200上で動作する複数のアプリケーションのプログラムが記憶される。複数のアプリケーションは、例えば、経路案内アプリケーション、ユーザとの対話アプリケーション、おすすめの施設や店などを提案するレコメンドアプリケーションなどを含む。なお、通信部211は、取得手段及び音声出力手段の一例である。
 制御部214は、CPU、GPUなどを含み、サーバ装置200の全体を制御する。また、制御部214は、記憶部212に記憶されたプログラムを実行することで、音声出力装置100とともに動作し、ユーザに対する経路案内処理や情報提供処理などを実行する。例えば、制御部214は、音声出力装置100から通信部211を介して受信するアップロード信号S1に基づき、案内経路を示す経路情報、又は、ユーザの情報要求に対する情報出力に関する制御信号S2を生成する。そして、制御部214は、生成した制御信号S2を、通信部211により音声出力装置100に送信する。なお、制御部214は、判定手段及び決定手段の一例である。
 [音声出力の制御]
 (制御の概要)
 次に、サーバ装置200上で動作する複数のアプリケーションの制御について説明する。本実施例では、サーバ装置200上で複数のアプリケーションが動作する。アプリケーションの例としては、例えば、経路案内アプリケーション、ユーザとの対話アプリケーション、施設や店舗などの情報を提供するレコメンドアプリケーションなどがある。複数のアプリケーションは、独立に動作し、個別に必要な音声出力を行う。例えば、経路案内アプリケーションは交差点などの案内地点において経路案内音声を出力する。対話アプリケーションは、ユーザからの音声に対する回答の音声などを出力する。また、レコメンドアプリケーションは、車両Veの現在位置周辺や走行予定エリアに存在する施設や店舗をレコメンドする音声を出力する。
 しかし、各アプリケーションから出力される音声の重要度又は優先度は同一ではない。基本的に、経路案内中は、案内地点の近傍における経路案内音声の重要度が高い。また、ユーザは、車両Veの同乗者と会話を楽しんでいるときや、再生中の音楽を楽しんでいるときなどは、対話アプリケーションやレコメンドアプリケーションからの音声出力を煩わしいと感じることもある。そこで、本実施例では、サーバ装置200は、複数のアプリケーションからの音声出力を、優先度についてユーザが設定した出力基準に基づいて制御する。
 (構成)
 図4は、複数のアプリケーションからの音声出力を制御するための構成を示すブロック図である。図示のように、サーバ装置200では、複数のアプリケーションが動作している。サーバ装置200は、音声出力の制御のための構成として、状況把握部222と、情報整合部223とを備える。
 各アプリケーションは、それぞれ独立に動作し、各アプリケーションの動作に伴って生成される音声ファイル(音声データ)をそれぞれ情報整合部223へ出力する。なお、各アプリケーションは、音声ファイルとともに、その音声ファイルの優先度を情報整合部223へ出力する。各アプリケーションは、全てのアプリケーションに対して統一的に決められたルールに基づいて、出力する音声ファイルの優先度を決定し、音声ファイルとともに情報整合部223へ出力する。よって、情報整合部223は、音声ファイルとともに、統一ルールに従って各アプリケーションが個々の音声ファイルに対して設定した優先度を受信する。なお、統一ルールは、例えば、車両Veの走行の安全性に対する影響の大きい音声(例えば、警告、注意喚起など)の優先度が高く、走行の安全性に対する影響の小さい音声(例えば、施設などのレコメンド、緊急性の無いシステムの動作状態の報告など)の優先度が低くなるように定められる。
 状況把握部222には、車両Veに搭載された音声出力装置100から送信されたセンサデータが入力される。センサデータは、音声出力装置100に搭載されたセンサ群115による測定データであり、車両のVeの現在位置を含む。また、センサデータは、マイク117が集音したユーザの音声、車内カメラ120が撮影した車内の画像などを含む。状況把握部222は、センサデータに基づいて、現在の車両Veの安全度又は快適度を推定し、情報整合部223へ出力する。
 ここで、「安全度」とは、車両Veの運転状況に関連し、走行の安全度合いを示す。例えば車両Veが比較的見通しの良い道路を直進しているような場合は安全度は高くなり、急カーブや山道などの運転負荷が大きい道路を走行している場合には安全度は低くなる。また、経路案内中に車両Veが案内地点に到達し、右折や左折などを行うときには、運転負荷や注意力が要求されるため、安全度は低くなる。状況把握部222は、入力されたセンサデータのうち、主としてセンサ群115による測定データ(車両の現在位置を含む)に基づいて安全度を推定することができる。
 「快適度」は、ユーザの心理状況が良好である度合いを示す。例えば、ユーザがイライラしていたり、ストレスを感じているときには快適度は低くなり、ユーザが落ち着いていたり、リラックスしているときには快適度は高くなる。状況把握部222は、入力されたセンサデータのうち、主としてマイク117が集音した車内音声や、車内カメラ120が撮影した車内の様子などに基づいて、快適度を推定することができる。
 情報整合部223は、状況把握部222から入力された安全度又は快適度と、複数のアプリケーションから入力された音声ファイルの優先度とを用いて、複数のアプリケーションから入力された音声ファイルの出力を制御する。具体的に、情報整合部223は、予め用意された出力基準テーブルを参照して、各アプリケーションからの音声ファイルの出力の可否を決定する。
 (出力基準テーブル)
 図5は、出力基準テーブルの一例を示す。図示のように、出力基準テーブルは、安全度又は快適度と、優先度との組み合わせに対して音声出力の可否を「〇」と「×」で示している。なお、出力基準テーブルは、ノーマルモードと、サイレントモードの2つのモードに対応して作成されている。安全度又は快適度は先に述べたものであり、本例では、いずれも5段階で示されている。安全度は、数値が大きいほど安全度が高く、数値が小さいほど安全度が低い。快適度は、数値が大きいほど快適度が高く、数値が小さいほど快適度が低い。
 また、本例では優先度も5段階で示されている。優先度は、数値が小さいほど優先度が高く、数値が大きいほど優先度が低い。即ち、優先度「1」が最も優先度が高い。例えば、優先度が「1」の音声ファイルは、ユーザの走行に関する警告の音声であり、優先度が「2」の音声ファイルは、ユーザの走行に関する注意の音声である。優先度「3」の音声ファイルは、経路案内アプリケーションによる案内音声であり、優先度が「4」の音声ファイルは対話アプリケーションやシステム管理アプリケーションなどの音声である。また、優先度「5」の音声ファイルは、レコメンドアプリケーションの音声である。
 情報整合部223は、出力基準テーブルを参照し、状況把握部222から入力された安全度又は快適度と、各アプリケーションから入力された優先度とに基づいて、各アプリケーションの出力した音声ファイルの出力の可否を判定する。
 ここで、音声出力の可否を判定するにあたっては、ユーザの設定に基づいてノーマルモードのテーブルとサイレントモードのテーブルのいずれかが適用される。「ノーマルモード」は、通常のモード(デフォルトのモード)であり、「サイレントモード」は、ユーザが多くの音声出力を望まない場合に選択するモードである。サイレントモードは、図5の破線Xで囲んだ箇所がノーマルモードと異なっている。
 一例として、アプリケーションから出力された音声ファイルの音声が車両Veの走行に関する警告情報(優先度「1」)である場合、ユーザがノーマルモードとサイレントモードのいずれを選択していても、また、安全度又は快適度がどの値であっても、その音声ファイルは出力される。
 他の例として、ユーザによりノーマルモードが選択されていると仮定する。アプリケーションから出力された音声ファイルの音声がレコメンド情報(優先度「5」)であり、安全度又は快適度が「3」~「5」であれば、その音声ファイルは出力される。これに対し、ユーザによりサイレントモードが選択されている場合、アプリケーションから出力された音声ファイルの音声がレコメンド情報(優先度「5」)であり、安全度又は快適度が高い「3」~「5」であっても、その音声ファイルは出力されない。即ち、アプリケーションから出力された音声ファイルの優先度、及び、安全度又は快適度が同じであっても、ユーザがサイレントモードを選択している場合には、優先度の低い(優先度「4」及び「5」)の音声ファイルは出力されない。このように、優先度に関するユーザの設定に基づいて、アプリケーションが生成した音声データの出力の可否の判定基準を変えることにより、ユーザの好みやその時の気分に応じて、音声データの出力を制御することが可能となる。
 (出力制御のフロー)
 図6は、アプリケーションが生成した音声ファイルの出力制御のフローチャートである。この処理は、図3に示す制御部214が、予め用意されたプログラムを実行し、図4に示す要素として動作することにより実現される。
 まず、状況把握部222は、音声出力装置100から送信されたセンサデータを取得する(ステップS11)。次に、状況把握部222は、センサデータに基づいて、安全度又は快適度を算出する(ステップS12)。算出された安全度又は快適度は、情報整合部223へ出力される。
 次に、情報整合部223は、アプリケーションから音声ファイルと、その音声ファイルの優先度を取得する(ステップS13)。次に、情報整合部223は、出力基準テーブルを参照し、安全度又は快適度と、音声ファイルの優先度とに基づいて、その音声ファイルの出力の可否を判定する(ステップS14)。この際、情報整合部2234は、ユーザによってノーマルモードとサイレントモードのいずれが選択されているかを考慮し、ユーザが選択している方のモードに対応する出力基準テーブル中の記述に従って音声ファイルの出力の可否を判定する。これにより、ユーザがサイレントモードを選択している場合には、例えばレコメンド情報などの優先度の低い音声ファイルは出力されないようになる。
 音声ファイルが出力不可と判定された場合(ステップS15:No)、その音声ファイルは出力されず、処理はステップS11へ戻る。一方、音声ファイルが出力可能と判定された場合(ステップS15:Yes)、情報整合部223は、その音声ファイルを音声出力装置100へ送信する(ステップS16)。音声出力装置100は、受信した音声ファイルを出力する。これにより、アプリケーションが生成した音声がユーザに対して出力される。
 次に、終了条件が具備されたか否かが判定される(ステップS17)。なお、終了条件が具備された場合とは、例えば、ユーザが車両Veの運転を終了し、音声出力装置100からセンサデータが受信できなくなった場合などである。終了条件が具備されていない場合(ステップS17:No)、処理はステップS11へ戻る。一方、終了条件が具備された場合(ステップS17:Yes)、処理は終了する。
 以上のように、本実施例では、音声ファイルの優先度に関するユーザのモード設定により、ユーザの好みやその時の気分に沿った出力基準を用いてアプリケーションからの音声出力を制御することができる。
 (変形例)
 上記の出力基準テーブルでは、アプリケーションは5段階の優先度を出力し、ユーザはモードの選択により出力基準を設定している。その代わりに、アプリケーションが優先度を数値で出力する場合には、ユーザはその数値に対する閾値を設定することにより、出力基準を設定することができる。この場合、アプリケーションから出力された音声ファイルの優先度が、ユーザが設定した閾値より大きい場合にはその音声ファイルは出力され、ユーザが設定した閾値より以下の場合にはその音声ファイルは出力されないことになる。
 また、アプリケーションが5段階の優先度を出力する場合、上記の出力基準テーブルを用いることなく、出力すべき音声ファイルの優先度のレベルをユーザが設定してもよい。この場合、アプリケーションから出力された音声ファイルの優先度が、ユーザが設定したレベルより大きい場合にはその音声ファイルは出力され、ユーザが設定したレベル以下の場合にはその音声ファイルは出力されないことになる。
 [変形例]
 上述した実施例において、プログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non-transitory computer readable medium)を用いて格納され、コンピュータである制御部等に供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記憶媒体(tangible storage medium)を含む。非一時的なコンピュータ可読媒体の例は、磁気記憶媒体(例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ)、光磁気記憶媒体(例えば光磁気ディスク)、CD-ROM(Read Only Memory)、CD-R、CD-R/W、半導体メモリ(例えば、マスクROM、PROM(Programmable ROM)、EPROM(Erasable PROM)、フラッシュROM、RAM(Random Access Memory))を含む。
 以上、実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。すなわち、本願発明は、請求の範囲を含む全開示、技術的思想にしたがって当業者であればなし得るであろう各種変形、修正を含むことは勿論である。また、引用した上記の特許文献等の各開示は、本書に引用をもって繰り込むものとする。
 100 音声出力装置
 111、211 通信部
 112、212 記憶部
 113 入力部
 114、214 制御部
 115 センサ群
 116 表示部
 117 マイク
 118 スピーカ
 119 車外カメラ
 120 車内カメラ
 200 サーバ装置
 222 状況把握部
 223 情報整合部

Claims (7)

  1.  音声出力装置であって、
     前記音声出力装置で実行されるアプリケーションから、出力すべき音声データ、及び、当該音声データの優先度を取得する取得手段と、
     前記優先度についてユーザが設定した出力基準に関する情報と、前記優先度とに基づいて、前記音声データを出力すべきか否かを判定する判定手段と、
     出力すべきと判定された前記音声データを出力する音声出力手段と、
     を備える音声出力装置。
  2.  前記出力基準は、ユーザのモード選択により設定される請求項1に記載の音声出力装置。
  3.  前記音声出力装置は移動体に搭載され、
     前記出力基準は、前記優先度と、前記移動体に関する安全度又は快適度とに関連して設定されている請求項1又は2に記載の音声出力装置。
  4.  センサから出力されたセンサデータに基づいて、前記安全度又は前記快適度を決定する決定手段を備え、
     前記判定手段は、前記優先度と、前記安全度又は前記快適度とに基づいて前記音声データを出力すべきか否かを判定する請求項3に記載の音声出力装置。
  5.  音声出力装置で実行されるアプリケーションから、出力すべき音声データ、及び、当該音声データの優先度を取得し、
     前記優先度についてユーザが設定した出力基準に関する情報と、前記優先度とに基づいて、前記音声データを出力すべきか否かを判定し、
     出力すべきと判定された前記音声データを出力する音声出力方法。
  6.  音声出力装置で実行されるアプリケーションから、出力すべき音声データ、及び、当該音声データの優先度を取得し、
     前記優先度についてユーザが設定した出力基準に関する情報と、前記優先度とに基づいて、前記音声データを出力すべきか否かを判定し、
     出力すべきと判定された前記音声データを出力する処理をコンピュータに実行させるプログラム。
  7.  請求項6に記載のプログラムを記憶した記憶媒体。
PCT/JP2021/039782 2021-10-28 2021-10-28 音声出力装置、音声出力方法、プログラム及び記憶媒体 WO2023073856A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PCT/JP2021/039782 WO2023073856A1 (ja) 2021-10-28 2021-10-28 音声出力装置、音声出力方法、プログラム及び記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2021/039782 WO2023073856A1 (ja) 2021-10-28 2021-10-28 音声出力装置、音声出力方法、プログラム及び記憶媒体

Publications (1)

Publication Number Publication Date
WO2023073856A1 true WO2023073856A1 (ja) 2023-05-04

Family

ID=86157548

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2021/039782 WO2023073856A1 (ja) 2021-10-28 2021-10-28 音声出力装置、音声出力方法、プログラム及び記憶媒体

Country Status (1)

Country Link
WO (1) WO2023073856A1 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007303858A (ja) * 2006-05-09 2007-11-22 Sanyo Electric Co Ltd ナビゲーション装置
JP2014034374A (ja) * 2012-08-10 2014-02-24 Yupiteru Corp 車両用システム及びプログラム
JP2019158975A (ja) * 2018-03-08 2019-09-19 トヨタ自動車株式会社 発話システム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007303858A (ja) * 2006-05-09 2007-11-22 Sanyo Electric Co Ltd ナビゲーション装置
JP2014034374A (ja) * 2012-08-10 2014-02-24 Yupiteru Corp 車両用システム及びプログラム
JP2019158975A (ja) * 2018-03-08 2019-09-19 トヨタ自動車株式会社 発話システム

Similar Documents

Publication Publication Date Title
US6172641B1 (en) Navigation system with audible route guidance instructions
US7369938B2 (en) Navigation system having means for determining a route with optimized consumption
US20200377126A1 (en) Information output control device and information output control method
CN113287074A (zh) 使用语音交互增加自主运载工具安全性和灵活性的方法和系统
US20200307644A1 (en) Control system for vehicle, notification method for vehicle, and medium
JP2010175516A (ja) 省エネ評価装置、省エネ評価方法
JP2023164659A (ja) 情報処理装置、情報出力方法、プログラム及び記憶媒体
WO2023073856A1 (ja) 音声出力装置、音声出力方法、プログラム及び記憶媒体
JP2023105143A (ja) 情報処理装置、情報出力方法、プログラム及び記憶媒体
JP5435113B2 (ja) 省エネ評価装置、省エネ評価方法
WO2020039530A1 (ja) 運転者選定装置および運転者選定方法
JP7134339B2 (ja) 運転制御装置及び運転制御方法
JP2012225712A (ja) ナビゲーション装置
WO2023062814A1 (ja) 音声出力装置、音声出力方法、プログラム及び記憶媒体
WO2023062817A1 (ja) 音声認識装置、制御方法、プログラム及び記憶媒体
WO2023286827A1 (ja) コンテンツ出力装置、コンテンツ出力方法、プログラム及び記憶媒体
WO2023062816A1 (ja) コンテンツ出力装置、コンテンツ出力方法、プログラム及び記憶媒体
WO2023163196A1 (ja) コンテンツ出力装置、コンテンツ出力方法、プログラム及び記憶媒体
WO2023112148A1 (ja) 音声出力装置、音声出力方法、プログラム及び記憶媒体
WO2023163197A1 (ja) コンテンツ評価装置、コンテンツ評価方法、プログラム及び記憶媒体
WO2023162192A1 (ja) コンテンツ出力装置、コンテンツ出力方法、プログラム及び記憶媒体
WO2023162189A1 (ja) コンテンツ出力装置、コンテンツ出力方法、プログラム及び記憶媒体
WO2023286826A1 (ja) コンテンツ出力装置、コンテンツ出力方法、プログラム及び記憶媒体
JP2023059442A (ja) 音声出力装置、音声出力方法、プログラム及び記憶媒体
JP7213968B2 (ja) 運転支援装置及び運転支援方法

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21962404

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE