WO2009141853A1 - 曲再生装置、音声案内装置、音声出力装置およびプログラム - Google Patents

曲再生装置、音声案内装置、音声出力装置およびプログラム Download PDF

Info

Publication number
WO2009141853A1
WO2009141853A1 PCT/JP2008/001290 JP2008001290W WO2009141853A1 WO 2009141853 A1 WO2009141853 A1 WO 2009141853A1 JP 2008001290 W JP2008001290 W JP 2008001290W WO 2009141853 A1 WO2009141853 A1 WO 2009141853A1
Authority
WO
WIPO (PCT)
Prior art keywords
voice guidance
voice
time
music
guidance
Prior art date
Application number
PCT/JP2008/001290
Other languages
English (en)
French (fr)
Inventor
児玉泰輝
Original Assignee
パイオニア株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by パイオニア株式会社 filed Critical パイオニア株式会社
Priority to JP2010512852A priority Critical patent/JPWO2009141853A1/ja
Priority to PCT/JP2008/001290 priority patent/WO2009141853A1/ja
Publication of WO2009141853A1 publication Critical patent/WO2009141853A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/26Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
    • G01C21/34Route searching; Route guidance
    • G01C21/36Input/output arrangements for on-board computers
    • G01C21/3626Details of the output of route guidance instructions
    • G01C21/3655Timing of guidance instructions

Definitions

  • the present invention relates to a music playback device, a voice guidance device, a voice output device, and a program that perform music playback and voice guidance in parallel.
  • Patent Document 1 a navigation system having a car navigation function and an audio player function and performing music reproduction and voice guidance (way guidance) in parallel is known (for example, Patent Document 1).
  • This navigation system discriminates the priority of voice guidance, and when the priority is high, the music reproduction is interrupted and voice guidance is inserted. If the priority is low, voice guidance is inserted after the end of the music being played back. With this configuration, voice guidance that is not so important for the driver can be performed between the songs, and there is an effect that the music being played is not interrupted more than necessary.
  • JP 2001-116581 A JP 2001-116581 A
  • the above navigation system inserts voice guidance after the end of the song being played back. For example, the voice guidance “Turn right 3 kilometers ahead” If the remaining 5 minutes until the end of the song, it will continue to run for 5 minutes while waiting for the end of the song, so even if the voice guidance "Turn right 3 kilometers ahead” is given, actually turn right There may be 500m left to the point. That is, in the case of voice guidance with a low priority, there is a risk of inaccurate voice guidance, which is not practical.
  • an object of the present invention is to provide a music reproducing device, a voice guidance device, a voice output device, and a program capable of performing accurate voice guidance without interfering with music appreciation as much as possible.
  • the music reproducing apparatus of the present invention includes music reproducing means for reproducing one or more music and control means for controlling the music reproducing means under a situation where voice guidance is performed at a predetermined transmission time.
  • the control means adjusts the playback order and / or playback time of the music so that the timing of voice guidance is between songs.
  • the reproduction order and / or the reproduction time of the music is adjusted so that the timing of performing the audio guidance is between the songs, so that the possibility that the audio guidance interferes with the music appreciation is reduced. be able to. Moreover, since the transmission time does not fluctuate for voice guidance, there is no inaccurate (uncomfortable) content.
  • “adjusting the playback order of songs” means that songs are played back in the order of songs B ⁇ songs C ⁇ songs A when it is scheduled to be played back in the order of songs A ⁇ songs B ⁇ songs C. For example, it means changing a predetermined playback order.
  • “between songs” refers to between songs.
  • the means for performing voice guidance may be provided in the music playback device or in an external device other than the music playback device.
  • the music reproducing device may acquire a voice guidance list from an external device in advance and control the music reproducing means based on the voice guidance list.
  • voice guidance is periodically performed, such as every 5 minutes, the music reproducing means may be controlled according to the time measured by a timer.
  • the voice guidance device of the present invention includes voice guidance means for performing voice guidance at a predetermined transmission time and transmission information under a situation where a song is being reproduced, and control means for controlling the voice guidance means, The control means adjusts the voice guidance transmission time and the transmission information so that the voice guidance timing is between songs.
  • the voice guidance transmission time and the transmission information are adjusted so that the timing of voice guidance is between songs, it is possible to reduce the possibility that voice guidance hinders music appreciation.
  • the voice guidance adjusts the transmission information as well as the transmission time, so there is no inaccurate (uncomfortable) content.
  • the means for reproducing the music may be provided in the voice guidance device or in an external device other than the voice guidance device. In the latter case, the voice guidance device may acquire a playlist of songs from an external device in advance and control the voice guidance means based on the playlist. In addition, when music is played back regularly, such as every 5 minutes, the voice guidance means may be controlled according to the time measured by a timer.
  • the audio output device of the present invention includes: a music playback unit that plays back one or more songs; a voice guide unit that provides voice guidance at a predetermined transmission time and transmission information; a song playback unit; and a voice guide unit.
  • the music reproduction means and / or the voice guidance means are controlled so that the timing of voice guidance is between songs, it is possible to reduce the possibility that voice guidance hinders music appreciation. .
  • the voice guidance when the transmission time is adjusted, the transmission information is also adjusted, so that the content does not become inaccurate (uncomfortable).
  • the content for reproducing the music and the content for performing the voice guidance may be provided in the audio output device or in the external device. In the latter case, the audio output device appropriately acquires content from the external device, and performs music reproduction and audio guidance.
  • control means adjusts at least one of a song intro and / or ending reduction amount, a crossfade time between songs, and a song playback speed as a song playback time. It is preferable to do.
  • the playback time of a song can be adjusted by the amount of intro and / or ending reduction of the song, the crossfade time between songs, and the playback speed (song length) of the song.
  • the “music playback speed” is preferably adjusted within a range in which the pitch (pitch) of the music is not changed.
  • control means as voice guidance transmission information, absorbs a deviation amount between a predetermined transmission time and a timing when voice guidance is actually performed, It is preferable to adjust the distance information in the route guidance.
  • the transmission information of the voice guidance can be adjusted by the time guidance information in the time signal guidance and the distance information in the road guidance.
  • these adjustments are adjustments for absorbing the amount of deviation between the determined transmission time and the actual voice guidance timing (adjusted transmission time). The feeling of discomfort can be eliminated.
  • the control means adjusts the voice guidance transmission time and the transmission information for the voice guidance with high importance. It is preferable to prohibit.
  • this configuration it is possible to limit adjustment of transmission time and transmission information according to the importance of voice guidance. For example, in the route guidance, when performing voice guidance such as “It is a right turn”, it is meaningless if the transmission time is delayed even for 10 seconds. In this case, even if the transmission information is adjusted, it is preferable that the transmission time and the transmission information are not adjusted because the expression is not suitable for route guidance, such as “turn right at the front intersection”.
  • each voice guidance has a voice guidance order determined according to a predetermined transmission time, and the control means has a low importance voice guidance.
  • the voice guidance order can be changed.
  • the voice guidance order can be changed for voice guidance with low importance, the possibility that voice guidance is performed during a song (between the start and end of a song) is further increased. Can be lowered.
  • voice guidance order for voice guidance with high importance, it is preferable that the voice guidance order cannot be changed. For example, if the voice guidance order is determined in the order of “Turn right 3 kilometers ahead” and “Soon to the right”, the driver will be confused if the voice guidance order is reversed. I will. For this reason, it is preferable to limit the change of the voice guidance order according to the content (importance) of the voice guidance.
  • a time range in which voice guidance can be transmitted is set, and for the voice guidance that cannot be transmitted within the time range in which the voice guidance can be transmitted, the timing is important for the music. It is preferable to adjust the reproduction order and / or the reproduction time of the music so that it does not overlap with an important part so as not to become an important part (rust part).
  • the time range in which voice guidance can be transmitted since the time range in which voice guidance can be transmitted is set, it is possible to avoid the transmission information from changing extremely. For example, if the time signal “3 o'clock” is postponed 30 minutes later to perform between songs, even if the transmission information is adjusted to “3 o'clock”, the voice guidance itself does not make much sense Will no longer have. For this reason, it is preferable that the time range which can be transmitted is restrict
  • a time range that can be transmitted when a time range that can be transmitted is set, there is a possibility that voice guidance cannot be transmitted within the time range, but even in such a case, an important part of the song (so-called “rust portion”) is impressive.
  • the reproduction order and / or reproduction time of the music is adjusted so as not to overlap with the (part), the discomfort that the voice guidance is applied to the part of the important chorus can be alleviated.
  • whether or not the song is an important partial rust portion may be determined by acquiring the metadata of the song in advance, or may be determined based on the analysis result of the song.
  • the voice guidance includes one or more voice guidance elements to which the same group ID is assigned, and the voice guidance means includes one or more voice guidance elements to which the same group ID is given. It is preferable to output continuously.
  • voice guidance elements assigned with the same group ID are continuously output, voice guidance elements assigned with other group IDs are not inserted. For example, if the voice guidance “Soon to the right. A convenience is a landmark.” Consists of three voice guidance elements, “Soon,” “It ’s to the right.” And “A convenience is a landmark.” If another voice guidance element such as “It is right” is inserted in between, the meaning will not be understood. In particular, when the voice guidance order is changed, such a problem is likely to occur. Therefore, it is important to assign a group ID.
  • the program of the present invention is for causing a computer to function as each unit in the music reproducing device described above, each unit in the voice guidance device described above, or each unit in the voice output device described above. It is characterized by that.
  • a music reproducing device having a car navigation function (voice guidance means) and an audio player function (song playback means) and performing song playback and voice guidance (way guidance) in parallel.
  • voice guidance means voice guidance means
  • audio player function short playback means
  • song playback and voice guidance way guidance
  • FIG. 1 is a block diagram showing a control configuration of the audio output device 1.
  • the voice output device 1 includes a car navigation operation unit 11, an information acquisition unit 12, a player operation unit 13, a voice guidance list generation unit 14, a playlist generation unit 15, a time table generation unit 16, and a voice output unit. 17.
  • a content metadata database 21 hereinafter referred to as “content metadata DB”
  • a content database 22 hereinafter referred to as “content DB” are provided.
  • the content metadata DB 21 is a database that stores, as content metadata 33 (see FIG. 4), information related to music content and content of transmission information transmitted as voice guidance.
  • the content DB 22 is a database that stores music content and transmission information content.
  • the car navigation operation unit 11 is for a user (driver) to perform various operations related to the car navigation function such as route / destination setting and change operation. Therefore, although not particularly illustrated, the audio output device 1 also includes a control program for performing route guidance and a display for performing route display.
  • the information acquisition unit 12 acquires GPS (Global Positioning System) information (including position information and time information), road traffic information (including traffic jam information and information on traffic regulation), and the like.
  • the voice guidance list generation unit 14 performs voice guidance (road guidance, route guidance) based on the operation result of the car navigation operation unit 11 and the information acquired by the information acquisition unit 12 (see FIG. 2). ) Is generated. Specifically, from the destination, the current position of the voice output device 1 (vehicle equipped with this), traveling speed, current time, road conditions (congestion, under construction, smooth operation, etc.) The content (transmission information) is determined, and the voice guidance list 31 is generated. The voice guidance list 31 is updated in real time according to the constantly changing situation. In addition, the voice guidance list 31 is not generated for all processes up to the destination at once, but is generated for each predetermined section such as a range of 10 km from the current position. Thereby, the burden of the update work performed frequently can be reduced. Also, updates that affect operations that cannot be changed in the middle, such as operations that gradually increase the volume, can be restricted.
  • the player operation unit 13 is for the user to perform various operations related to the audio player function such as selection of a playlist and volume / sound quality adjustment. Therefore, although not particularly illustrated, the audio output device 1 also includes an audio control device and a speaker for performing various audio processes.
  • the playlist generation unit 15 generates a playlist 32 (see FIG. 3) for playing back music (music) based on the operation result of the player operation unit 13.
  • the time table generation unit 16 actually performs music reproduction and voice guidance based on the voice guidance list 31 generated by the voice guidance list generation unit 14 and the playlist 32 generated by the playlist generation unit 15.
  • a time table 34 (see FIG. 5) is generated.
  • the time table 34 is arranged so that the timing of voice guidance is as long as possible between songs, and when the interval between songs is not possible, it does not overlap with an important portion of the song (hereinafter referred to as “rust portion”) rust portion.
  • the music playback time, the voice guidance transmission time, and the transmission information are adjusted.
  • the main part of the “control means” in the claims is constituted by the time table generator 16. That is, a control device (such as a CPU, not shown) that controls music reproduction and voice guidance based on the time table 34 generated by the time table generating unit 16 corresponds to “control means” in the claims.
  • the time table generating unit 16 includes a music reproduction information generating unit 16a, a transmission time editing unit 16b, and a transmission information editing unit 16c.
  • the music reproduction information generating unit 16a defines the reproduction time (reproduction start time, reproduction end time, expansion / contraction degree, shortening degree, etc.) of each song based on the voice guidance list 31, the playlist 32, and the content metadata 33.
  • Generate playback information The playback time of each song has been adjusted so that the voice guidance that cannot change the transmission time (voice guidance with a high degree of importance) does not reach the chorus part of the song and falls between the songs as much as possible. Is.
  • the adjustment of the playback time is performed by changing the intro and / or ending reduction amount of the song, the crossfade time between songs, the playback speed of the song, and the like.
  • the transmission time editing unit 16b edits the transmission time of voice guidance that can change the transmission time. Note that the transmission time editing unit 16b also adjusts the transmission time of each voice guidance so that the voice guidance is between the songs as much as possible. Also, the transmission information editing unit 16c edits the transmission information as the transmission time is edited by the transmission time editing unit 16b. Although a specific example will be described later, the transmission information editing unit 16c edits the transmission information in order to absorb the deviation amount of the transmission time adjusted by the transmission time editing unit 16b. In other words, when editing by the transmission time editing unit 16b is not performed (when there is no need to change the transmission time), editing by the transmission information editing unit 16c is not performed.
  • the voice output unit 17 performs reproduction of music (output of music) and transmission of voice guidance (output of transmission information) based on the time table 34 generated by the time table generation unit 16.
  • voice output part 17 outputs an audio
  • FIG. 2 is a diagram illustrating an example of the voice guidance list 31.
  • “start time” and “end time”, “importance”, and “group ID” of the transmittable range are associated with each voice guidance.
  • Fig. 2 four voice guidances are shown: “It is 3 o'clock", “Soon right, A convenience is a landmark", “It is right”, and “It is about 3 kilometers ahead”. Yes.
  • Each voice guidance is composed of one or more transmission information (voice guidance elements).
  • the voice guidance “3 o'clock” is composed of two transmission information of “3 o'clock” and “is”.
  • Each piece of transmission information is associated with “edit prohibited” and “content ID”.
  • the items “start time” and “end time” indicate the transmission possible range where the voice guidance can be performed.
  • the “importance” is classified into three levels according to the contents of the voice guidance.
  • the importance level 0 indicates the voice guidance that has the lowest importance level and the voice guidance order can be freely adjusted.
  • the voice guidance order is an order determined in accordance with “start time” or “end time” indicating the transmission possible range of each voice guidance. In the example of FIG. “It's 3 o'clock”. "Soon right. A convenience store is a landmark.” "It's right.”
  • the voice guidance order is “It is about 3 km ahead”. In other words, the voice guidance with the importance level 0 (“3 o'clock”) may be transmitted after the voice guidance “coming right soon” or “about 3 km ahead”.
  • voice guidance of importance level 0 editing of transmission time is possible, but editing of transmission information is not necessarily possible. Whether transmission information can be edited depends on the contents described in the item “Prohibition of editing”) Editing by the time editing unit 16b and the transmission information editing unit 16c is possible.
  • transmission information is set so that voice guidance is performed at the “start time” of the transmittable range.
  • the change of the transfer time is limited to the transmittable range. If voice guidance cannot be inserted between songs due to this limitation, voice guidance is inserted into the song as in the case of importance 2 voice guidance shown below.
  • the importance level 1 is higher than the importance level 0, and the voice guidance order cannot be freely adjusted, but the voice guidance has a wide transmission range. (In this example, the transmittable range happens to be narrow, but this is not necessarily the case.) However, the voice guidance with importance level 1 has a shorter transmittable range than the voice guidance with importance level 0. Yes. For example, the voice guidance “about 3 km ahead left” has a communicable range of 2 minutes, so within this range, it is possible to adjust the transmission time including adjustment of transmission information. In the case of importance 1 voice guidance, when voice guidance cannot be inserted between songs in the transmittable range, voice guidance is inserted into the music in the same manner as importance 2 voice guidance shown below.
  • the importance level 2 indicates the voice guidance having the highest importance level, the voice guidance order cannot be freely adjusted, and the transmission range is not wide. That is, the voice of importance 2 is always voice-guided at the transmission time, and cannot be edited by the transmission time editing unit 16b and the transmission information editing unit 16c. Note that the voice guidance of importance 2 fades out and fades in the volume of the song before and after that. As a result, the voice guidance can be easily heard. Instead of fading out / fade in the volume, during the voice guidance output of importance level 2, the reproduction of the music may be paused and resumed when the voice guidance output ends.
  • the item “group ID” is set for each voice guidance, and the same group ID is given to one or more transmission information constituting the voice guidance.
  • One or more pieces of transmission information assigned with the same group ID are continuously output.
  • the voice guidance order of importance 0 can change the voice guidance order, the above problem can be surely solved by giving a group ID.
  • the item “prohibited editing” indicates whether the transmission information is editable.
  • “0” means that editing by the transfer information editing unit 16c is possible
  • “1” means that editing by the transfer information editing unit 16c is impossible.
  • the item “content ID” is a code for identifying each piece of transmission information.
  • the playlist 32 associates “song order”, “content ID”, and “length” for each piece of music content.
  • the item “song order” refers to the order in which songs are played back. In this embodiment, the order of songs is not changed (songs are played back according to the order of songs in the playlist 32).
  • the item “content ID” is a code for identifying each song, and has a different number of digits in order to avoid duplication with the content ID of the transmission information.
  • the item “length” indicates the song length in seconds. It should be noted that the item (“length” is usually included in the content metadata, and may be omitted from the playlist 32, so it is not always necessary).
  • the content metadata 33 will be described with reference to FIG.
  • “content ID”, “type”, and “length” of each content are associated.
  • “intro”, “ending”, “start of rust”, and “end of rust” are further associated.
  • the items “Intro” and “Ending” respectively indicate the length of the intro and the length of the ending in seconds.
  • the items “start of rust” and “end of rust” indicate the time from the start of the song to the start and end of the rust in seconds, respectively.
  • time table 34 contents to be operated are arranged in time series, and each content includes “time”, “operation type”, “shift amount”, “playback speed”, and “content ID”. , Are associated as needed.
  • the content of the transmission information is further associated with “group ID” and “transmission information”.
  • Item “Time” indicates the time when the operation of the content is performed.
  • the item “operation type” indicates the type (operation content) of the operation.
  • the item “shift amount” indicates the amount of change in the music playback time based on the music playback information generated by the music playback information generation unit 16a.
  • the item “reproduction speed” indicates the reproduction speed of the music based on the music reproduction information generated by the music reproduction information generation unit 16a.
  • Item “Group ID” indicates content (transmission information) that is continuously output.
  • the item “content ID” is a code for identifying the content of the song or the transmission information, and the item “transmission information” indicates the content of the content of the transmission information.
  • time table 34 shown in the figure is generated based on the voice guidance list 31, the play list 32, and the content metadata 33 shown in FIGS.
  • voice guidance is provided at time “15:02:02”. Do “3 o'clock”. Since this voice guidance has an importance level of 0 and the transmission time and transmission information can be edited, the transmission information is edited along with the setting of the transmission time.
  • the transmission information “Dai.” Corresponding to a part of the voice guidance is edited to “Now”. It is also possible to edit the voice guidance of “3 o'clock” as “3:02” according to the actual transmission time.
  • the voice guidance “Right” (length: 1.5 seconds), which cannot be changed, is inserted, so the time “15:05:01”
  • the volume of the song is gradually reduced to 59 ”(2 seconds before the start of transmission), and the volume of the song is gradually increased at time“ 15:06:05 ”(2.5 seconds after the end of the transmission).
  • the song with the content ID “12711” ends earlier (310 seconds after the start of playback) due to the shortening of the playback time, and before the next song starts, importance 1 Insert the voice guidance “It is about 2.5 km ahead”.
  • This voice guidance starts at the time “15:07:21”, but is transmitted a little later than the scheduled time “15:06:10”, so the distance information “3 km away” is “2.5 km”. It has been changed to "Kilometer ahead”. Subsequently, playback of the song content (content ID “23455”) in the song order “5” is started, but since an audio guidance of importance level 2 that cannot change the transmission time is scheduled (not shown), the intro of the song Reduce the part by 5 seconds.
  • the playback time of the song is adjusted, and for voice guidance with low importance, the voice guidance between the songs is adjusted as much as possible by adjusting the voice guidance transmission time and transmission information. I do.
  • voice guidance can be given avoiding the chorus part of the song. Yes.
  • the voice output device 1 determines that the voice guidance transmission time needs to be changed according to the road conditions and the traveling speed (S01: Yes)
  • the voice output list 31 edits the voice guidance list 31 (S02), and further performs the voice guidance.
  • the time table 34 is edited (S03).
  • the playlist 32 is edited (S05), and the time table 34 is updated along with the editing of the playlist 32. Edit (S03). That is, when the voice guidance list 31 or the time table 34 needs to be changed, the time table 34 is updated as needed.
  • the audio output device 1 of the present embodiment in order to adjust the reproduction time of a song, the transmission time of voice guidance, and the transmission information so that the timing of performing voice guidance is between songs, It is possible to prevent the guidance from interfering with music appreciation.
  • the voice guidance adjusts the transmission information with the adjustment of the transmission time, so there is no inaccurate content.
  • the music playback information generating unit 16a generates the music playback information that specifies the playback time of the music, but the music order may also be specified.
  • the order of the songs in the selected playlist 32 may be changed, or the songs to be played and their order may be determined from all the song contents existing in the content DB 22.
  • the playlist generating unit 15 can be omitted from the control configuration of the audio output device 1 (see FIG. 1).
  • the in-vehicle audio output device 1 having an audio player function and a car navigation function has been exemplified.
  • a time signal is provided in a broadcasting station that continuously reproduces music (music) such as cable broadcasting.
  • the present invention can also be applied when inserting traffic information or traffic information.
  • the length of the time signal and traffic information and the insertion timing thereof are defined in advance, and it is assumed that the voice guidance list in this embodiment can be created. Based on this, it is possible to generate a time table showing the program organization.
  • emergency warnings such as earthquake warnings are inserted as emergency voice guidance with high importance when emergency warnings are entered, regardless of whether they are between songs.
  • the present invention can be applied to any device as long as it is a device that reproduces music in a situation where voice guidance is being performed, or a device that performs voice guidance in a situation where music is being reproduced. is there.
  • the content DB 22 is provided in the audio output device 1, but these may be omitted.
  • the audio output device 1 appropriately acquires content from an external device that stores the content DB 22 and performs music reproduction and audio guidance.
  • the voice output list 1 includes the voice guidance list generation unit 14 and the playlist generation unit 15. However, either one may be omitted.
  • the voice guidance list generation unit 14, the transmission time editing unit 16b, and the transmission information editing unit 16c are omitted, and the adjustment of the reproduction order and / or the reproduction time of the music without adjusting the transmission time and transmission information of the voice guidance.
  • Voice guidance may be inserted between songs as much as possible. That is, you may apply the audio
  • the voice guidance list 31 may be acquired in advance from an external device that performs voice guidance, and the time table 34 may be generated using the voice guidance list 31.
  • the time table 34 may be generated according to the time measured by a timer (not shown) in the voice output device 1.
  • the play list generation unit 15 and the music reproduction information generation unit 16a are omitted, and the voice guidance is adjusted by adjusting the voice guidance transmission time and transmission information without adjusting the reproduction order and / or reproduction time of the music. It may be inserted between songs as much as possible. That is, the voice output device 1 of the present embodiment may be applied to a voice guidance device.
  • a playlist 32 may be acquired in advance from an external device that reproduces a song, and the time table 34 may be generated using the playlist 32.
  • the time table 34 may be generated according to the time measured by a timer (not shown) in the audio output device 1.
  • each unit in the audio output device 1 shown in the above embodiment can be provided by being stored in a recording medium (not shown). That is, a program for causing a computer to function as each unit of the audio output device 1 and a recording medium on which the program is recorded are also included in the scope of rights of the present invention. Other modifications can be made as appropriate without departing from the scope of the present invention.

Landscapes

  • Engineering & Computer Science (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Automation & Control Theory (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Navigation (AREA)

Abstract

 できるだけ音楽鑑賞を妨げることなく、正確な音声案内を行うことができる音声出力装置等を提供することを課題とする。本発明の音声出力装置1は、1以上の曲を再生するオーディオプレーヤ機能と、予め定められた伝達時刻および伝達情報で音声案内を行うカーナビゲーション機能とを有し、音声案内を行うタイミングが曲間となるように、また曲間が無理な場合はサビの部分を避けて音声案内を行うように、曲の再生順序および/または再生時間と、音声案内の伝達時刻および伝達情報と、の少なくとも一方を調整したタイムテーブル34を生成する。また、生成した当該タイムテーブル34にしたがって、曲の再生および音声案内を行う。

Description

曲再生装置、音声案内装置、音声出力装置およびプログラム
 本発明は、曲の再生と、音声案内とを並行して行う曲再生装置、音声案内装置、音声出力装置およびプログラムに関する。
 従来、カーナビゲーション機能とオーディオプレーヤ機能とを有し、曲の再生と、音声案内(道案内)とを並行して行うナビゲーションシステムが知られている(例えば、特許文献1)。このナビゲーションシステムは、音声案内の優先度を判別し、優先度が高い場合は、曲再生を中断して音声案内を挿入する。また、優先度が低い場合は、再生中の曲の終了を待って音声案内を挿入する。この構成により、ドライバーにとってそれ程重要でない音声案内を曲間に行うことができ、再生中の曲を必要以上に中断させることがない、といった効果を奏する。
特開2001-116581号公報
 ところが、実際の用途を考慮すると、上記のナビゲーションシステムでは、殆どの音声案内が曲再生を中断して挿入されてしまう。例えば、カーナビゲーションでは、「300メートル先右折です。」、「まもなく右方向です。」、「右です。」など、実際に右折を行う前に複数回の音声案内が行われることが多い。上記のナビゲーションシステムでは、これらの音声案内は全て「優先度が高い」と判別されるため、曲再生が中断されてしまう。
 また、上記のナビゲーションシステムは、優先度が低い音声案内の場合、再生中の曲の終了を待って音声案内を挿入するが、例えば「3キロ先右折です。」という音声案内で、再生中の曲の終了まで残り5分の場合、曲の終了を待っている間に5分間走行が続けられてしまうので、「3キロ先右折です。」という音声案内が行われても、実際には右折ポイントまで残り500mといったこともあり得る。つまり、優先度が低い音声案内の場合は、不正確な音声案内となる虞があり、実用的ではなかった。
 本発明は、上記の問題点に鑑み、できるだけ音楽鑑賞を妨げることなく、正確な音声案内を行うことができる曲再生装置、音声案内装置、音声出力装置およびプログラムを提供することを目的とする。
 本発明の曲再生装置は、予め定められた伝達時刻に音声案内が行われている状況下で、1以上の曲を再生する曲再生手段と、曲再生手段を制御する制御手段と、を備え、制御手段は、音声案内を行うタイミングが曲間となるように、曲の再生順序および/または再生時間を調整することを特徴とする。
 この構成によれば、音声案内を行うタイミングが曲間となるように、曲(楽曲)の再生順序および/または再生時間を調整するため、音声案内が音楽鑑賞の妨げとなる可能性を低くすることができる。また、音声案内については、伝達時刻が変動しないため、不正確な(違和感のある)内容となることがない。
 なお、「曲の再生順序を調整する」とは、曲A→曲B→曲Cの順序で再生されることが予定されている場合に、曲B→曲C→曲Aの順序で再生するなど、予め規定されている再生順序を変更することを指す。また、「曲間」とは、曲と曲との間を指す。
 また、音声案内を行う手段は、曲再生装置内に設けても良いし、曲再生装置以外の外部装置内に設けても良い。後者の場合は、曲再生装置が外部装置から音声案内リストを予め取得し、当該音声案内リストに基づいて曲再生手段を制御しても良い。また、5分毎など定期的に音声案内が行われる場合は、タイマーによる計時にしたがって曲再生手段を制御しても良い。
 本発明の音声案内装置は、曲が再生されている状況下で、予め定められた伝達時刻および伝達情報で音声案内を行う音声案内手段と、音声案内手段を制御する制御手段と、を備え、制御手段は、音声案内を行うタイミングが曲間となるように、音声案内の伝達時刻および伝達情報を調整することを特徴とする。
 この構成によれば、音声案内を行うタイミングが曲間となるように、音声案内の伝達時刻および伝達情報を調整するため、音声案内が音楽鑑賞の妨げとなる可能性を低くすることができる。また、音声案内については、伝達時刻の調整と共にその伝達情報も調整するため、不正確な(違和感のある)内容となることがない。
 なお、曲を再生する手段は、音声案内装置内に設けても良いし、音声案内装置以外の外部装置内に設けても良い。後者の場合は、音声案内装置が外部装置から曲のプレイリストを予め取得し、当該プレイリストに基づいて音声案内手段を制御しても良い。また、5分毎など定期的に曲が再生される場合は、タイマーによる計時にしたがって音声案内手段を制御しても良い。
 本発明の音声出力装置は、1以上の曲を再生する曲再生手段と、予め定められた伝達時刻および伝達情報で音声案内を行う音声案内手段と、曲再生手段と、音声案内手段と、の少なくとも一方を制御する制御手段と、を備え、制御手段は、音声案内を行うタイミングが曲間となるように、曲の再生順序および/または再生時間と、音声案内の伝達時刻および伝達情報と、の少なくとも一方を調整することを特徴とする。
 この構成によれば、音声案内を行うタイミングが曲間となるように、曲再生手段および/または音声案内手段を制御するため、音声案内が音楽鑑賞の妨げとなる可能性を低くすることができる。また、音声案内については、伝達時刻を調整する場合その伝達情報も調整するため、不正確な(違和感のある)内容となることがない。
 なお、曲を再生するためのコンテンツや、音声案内を行うためのコンテンツは、音声出力装置内に設けても良いし、外部装置内に設けても良い。後者の場合は、音声出力装置が外部装置から適宜コンテンツを取得して、曲の再生や音声案内を行うこととなる。
 上記に記載の音声出力装置において、制御手段は、曲の再生時間として、曲のイントロおよび/またはエンディングの短縮量、曲間におけるクロスフェード時間、曲の再生速度、のうち、少なくとも1つを調整することが好ましい。
 この構成によれば、曲のイントロおよび/またはエンディングの短縮量、曲間におけるクロスフェード時間、曲の再生速度(曲長)により、曲の再生時間を調整することができる。
 なお、「曲の再生速度」については、曲のピッチ(音の高さ)をが変化させずにしない範囲で、調整することが好ましい。
 上記に記載の音声出力装置において、制御手段は、音声案内の伝達情報として、定められた伝達時刻と実際に音声案内を行ったタイミングとのずれ量を吸収するべく、時報案内における時刻案内情報および/または道案内における距離情報を調整することが好ましい。
 この構成によれば、時報案内における時刻案内情報や道案内における距離情報により、音声案内の伝達情報を調整することができる。また、これらの調整は、定められた伝達時刻と実際に音声案内を行ったタイミング(調整後の伝達時刻)とのずれ量を吸収するための調整であるため、伝達時刻のずれに伴う伝達情報の違和感を無くすことができる。
 上記に記載の音声出力装置において、音声案内は、その内容に応じて重要度が設定されており、制御手段は、重要度が高い音声案内については、音声案内の伝達時刻および伝達情報の調整を禁止することが好ましい。
 この構成によれば、音声案内の重要度に応じて、伝達時刻および伝達情報の調整を制限できる。例えば、道案内において、「右折です。」といった音声案内を行う場合、伝達時刻が10秒間でも遅ずれてしまうと意味が無い。この場合は、伝達情報を調整したとしても、「手前の交差点右折です。」など、道案内にふさわしくない表現となるため、伝達時刻および伝達情報が調整されないことが好ましい。
 上記に記載の音声出力装置において、1以上の音声案内が行われる場合、各音声案内は、定められた伝達時刻に従って、音声案内順序が定められており、制御手段は、重要度が低い音声案内については、音声案内順序を変更可能とすることが好ましい。
 この構成によれば、重要度が低い音声案内については、音声案内順序を変更できるため、曲中(1つの曲の、曲開始から曲終了までの間)に音声案内が行われる可能性をさらに低くすることができる。一方、重要度が高い音声案内については、音声案内順序を変更不可能とすることが好ましい。例えば、道案内が「3キロ先右折です。」、「まもなく右方向です。」の順に音声案内順序が定められている場合に、音声案内順序が逆になってしまうと、ドライバーが混乱を招いてしまう。このため、音声案内の内容(重要度)に応じて音声案内順序の変更を制限することが好ましい。
 上記に記載の音声出力装置において、音声案内は、伝達可能な時間範囲が設定されており、制御手段は、伝達可能な時間範囲内に伝達不可能な音声案内については、そのタイミングが曲の重要な部分と重ならないように重要部(サビの部分)とならないように、曲の再生順序および/または再生時間を調整することが好ましい。
 この構成によれば、音声案内は、伝達可能な時間範囲が設定されているため、極端に伝達情報が変化することを避けることができる。例えば、「3時です。」という時報を、曲間に行うために30分後先延ばしにした場合、「3時になりました。」と伝達情報を調整しても、音声案内自体があまり意味を持たなくなってしまう。このため、音声案内の内容(重要度)に応じて伝達可能な時間範囲が制限されることが好ましい。また、伝達可能な時間範囲を設定すると、その時間範囲内に音声案内を伝達できない可能性が生じるが、そのような場合でも曲の重要な部分部(所謂「サビの部分」など、印象的なの部分)と重ならないように曲の再生順序および/または再生時間を調整するため、音声案内が重要な部分サビの部分にかかることの不快感を和らげることができる。
 なお、曲の重要な部分サビの部分か否かについては、予め曲のメタデータを取得しておいて判断しても良いし、曲の解析結果に基づいて判断しても良い。
 上記に記載の音声出力装置において、音声案内は、同一のグループIDが付与された1以上の音声案内要素から成り、音声案内手段は、同一のグループIDが付与された1以上の音声案内要素を、連続して出力することが好ましい。
 この構成によれば、同一のグループIDが付与された1以上の音声案内要素を、連続して出力するため、他のグループIDが付与された音声案内要素が挿入されることがない。例えば、「まもなく右方向です。Aコンビニエンスが目印です。」という音声案内が、「まもなく」、「右方向です。」、「Aコンビニエンスが目印です。」という3つの音声案内要素から成る場合、これらの間に、「右です。」などの他の音声案内要素が挿入されると、意味が分からなくなってしまう。特に、音声案内順序を変更した場合に、このような問題が生じやすくなるため、グループIDの付与が重要となる。
 本発明のプログラムは、コンピュータを、上記に記載の曲再生装置における各手段、上記に記載の音声案内装置における各手段、または上記に記載の音声出力装置における各手段として機能させるためのものであることを特徴とする。
 このプログラムを用いることにより、できるだけ音楽鑑賞を妨げることなく、正確な音声案内を行うことができる曲再生装置、音声案内装置、音声出力装置を実現することができる。
本発明の一実施形態に係る音声出力装置の制御構成を示すブロック図である。 音声案内リストの一例を示す図である。 プレイリストの一例を示す図である。 コンテンツメタデータの一例を示す図である。 タイムテーブルの一例を示す図である。 タイムテーブルを編集するまでの処理を示すフローチャートである。
符号の説明
 1…音声出力装置 11…カーナビ操作部 12…情報取得部 13…プレーヤ操作部 14…音声案内リスト生成部 15…プレイリスト生成部 16…タイムテーブル生成部 17…音声出力部 21…コンテンツメタデータデータベース 22…コンテンツデータベース 31…音声案内リスト 32…プレイリスト 33…コンテンツメタデータ …34…タイムテーブル
 以下、本発明の一実施形態に係る曲再生装置、音声案内装置、音声出力装置およびプログラムについて、添付図面を参照しながら詳細に説明する。本実施形態では、カーナビゲーション機能(音声案内手段)とオーディオプレーヤ機能(曲再生手段)とを有し、曲の再生と、音声案内(道案内)とを並行して行う車載型の音声出力装置を例示する。
 図1は、音声出力装置1の制御構成を示すブロック図である。同図に示すように、音声出力装置1は、カーナビ操作部11、情報取得部12、プレーヤ操作部13、音声案内リスト生成部14、プレイリスト生成部15、タイムテーブル生成部16、音声出力部17、コンテンツメタデータデータベース21(以下、「コンテンツメタデータDB」と記載する)およびコンテンツデータベース22(以下、「コンテンツDB」と記載する)を備えている。
 コンテンツメタデータDB21は、曲のコンテンツや、音声案内として伝達する伝達情報のコンテンツに関連する情報をコンテンツメタデータ33(図4参照)として記憶するデータベースである。また、コンテンツDB22は、曲のコンテンツや伝達情報のコンテンツを記憶するデータベースである。
 カーナビ操作部11は、ユーザ(ドライバー)が、経路・目的地設定や、その変更操作など、カーナビゲーション機能に関する各種操作を行うためのものである。したがって、特に図示しないが、音声出力装置1は、経路誘導を行うための制御プログラムや経路表示を行うためのディスプレイも備えている。情報取得部12は、GPS(Global Positioning System)情報(位置情報および時刻情報を含む)や、道路交通情報(渋滞情報や交通規制に関する情報を含む)などを取得する。
 音声案内リスト生成部14は、カーナビ操作部11の操作結果、および情報取得部12が取得した情報に基づいて、音声案内(道案内、経路案内)を行うための音声案内リスト31(図2参照)を生成する。具体的には、目的地、音声出力装置1(これを搭載した車両)の現在位置、進行速度、現在時刻、道路状況(渋滞、工事中、順調など)等から、音声案内を行う伝達時刻とその内容(伝達情報)を決定し、音声案内リスト31を生成する。音声案内リスト31は、刻々と変化する状況に応じてリアルタイムに更新される。また、音声案内リスト31は、目的地までの全工程分を一度に生成するのではなく、現在位置から10kmの範囲など、所定の区間ごとに生成される。これにより、頻繁に行われる更新作業の負担を軽減することができる。また、音量を徐々に上げていく動作など途中で変更できない動作に影響を与える更新も制限できる。
 プレーヤ操作部13は、ユーザが、プレイリストの選択や音量・音質調整など、オーディオプレーヤ機能に関する各種操作を行うためのものである。したがって、特に図示しないが、音声出力装置1は、各種音声処理を行うためのオーディオコントロールデバイスやスピーカも備えている。プレイリスト生成部15は、プレーヤ操作部13の操作結果に基づいて、曲(音楽)を再生するためのプレイリスト32(図3参照)を生成する。
 タイムテーブル生成部16は、音声案内リスト生成部14で生成された音声案内リスト31と、プレイリスト生成部15で生成されたプレイリスト32と、に基づいて、実際に曲再生および音声案内を行うためのタイムテーブル34(図5参照)を生成する。タイムテーブル34は、できるだけ音声案内を行うタイミングが曲間となるように、また曲間が無理な場合は曲の重要な部分(以下、「サビの部分」と称する)サビの部分と重ならないように、曲の再生時間と、音声案内の伝達時刻および伝達情報と、が調整されたものである。なお、請求項における「制御手段」は、タイムテーブル生成部16によりその主要部が構成される。つまり、タイムテーブル生成部16により生成されたタイムテーブル34に基づいて、曲再生および音声案内を制御する制御装置(CPUなど,図示省略)が、請求項における「制御手段」に相当する。
 タイムテーブル生成部16は、曲再生情報生成部16a、伝達時刻編集部16bおよび伝達情報編集部16cを有している。曲再生情報生成部16aは、音声案内リスト31、プレイリスト32およびコンテンツメタデータ33に基づいて、各曲の再生時間(再生開始時刻、再生終了時刻、伸縮度、短縮度など)を規定した曲再生情報を生成する。曲再生情報は、伝達時刻を変更できない音声案内(重要度の高い音声案内)が、曲のサビの部分にかからず、且つできるだけ曲間に入るように、各曲の再生時間が調整されたものである。再生時間の調整は、曲のイントロおよび/またはエンディングの短縮量、曲間におけるクロスフェード時間、曲の再生速度などの変更によって行われる。
 伝達時刻編集部16bは、伝達時刻を変更できる音声案内の伝達時刻を編集するものである。なお、伝達時刻編集部16bも、音声案内ができるだけ曲間に入るように、各音声案内の伝達時刻を調整する。また、伝達情報編集部16cは、伝達時刻編集部16bによる伝達時刻の編集に伴って伝達情報を編集する。具体的な例については後述するが、伝達情報編集部16cは、伝達時刻編集部16bにより調整された伝達時刻のずれ量を吸収するために伝達情報を編集する。言い換えれば、伝達時刻編集部16bによる編集が行われなかった場合(伝達時刻を変更する必要が無かった場合)、伝達情報編集部16cによる編集は行われない。
 音声出力部17は、タイムテーブル生成部16で生成されたタイムテーブル34に基づいて、曲の再生(音楽の出力)と、音声案内の伝達(伝達情報の出力)と、を行うものである。なお、音声出力部17は、上記のスピーカに音声を出力する。
 次に、図2ないし図5を参照し、音声案内リスト31、プレイリスト32、コンテンツメタデータ33およびタイムテーブル34の具体例について説明する。図2は、音声案内リスト31の一例を示す図である。音声案内リスト31は、音声案内毎に、伝達可能範囲の「開始時刻」および「終了時刻」と、「重要度」と、「グループID」と、が関連付けられている。図2では、「3時です。」、「まもなく右方向です。Aコンビニエンスが目印です。」、「右です。」、「およそ3キロ先左方向です。」の4つの音声案内が例示されている。また、各音声案内は、1以上の伝達情報(音声案内要素)から成る。例えば、音声案内「3時です。」は、「3時」と、「です。」の2つの伝達情報から成る。各伝達情報には、「編集禁止」と、「コンテンツID」と、が関連付けられている。
 項目「開始時刻」および「終了時刻」は、その音声案内を行い得る伝達可能範囲を示している。また、「重要度」は、音声案内の内容に応じて3段階に分類される。重要度0は、最も重要度が低く、音声案内順序を自由に調整可能な音声案内を指す。音声案内順序とは、各音声案内の伝達可能範囲を示す「開始時刻」または「終了時刻」に準じて定められた順序であり、図2の例では、1.「3時です。」、2.「まもなく右方向です。Aコンビニエンスが目印です。」、3.「右です。」、4.「およそ3キロ先左方向です。」が音声案内順序となる。つまり、重要度0の音声案内(「3時です。」)は、音声案内「まもなく右方向です。」や「およそ3キロ先左方向です。」の後に伝達されても良いことを意味する。また、重要度0の音声案内は、(伝達時刻の編集は可能ですが、伝達情報の編集は必ずしも可能ではありません。伝達情報編集の可否は項目「編集禁止」に記載されている内容によります)伝達時刻編集部16bおよび伝達情報編集部16cによる編集が可能である。音声案内リスト31でにおいては、伝達可能範囲の「開始時刻」に音声案内を行うものとして伝達情報が設定されている。但し、重要度0の音声案内であっても、伝達可能範囲が定められているため、伝達時刻の変更は当該伝達可能範囲に制限される。この制限により、曲間に音声案内を挿入できない場合は、以下に示す重要度2の音声案内と同様に、曲中に音声案内を挿入する。
 また、重要度1は、重要度0より重要度が高く、音声案内順序を自由に調整することはできないが、伝達可能範囲に幅がある音声案内を指す。(この例では、たまたま伝達可能範囲は狭くなっているが必ずそうであるとは限らない。)但し、重要度1の音声案内は、重要度0の音声案内よりも伝達可能範囲が短くなっている。例えば、音声案内「およそ3キロ先左方向です。」は、伝達可能範囲が2分間であるから、この範囲であれば、伝達情報の調整も含めて伝達時刻の調整が可能である。なお、重要度1の音声案内も、伝達可能範囲における曲間に音声案内を挿入できない場合は、以下に示す重要度2の音声案内と同様に、曲中に音声案内を挿入する。
 また、重要度2は、最も重要度が高く、音声案内順序を自由に調整することができず、且つ伝達可能範囲に幅がない音声案内を指す。つまり、重要度2の音声は、必ずその伝達時刻に音声案内が行われ、伝達時刻編集部16bおよび伝達情報編集部16cによる編集が不可能となっている。なお、重要度2の音声案内は、その前後で曲の音量をフェードアウト、フェードインする。これにより、音声案内を聞き取り易くすることができる。なお、音量をフェードアウト/フェードインするのではなく、重要度2の音声案内出力中は、曲の再生を一時停止して音声案内出力が終了したら再開する再開中断するようにしても良い。
 項目「グループID」は、音声案内毎に設定されたものであり、音声案内を構成する1以上の伝達情報には、同一のグループIDが付与されている。この同一のグループIDが付与された1以上の伝達情報は、連続して出力される。これにより、他のグループIDが付与された伝達情報の挿入を禁止することができる。例えば、「まもなく右方向です。Aコンビニエンスが目印です。」という音声案内の間に、「3時です。」などの他のグループIDの伝達情報が挿入されると、意味が分からなくなってしまう。特に、重要度0の音声案内は、音声案内順序が変更可能であるため、グループIDの付与により、確実に上記の問題を解決することができる。
 項目「編集禁止」は、編集可能な伝達情報であるか否かを示している。ここでは、「0」の場合、伝達情報編集部16cによる編集が可能であり、「1」の場合、伝達情報編集部16cによる編集が不可能であることを意味している。項目「コンテンツID」は、各伝達情報を識別するためのコードである。
 続いて、図3を参照し、プレイリスト32について説明する。プレイリスト32は、曲のコンテンツ毎に、「曲順」と、「コンテンツID」と、「長さ」とを関連付けたものである。項目「曲順」は、曲を再生する順序を指し、本実施形態では、曲順の入れ替えは行わない(プレイリスト32の曲順にしたがって曲を再生する)ものとする。また、項目「コンテンツID」は、各曲を識別するためのコードであり、上記の伝達情報のコンテンツIDと重複を避けるため、桁数が異なっている。また、項目「長さ」は、曲長を秒単位で示したものである。なお、項目(「長さ」は、通常コンテンツメタデータに含まれるため、プレイリスト32から省略しても良い。あるので必ずしも必要でない)
 続いて、図4を参照し、コンテンツメタデータ33について説明する。コンテンツメタデータ33は、各コンテンツ(曲または伝達情報)の、「コンテンツID」と、「種別」と、「長さ」とが関連付けられている。また、「種別」が「曲」のコンテンツについては、さらに「イントロ」と、「エンディング」と、「サビ開始」と、「サビ終了」と、が関連付けられている。項目「イントロ」および「エンディング」は、それぞれイントロの長さおよびエンディングの長さを秒単位で示したものである。また、項目「サビ開始」および「サビ終了」は、それぞれ曲の開始からサビの開始および終了までの時間を秒単位で示したものである。なお、「種別」が「曲」のコンテンツに関連付けられたこれらの項目は、曲のコンテンツがコンテンツDB22に記録(保存)されたときに、周知の音楽解析技術によって、抽出され、コンテンツメタデータDB21に書き込まれた情報である。また、「種別」が「曲」以外のコンテンツ(「時報」、「案内」、「距離」など)については、さらに「伝達情報」が関連付けられている。
 続いて、図5を参照し、タイムテーブル34について説明する。タイムテーブル34は、時系列にしたがって動作対象となるコンテンツが並べられ、各コンテンツは、「時刻」と、「動作種別」と、「シフト量」と、「再生速度」と、「コンテンツID」と、が必要に応じて関連付けられている。また、伝達情報のコンテンツは、さらに「グループID」と、「伝達情報」と、が関連付けられている。
 項目「時刻」は、そのコンテンツの動作が行われる時刻を示している。項目「動作種別」は、その動作の種別(動作内容)を示している。項目「シフト量」は、曲再生情報生成部16aにより生成された曲再生情報に基づく、曲の再生時間の変更量を示している。また、項目「再生速度」は、曲再生情報生成部16aにより生成された曲再生情報に基づく、曲の再生速度を示している。
 項目「グループID」は、連続して出力されるコンテンツ(伝達情報)を示している。項目「コンテンツID」は、曲または伝達情報のコンテンツを識別するコードであり、項目「伝達情報」は、伝達情報のコンテンツの内容を示している。
 ここで、図5に示したタイムテーブル34に基づく、一連の音声出力動作について説明する。なお、同図のタイムテーブル34は、図2ないし図4に示した音声案内リスト31、プレイリスト32およびコンテンツメタデータ33に基づいて生成されたものとする。まず、時刻「15:02:02」に、プレイリスト32中の曲順「3」の曲コンテンツ(コンテンツID「35680」)の再生が終了すると、時刻「15:02:04」に、音声案内「3時になりました。」を行う。この音声案内は、重要度0であり、伝達時刻および伝達情報の編集が可能であるため、伝達時刻の設定に伴って伝達情報が編集される。ここでは、伝達時刻が午後3時を過ぎているため、音声案内の一部に相当する伝達情報(時刻案内情報)「です。」が「なりました。」に編集されている。なお、元々「3時です。」の音声案内を、実際の伝達時刻に合わせて「3時2分です。」と編集することも可能である。
 続いて、時刻「15:02:10」に、曲順「4」の曲コンテンツ(コンテンツID「12711」)の再生を開始するが、ここでは再生速度が1.24倍に設定されている。この再生速度の変更は、時刻「15:05:48」に、伝達時刻を変更できない重要度2の音声案内「まもなく右方向です。Aコンビニエンスが目印です。」および「右です。」を曲のサビの部分を避けて挿入するためである。なお、曲順「4」の曲コンテンツは、曲の長さが384秒であるため、再生速度の変更に伴い、曲の長さが約310秒に変更される。また、音声案内「まもなく右方向です。Aコンビニエンスが目印です。」は、約5秒の長さを要するが(図4参照)、これを挿入するために、時刻「15:05:46」に(伝達開始の2秒前)に曲の音量を徐々に下げ、時刻「15:05:55」に(伝達終了の2秒後)に曲の音量を徐々に上げる。
 また、時刻「15:06:01」には、同じく伝達時刻を変更できない重要度2の音声案内「右です。」(長さ:1.5秒)を挿入するため、時刻「15:05:59」に(伝達開始の2秒前)に曲の音量を徐々に下げ、時刻「15:06:05」に(伝達終了の2.5秒後)に曲の音量を徐々に上げる。その後、時刻「15:07:20」にコンテンツID「12711」の曲が、再生時間短縮により早め(再生開始から310秒後)に終了し、次の曲が始まるまでの間に、重要度1の音声案内「およそ2.5キロ先左方向です。」を挿入する。この音声案内は、時刻「15:07:21」に開始されるが、予定時刻「15:06:10」から少々遅れて伝達されているため、距離情報「3キロ先」が「2.5キロ先」に変更されている。続いて、曲順「5」の曲コンテンツ(コンテンツID「23455」)の再生を開始するが、伝達時刻を変更できない重要度2の音声案内が予定されているため(図示省略)、曲のイントロ部分を5秒短縮する。
 このように、重要度の高い音声案内については、曲の再生時間を調整し、重要度の低い音声案内については、音声案内の伝達時刻および伝達情報を調整することで、できるだけ曲間に音声案内を行う。また、曲間に音声案内を行うことが無理な場合でも、曲のメタデータに基づいて再生時間を調整することで、曲のサビの部分を避けて音声案内を行うことができるようになっている。
 次に、図6のフローチャートを参照し、タイムテーブル34を編集するまでの処理について説明する。音声出力装置1は、道路状況や進行速度に応じて、音声案内の伝達時刻の変更が必要と判定した場合は(S01:Yes)、音声案内リスト31を編集し(S02)、さらに当該音声案内リスト31の編集に伴って、タイムテーブル34を編集する(S03)。一方、ユーザの操作等により、プレイリストの変更が必要と判定した場合は(S04:Yes)、プレイリスト32を編集し(S05)、さらに当該プレイリスト32の編集に伴って、タイムテーブル34を編集する(S03)。つまり、音声案内リスト31またはタイムテーブル34の変更が必要となった場合、タイムテーブル34は随時更新される。
 以上説明したとおり、本実施形態の音声出力装置1によれば、音声案内を行うタイミングが曲間となるように、曲の再生時間や、音声案内の伝達時刻および伝達情報を調整するため、音声案内が音楽鑑賞の妨げとなることを防止することができる。また、音声案内については、伝達時刻の調整に伴ってその伝達情報も調整するため、不正確な内容となることがない。
 なお、上記の実施形態では、曲再生情報生成部16aにおいて、曲の再生時間を規定した曲再生情報を生成するものとしたが、曲順についても規定できるようにしても良い。この場合、選択されたプレイリスト32の中で曲順を変更しても良いし、コンテンツDB22に存在する全ての曲コンテンツの中から、再生する曲とその順序を決定しても良い。後者の場合は、音声出力装置1の制御構成(図1参照)からプレイリスト生成部15を省略可能である。
 また、上記の実施形態では、オーディオプレーヤ機能とカーナビゲーション機能とを有する車載型の音声出力装置1を例示したが、有線放送などのように、曲(音楽)を再生し続ける放送局において、時報や交通情報などを挿入する場合にも、本発明を適用可能である。この場合、時報や交通情報の長さ、およびその挿入タイミングが予め規定されており、本実施形態における音声案内リストを作成できることが前提となるが、当該音声案内リストと、曲のプレイリストとに基づいて番組編成を示すタイムテーブルを生成することが可能である。また、地震速報などの緊急速報は、重要度が高い音声案内として、曲間であるか否かに関わらず、緊急速報が入ったときに挿入されることが好ましい。その他、音声案内が行われている状況下で曲を再生する装置、または曲が再生されている状況下で、音声案内を行う装置であれば、その種類を問わず、本発明を適用可能である。
 また、上記の実施形態では、音声出力装置1内にコンテンツDB22を備えた構成であるものとしたが、これらを省略しても良い。この場合、音声出力装置1は、コンテンツDB22を格納した外部装置から適宜コンテンツを取得して、曲の再生や音声案内を行うこととなる。
 また、上記の実施形態では、音声出力装置1内に音声案内リスト生成部14と、プレイリスト生成部15とを備えた構成であるものとしたが、いずれか一方を省略しても良い。例えば、音声案内リスト生成部14、伝達時刻編集部16bおよび伝達情報編集部16cを省略し、音声案内の伝達時刻および伝達情報を調整することなく、曲の再生順序および/または再生時間の調整によって、音声案内をできるだけ曲間に挿入するようにしても良い。つまり、本実施形態の音声出力装置1を曲再生装置に適用しても良い。この場合、音声案内を行う外部装置から、音声案内リスト31を予め取得しておき、当該音声案内リスト31を利用してタイムテーブル34を生成しても良い。また、5分毎など定期的に音声案内が行われる場合は、音声出力装置1内のタイマー(図示省略)による計時にしたがってタイムテーブル34を生成しても良い。
 また、プレイリスト生成部15および曲再生情報生成部16aを省略し、曲の再生順序および/または再生時間を調整することなく、音声案内の伝達時刻および伝達情報を調整することによって、音声案内をできるだけ曲間に挿入するようにしても良い。つまり、本実施形態の音声出力装置1を音声案内装置に適用しても良い。この場合、曲を再生する外部装置から、プレイリスト32を予め取得しておき、当該プレイリスト32を利用してタイムテーブル34を生成しても良い。また、5分毎など定期的に曲が再生される場合は、音声出力装置1内のタイマー(図示省略)による計時にしたがってタイムテーブル34を生成しても良い。
 また、上記の実施形態に示した音声出力装置1における各部をプログラムとして提供することも可能である。また、そのプログラムを記録媒体(図示省略)に格納して提供することも可能である。すなわち、コンピュータを、音声出力装置1の各部として機能させるためのプログラム、およびそれを記録した記録媒体も、本発明の権利範囲に含まれるものである。その他、本発明の要旨を逸脱しない範囲で、適宜変更が可能である。

Claims (10)

  1.  予め定められた伝達時刻に音声案内が行われている状況下で、1以上の曲を再生する曲再生手段と、
     前記曲再生手段を制御する制御手段と、を備え、
     前記制御手段は、前記音声案内を行うタイミングが曲間となるように、前記曲の再生順序および/または再生時間を調整することを特徴とする曲再生装置。
  2.  曲が再生されている状況下で、予め定められた伝達時刻および伝達情報で音声案内を行う音声案内手段と、
     前記音声案内手段を制御する制御手段と、を備え、
     前記制御手段は、前記音声案内を行うタイミングが曲間となるように、前記音声案内の伝達時刻および伝達情報を調整することを特徴とする音声案内装置。
  3.  1以上の曲を再生する曲再生手段と、
     予め定められた伝達時刻および伝達情報で音声案内を行う音声案内手段と、
     前記曲再生手段と、前記音声案内手段と、の少なくとも一方を制御する制御手段と、を備え、
     前記制御手段は、前記音声案内を行うタイミングが曲間となるように、前記曲の再生順序および/または再生時間と、前記音声案内の伝達時刻および伝達情報と、の少なくとも一方を調整することを特徴とする音声出力装置。
  4.  前記制御手段は、前記曲の再生時間として、前記曲のイントロおよび/またはエンディングの短縮量、曲間におけるクロスフェード時間、前記曲の再生速度、のうち、少なくとも1つを調整することを特徴とする請求項3に記載の音声出力装置。
  5.  前記制御手段は、前記音声案内の伝達情報として、前記定められた伝達時刻と実際に音声案内を行ったタイミングとのずれ量を吸収するべく、時報案内における時刻案内情報および/または道案内における距離情報を調整することを特徴とする請求項3に記載の音声出力装置。
  6.  前記音声案内は、その内容に応じて重要度が設定されており、
     前記制御手段は、重要度が高い音声案内については、前記音声案内の伝達時刻および伝達情報の調整を禁止することを特徴とする請求項3に記載の音声出力装置。
  7.  1以上の前記音声案内が行われる場合、各音声案内は、前記定められた伝達時刻に従って、音声案内順序が定められており、
     前記制御手段は、重要度が低い音声案内については、前記音声案内順序を変更可能とすることを特徴とする請求項6に記載の音声出力装置。
  8.  前記音声案内は、伝達可能な時間範囲が設定されており、
     前記制御手段は、前記伝達可能な時間範囲内に伝達不可能な音声案内については、そのタイミングが前記曲のサビの部分とならないように重要な部分と重ならないように、前記曲の再生順序および/または再生時間を調整することを特徴とする請求項3に記載の音声出力装置。
  9.  前記音声案内は、同一のグループIDが付与された1以上の音声案内要素から成り、
     前記音声案内手段は、前記同一のグループIDが付与された1以上の音声案内要素を、連続して出力することを特徴とする請求項3に記載の音声出力装置。
  10.  コンピュータを、請求項1に記載の曲再生装置における各手段、請求項2に記載の音声案内装置における各手段、または請求項3に記載の音声出力装置における各手段として機能させるためのプログラム。
PCT/JP2008/001290 2008-05-23 2008-05-23 曲再生装置、音声案内装置、音声出力装置およびプログラム WO2009141853A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2010512852A JPWO2009141853A1 (ja) 2008-05-23 2008-05-23 曲再生装置、音声案内装置、音声出力装置およびプログラム
PCT/JP2008/001290 WO2009141853A1 (ja) 2008-05-23 2008-05-23 曲再生装置、音声案内装置、音声出力装置およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2008/001290 WO2009141853A1 (ja) 2008-05-23 2008-05-23 曲再生装置、音声案内装置、音声出力装置およびプログラム

Publications (1)

Publication Number Publication Date
WO2009141853A1 true WO2009141853A1 (ja) 2009-11-26

Family

ID=41339828

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2008/001290 WO2009141853A1 (ja) 2008-05-23 2008-05-23 曲再生装置、音声案内装置、音声出力装置およびプログラム

Country Status (2)

Country Link
JP (1) JPWO2009141853A1 (ja)
WO (1) WO2009141853A1 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010079091A (ja) * 2008-09-26 2010-04-08 Toshiba Corp 音声出力装置、音声出力方法及びプログラム
JP2012190152A (ja) * 2011-03-09 2012-10-04 Denso Corp 車載情報報知装置
JP2013195105A (ja) * 2012-03-16 2013-09-30 Yupiteru Corp 制御システム及びプログラム
JP2014025780A (ja) * 2012-07-26 2014-02-06 Clarion Co Ltd 車載装置
JP2016224318A (ja) * 2015-06-02 2016-12-28 アイシン・エィ・ダブリュ株式会社 音声再生制御システム、方法およびプログラム
WO2018211748A1 (ja) * 2017-05-16 2018-11-22 ソニー株式会社 情報処理装置および情報処理方法
CN112241248A (zh) * 2019-07-19 2021-01-19 本田技研工业株式会社 信息提供装置、信息提供方法及存储介质
CN112857392A (zh) * 2021-02-25 2021-05-28 北京百度网讯科技有限公司 导航语音播报方法、装置、设备以及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10104010A (ja) * 1996-09-30 1998-04-24 Mazda Motor Corp ナビゲーション装置
JP2001116581A (ja) * 1999-10-20 2001-04-27 Alpine Electronics Inc ナビゲーションシステム
JP2004117176A (ja) * 2002-09-26 2004-04-15 Denso Corp ナビゲーション装置
JP2004361299A (ja) * 2003-06-06 2004-12-24 Sony Corp ナビゲーション装置及びナビゲーション装置におけるガイド方法
JP2007127599A (ja) * 2005-11-07 2007-05-24 Matsushita Electric Ind Co Ltd ナビゲーション装置
JP2008122495A (ja) * 2006-11-09 2008-05-29 Aisin Aw Co Ltd オーディオ連携経路案内システム及びオーディオ連携経路案内方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10104010A (ja) * 1996-09-30 1998-04-24 Mazda Motor Corp ナビゲーション装置
JP2001116581A (ja) * 1999-10-20 2001-04-27 Alpine Electronics Inc ナビゲーションシステム
JP2004117176A (ja) * 2002-09-26 2004-04-15 Denso Corp ナビゲーション装置
JP2004361299A (ja) * 2003-06-06 2004-12-24 Sony Corp ナビゲーション装置及びナビゲーション装置におけるガイド方法
JP2007127599A (ja) * 2005-11-07 2007-05-24 Matsushita Electric Ind Co Ltd ナビゲーション装置
JP2008122495A (ja) * 2006-11-09 2008-05-29 Aisin Aw Co Ltd オーディオ連携経路案内システム及びオーディオ連携経路案内方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010079091A (ja) * 2008-09-26 2010-04-08 Toshiba Corp 音声出力装置、音声出力方法及びプログラム
JP2012190152A (ja) * 2011-03-09 2012-10-04 Denso Corp 車載情報報知装置
JP2013195105A (ja) * 2012-03-16 2013-09-30 Yupiteru Corp 制御システム及びプログラム
JP2014025780A (ja) * 2012-07-26 2014-02-06 Clarion Co Ltd 車載装置
JP2016224318A (ja) * 2015-06-02 2016-12-28 アイシン・エィ・ダブリュ株式会社 音声再生制御システム、方法およびプログラム
WO2018211748A1 (ja) * 2017-05-16 2018-11-22 ソニー株式会社 情報処理装置および情報処理方法
CN112241248A (zh) * 2019-07-19 2021-01-19 本田技研工业株式会社 信息提供装置、信息提供方法及存储介质
CN112857392A (zh) * 2021-02-25 2021-05-28 北京百度网讯科技有限公司 导航语音播报方法、装置、设备以及存储介质

Also Published As

Publication number Publication date
JPWO2009141853A1 (ja) 2011-09-22

Similar Documents

Publication Publication Date Title
WO2009141853A1 (ja) 曲再生装置、音声案内装置、音声出力装置およびプログラム
JP4563106B2 (ja) 車載機及びその音声出力方法
US8035023B2 (en) Predictive environment music playlist selection
KR100921584B1 (ko) 탑재식 음악 재생 장치 및 음악 정보 분배 시스템
JP3946917B2 (ja) ナビゲーションシステム
KR100922458B1 (ko) 차량용 악음 발생 장치, 악음 발생 방법 및 프로그램을기록한 컴퓨터로 판독가능한 기록 매체
JP2009161049A (ja) 車載用電子システム、表示方法及び表示プログラム
JP2008203338A (ja) 楽音発生装置及び楽音発生方法
JP2007157284A (ja) 音声データ再生方法およびプログラム
JP2008014711A (ja) コンテンツデータ管理装置およびナビゲーション装置
JP2010112762A (ja) ナビゲーション装置およびナビゲーション装置の音楽再生方法
WO2009139022A1 (ja) 音声出力装置およびプログラム
JP4200125B2 (ja) 移動体用コンテンツ再生装置及び移動体
JP2006293697A (ja) 車載用音楽装置
JP2006293697A5 (ja)
JP4042535B2 (ja) 車載情報提供装置
JP2007127599A (ja) ナビゲーション装置
JP6589388B2 (ja) 音声再生制御システム、方法およびプログラム
JP2005135519A (ja) 音楽再生装置
JP4042622B2 (ja) 経路探索装置
JP3341388B2 (ja) カラオケ装置
JP2011095142A (ja) ナビゲーション装置
JP4067795B2 (ja) ナビゲーション装置及び経路案内方法
JP2008293617A (ja) 音声再生装置およびその制御方法ならびに音声再生装置用プログラム
JP2005037142A (ja) 車載システム

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 08763899

Country of ref document: EP

Kind code of ref document: A1

DPE1 Request for preliminary examination filed after expiration of 19th month from priority date (pct application filed from 20040101)
WWE Wipo information: entry into national phase

Ref document number: 2010512852

Country of ref document: JP

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 08763899

Country of ref document: EP

Kind code of ref document: A1