WO2020066825A1 - 音声メッセージシステム、サーバ装置、サーバ装置の情報処理方法、プログラム、および音声メッセージのデータ構造 - Google Patents

音声メッセージシステム、サーバ装置、サーバ装置の情報処理方法、プログラム、および音声メッセージのデータ構造 Download PDF

Info

Publication number
WO2020066825A1
WO2020066825A1 PCT/JP2019/036724 JP2019036724W WO2020066825A1 WO 2020066825 A1 WO2020066825 A1 WO 2020066825A1 JP 2019036724 W JP2019036724 W JP 2019036724W WO 2020066825 A1 WO2020066825 A1 WO 2020066825A1
Authority
WO
WIPO (PCT)
Prior art keywords
information
attribute
server device
terminal
position information
Prior art date
Application number
PCT/JP2019/036724
Other languages
English (en)
French (fr)
Inventor
郷 柴田
Original Assignee
日本電気株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電気株式会社 filed Critical 日本電気株式会社
Priority to JP2020548588A priority Critical patent/JP7099534B2/ja
Priority to US17/279,290 priority patent/US20220007134A1/en
Publication of WO2020066825A1 publication Critical patent/WO2020066825A1/ja
Priority to JP2022104792A priority patent/JP7294506B2/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/021Services related to particular areas, e.g. point of interest [POI] services, venue services or geofences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/023Services making use of location information using mutual or relative location information between multiple location based services [LBS] targets or of distance thresholds

Definitions

  • the present invention relates to a voice message system, a server device, an information processing method of a server device, a program, and a data structure of a voice message, and particularly to a voice message system of voice guidance in a pre-motivation region, a server device, and an information processing method of a server device. , Programs, and voice message data structures.
  • Patent Document 1 discloses a technology for outputting the contents of an advertisement by voice.
  • audio information may be delivered to terminals. However, even if the terminal holder recognizes the information, the terminal holder may not show willingness to the information.
  • the present invention has been made in view of the above circumstances, and an object of the present invention is to make a holder of a terminal motivated by the information when audio information is distributed to the terminal.
  • the first aspect relates to a voice messaging system.
  • the voice message system according to the first aspect, A server device, And a terminal, The server device, Location information of the terminal, or location information acquisition means for acquiring individual location information, Selecting means for selecting a jingle using the acquired position information, Determining means for determining playback audio information using the obtained position information, Transmitting means for generating audio information to be reproduced in the order of the jingle and the reproduced audio information, and transmitting the generated audio information to the terminal,
  • the terminal is Means for transmitting position information to the server device; Means for receiving the audio information from the server device, Output means for receiving the audio information and outputting the audio information.
  • a second aspect relates to a server device.
  • the server device according to the second aspect, Location information acquisition means for acquiring the location information of the terminal, or personal location information, Selecting means for selecting a jingle using the acquired position information, Determining means for determining playback audio information using the obtained position information, Audio reproduction control means for generating audio information so as to reproduce the jingle and the reproduction audio information in order, and causing the terminal to reproduce the generated audio information.
  • a third aspect relates to an information processing method executed by at least one computer.
  • the information processing method according to the third aspect includes: The server device is Obtain terminal location information or personal location information, Select a jingle using the acquired location information, Using the obtained position information to determine playback audio information, Generating audio information so as to reproduce in the order of the jingle and the reproduction audio information, and causing the terminal to reproduce the generated audio information.
  • a fourth aspect relates to the data structure of the voice message.
  • the data structure of the voice message according to the fourth aspect is: A data structure of a voice message generated to be played on a terminal, The voice message is Jingle selected using the terminal location information, or personal location information, And playback audio information determined using the position information, in this order, and is played back in this order,
  • the reproduced audio information further includes: Information on contents that can be experienced by an individual in relation to the location information, And information specifying the facility indicated by the position information in this order, and are reproduced in this order.
  • a program that causes at least one computer to execute the method of the third aspect may be used, or a computer-readable recording medium that stores such a program. You may.
  • This recording medium includes a non-transitory tangible medium.
  • This computer program when executed by a computer, includes computer program code that causes the computer to execute the information processing method on a server device.
  • various components of the present invention do not necessarily need to be individually independent, and a plurality of components are formed as one member, and one component is formed of a plurality of members. Or some component may be a part of another component, or some of the component may overlap with some of the other component.
  • a plurality of procedures of the method and the computer program of the present invention are not limited to being executed at different timings. Therefore, another procedure may occur during the execution of a certain procedure, or some or all of the execution timing of a certain procedure and the execution timing of another procedure may overlap.
  • a voice message system when voice information is delivered to a terminal, a voice message system, a server device, an information processing method of a server device, a program, and data of a voice message for giving a desire to the information to a holder of the terminal Structure can be provided.
  • FIG. 4 is a diagram illustrating an example of a data structure of a position information storage unit.
  • FIG. 3 is a diagram illustrating a data structure of audio data.
  • FIG. 3 is a functional block diagram illustrating a logical configuration of the server device.
  • FIG. 3 is a diagram illustrating an example of a data structure of a jingle storage unit. It is a functional block diagram which shows the structure of a terminal logically.
  • FIG. 11 is a block diagram illustrating an example of a configuration of a computer that implements a server device or a terminal. 9 is a flowchart illustrating an example of an operation of the server device.
  • FIG. 4 is a flowchart illustrating an example of an operation of the terminal. It is a functional block diagram which shows the structure of a server apparatus logically.
  • FIG. 3 is a diagram illustrating an example of a data structure of an action history storage unit and a reproduced voice information storage unit.
  • FIG. 11 is a diagram illustrating another example of the data structure of the action history storage unit.
  • FIG. 2 is a functional block diagram illustrating a logical configuration according to the first exemplary embodiment.
  • FIG. 1 is a diagram conceptually showing a configuration of a voice message system 1 according to an embodiment of the present invention.
  • the voice message system 1 includes a server device 100 and a terminal 200.
  • the server device 100 causes the terminal 200 that has entered the communication range 52 of the beacon transmitter 50 to reproduce and output a voice message according to the situation.
  • the beacon transmitter 50 may transmit a beacon by communication conforming to the Bluetooth (registered trademark) standard, or may be an access point (wireless LAN (Local Area Network) communication, so-called Wi-Fi (Wireless Fidelity) communication). (Not shown) for transmitting a beacon.
  • Bluetooth registered trademark
  • Wi-Fi Wireless Fidelity
  • the beacon includes position information, and the terminal 200 may acquire the position information from the beacon and transmit the acquired position information to the server device 100.
  • the beacon may include identification information such as an IP (Internet @ Protocol) address instead of location information.
  • IP Internet @ Protocol
  • the server device 100 stores identification information and position information in the position information storage unit 114 in association with each other.
  • the terminal 200 may transmit the identification information acquired from the beacon to the server device 100, and the server device 100 may specify the position information from the identification information.
  • the beacon transmitter 50 transmits a beacon including information that can specify positional information around the beacon.
  • the position information storage unit 114 may store identification information in association with information indicating a facility or a zone, as shown in FIG.
  • acquisition means that the own device goes to get data or information stored in another device or a storage medium (active acquisition), for example, requests or inquires of another device.
  • the beacon may not include any of the position information and the identification information.
  • the terminal 200 may acquire position information using a GPS (Global Positioning System) receiving function of the terminal 200 and transmit the position information of the terminal 200 to the server device 100, with the reception of the beacon as a trigger.
  • the terminal 200 notifies the server device 100 of the reception of the beacon by using the reception of the beacon as a trigger, and upon receiving the notification, the server device 100 transmits the terminal to a mobile phone network (not shown), for example.
  • the position information of the terminal 200 may be specified based on the information of the position registration of the terminal 200.
  • the terminal 200 is a terminal held by an individual (user U1) or located around the individual.
  • the terminal 200 may be a property of an individual, or may be lent to an individual.
  • the terminal 200 is, for example, a smartphone, a tablet terminal, a notebook personal computer, a mobile phone, a PHS (Personal Handyphone System), a PDA (Personal Digital Assistants), a wearable terminal, a portable digital music player, a portable video player, a portable game machine, and a portable.
  • the terminal is not particularly limited as long as it is a portable or wearable terminal including a television receiver or the like and having a function of outputting sound.
  • the terminal 200 may be an earphone device specialized for outputting a voice message, a so-called guide terminal, or a voice output terminal dedicated to the present system.
  • the terminal 200 is a transportation device (for example, a vehicle, a car, a two-wheeled vehicle, a bicycle, a train, a bus, a rear car, a rickshaw, a ship (ship and other watercraft), an airplane, a rocket, and a satellite used by the user U1. , Drones, balloons, etc.).
  • a transportation device for example, a vehicle, a car, a two-wheeled vehicle, a bicycle, a train, a bus, a rear car, a rickshaw, a ship (ship and other watercraft), an airplane, a rocket, and a satellite used by the user U1. , Drones, balloons, etc.).
  • a plurality of terminals may cooperate to share and execute each function of the terminal 200 to realize the entire function of the terminal 200.
  • the position information of the user U1 the movement of the user U1 (moving speed, stride, moving direction, face and body orientation, etc.), the state of the user U1 (heart rate, energy consumption, body temperature, etc.), or the surroundings
  • the wearable terminal may detect climate information (temperature, pressure, etc.), transmit the detected information to the smartphone, and transmit information acquired by the smartphone to the server device 100.
  • the output of the voice message may be performed from the wearable terminal, and the other processing may be performed on the smartphone.
  • the present invention aims at stimulating individual motivation by voice message. For that purpose, it is necessary to work to immediately select a specific action (verb) after motivation.
  • the delivered message in order to achieve motivation only by delivering a voice message, the delivered message includes specific information that recalls "experience" there, rather than information explaining the target. It is important that
  • the message content does not include information describing the target but specific information that recalls the "experience” there. More preferably, the message content is concise.
  • the message design is localized in the viewpoint of the recipient without standing in the viewpoint of the distributor as the advertiser. This has a different meaning from the “consumer perspective” approach that has been said in conventional marketing in the following points.
  • the "format” is not the message content but the consumer's viewpoint.
  • A2) Content that allows comparison with others is not included.
  • the message of the present invention is described in a format that describes what is possible there, such as "You can experience zazen at this point / You can see the beauty picture drawn by BBB /”. "Experience” is the message to be recalled. This is the meaning of the above (a1).
  • the message of the present invention emphasizes that the "experience” recalled is possible “only there”, if possible. This is the meaning of the above (a2).
  • the message may be generated by a person, automatically generated by a device using AI (Artificial Intelligence) technology, or a combination thereof.
  • AI Artificial Intelligence
  • the generated message is stored in the reproduced voice information storage unit 112 described later in association with the facility.
  • distributing experience message text that does not overlap can further encourage individual motivation or action induction. Whether or not a similar experience is experienced can be determined by referring to the individual's action history. This action history will be described in detail in an embodiment described later.
  • Jingle is an alerting method generally used in hearing-only media such as radio, and uses a specific pattern of sound elements in order to explicitly change the context of a commercial or a program.
  • a jingle is a short melody (including songs, music, and songs) and short sounds (natural sounds, synthetic sounds, musical instrument sounds, voices, and synthetic voices) that have the effect of recognizing and recalling a predetermined image. Or a combination thereof.
  • Short means that the output time of the jingle is at least about 1 to 3 seconds, and is long enough for the user U1 to recognize the jingle.
  • FIG. 3 is a diagram illustrating a data structure of the audio data 300 according to the present embodiment.
  • the audio data 300 is configured so that the jingle 302 and the reproduced audio information 310 are reproduced in this order.
  • the reproduction audio information 310 is configured so that the message 312 and the target name 314 are reproduced in this order.
  • the jingle function is "a sound element that can be naturally interrupted by the individual."
  • Buzzers and alerts that use sine waveforms generally have less overtone components and are easier to recognize, but tend to sound directly to the brain, so they are useful in danger and caution, but do not sound comfortable Often.
  • a sound device such as an earphone is premised on listening at a close distance to an ear, it is easy to feel stress if a sharp sound is used in an attack part (start of sound) of the sound. Therefore, according to the present invention, a jingle that provides a rich auditory experience that is rich in overtone structure and that is easy to accept by combining a plurality of timbres with a time difference.
  • the jingle designed in this way is stored in the jingle storage unit 110 described later in association with the facility or the content of the experience.
  • the reproduced audio information 310 includes a message 312 indicating information relating to contents that can be experienced by an individual in relation to the position information, and a target name 314 indicating information for specifying a facility or the like indicated by the position information, as shown in FIG. , In this order.
  • the information about the experience content included in the message 312 may be, for example, "Let's change into Maiko's costumes, become a Maiko and stroll through the town of Kyoto. You can also take a commemorative photo with a real Maiko.” And so on.
  • the target name 314 following the message 312 is, for example, “XYZ photo studio” or the like.
  • FIG. 4 is a functional block diagram illustrating a logical configuration of the server device 100 according to the present embodiment.
  • the server device 100 includes a position information acquisition unit 102, a selection unit 104, a determination unit 106, and a sound reproduction control unit 108.
  • the position information acquisition unit 102 acquires the position information of the terminal 200 or the position information of the individual (user U1).
  • the selection unit 104 selects a jingle using the acquired position information.
  • the determination unit 106 determines the reproduction audio information using the acquired position information.
  • the audio reproduction control unit 108 generates audio information so as to reproduce in the order of the jingle and the reproduced audio information, and causes the terminal 200 to reproduce the generated audio information.
  • a method for acquiring the position information of the terminal 200 is exemplified below, but is not limited thereto.
  • (B1) Receive from terminal 200.
  • (B2) The information acquired by the location registration of the terminal 200 is acquired from the base station 70.
  • (B3) Acquire from the access point accessed by the terminal 200.
  • the server device 100 is connected to the jingle storage unit 110 and the reproduced audio information storage unit 112.
  • the jingle storage unit 110 and the reproduced audio information storage unit 112 may be storage devices inside the server device 100, external storage devices, or a combination thereof.
  • the timing of acquiring the position information is the position information transmitted from the terminal 200, the identification information for specifying the position information, or when the notification that the beacon has been received is received, or periodically at regular intervals.
  • the server device 100 may actively acquire information, or may passively acquire information transmitted from outside.
  • the terminal 200 that has received the beacon transmitted from the beacon transmitter 50 receives the position information transmitted, it is a timing to transmit the reproduced audio information (hereinafter, also referred to as “voice message”) to the terminal 200.
  • the server device 100 may transmit a voice message to the terminal 200 at the timing when the server device 100 receives the voice message.
  • the position information acquisition unit 102 of the server device 100 determines whether the condition for delivering the voice message is satisfied based on the position information. The determination process is further performed.
  • the server device 100 stores the target facility or target area to which the voice message is to be delivered and the position information thereof in the position information storage unit 114 in association with each other.
  • the position information acquisition unit 102 can refer to the position information storage unit 114 and determine whether the acquired position information corresponds to the target facility or the target area. If it is determined to be a target facility or a target area, a process of delivering a voice message is performed based on the position information.
  • the jingle storage unit 110 stores a plurality of jingles.
  • the selecting unit 104 specifies the position attribute of the position information acquired by the position information acquiring unit 102, and further selects a jingle based on the identified attribute.
  • the selection unit 104 specifies a facility using the position information, and sets the category of the facility as a position attribute.
  • the selection unit 104 may use the attribute of the content that can be experienced at the position indicated by the position information as the attribute of the position.
  • the selection unit 104 may combine the category of the facility with the attribute of the content that can be experienced at the position indicated by the position information, and use the combination as the position attribute.
  • the position information storage unit 114 stores information indicating the target facility or target area and the position information in association with at least one of the category and the experience content.
  • facility categories include tourism, gourmet, nature, culture, leisure, commerce, events, education, politics, transportation, etc.
  • jingles may be stored in the jingle storage unit 110 in association with jingles for each facility category.
  • a jingle specific to each facility may be stored in the jingle storage unit 110 in association with each facility.
  • A description will be given of a case where a jingle is selected using both the tables in FIGS. 5A and 5B.
  • the selecting unit 104 After specifying the facility from the position information with reference to the position information storage unit 114 in FIG. 2, the selecting unit 104 first refers to the table in FIG. 5B to determine the facility-specific jingle associated with the facility. If so, select that jingle. If there is no facility-specific jingle associated with the facility, the category of the facility is specified with reference to the position information storage unit 114 in FIG. Then, a jingle associated with the specified category is selected with reference to the table of FIG.
  • the jingle is associated with the attribute of the content that can be experienced and stored in the jingle storage unit 110.
  • the jingle storage unit 110 preferably includes at least one of FIG. 5A, FIG. 5B, and FIG. 5C. Further, the jingle storage unit 110 may be configured to associate a jingle with position information or information indicating a facility or a zone.
  • a plurality of pieces of reproduced audio information are stored in the reproduced audio information storage unit 112, and are stored in a file format of at least one of audio data and text data.
  • the playback audio information storage unit 112 stores a table in which file name and path information of playback audio information is associated with position information or information indicating a facility or area, and a data file of playback audio information. .
  • 5A to 5C show an example in which one jingle is associated with one position attribute.
  • a plurality of jingles may be associated with one type of position attribute.
  • the selection unit 104 may select a different jingle every time when the same terminal 200 or the user U1 is acquired a plurality of times during the predetermined period based on the action history described later.
  • the server device 100 or the terminal 200 includes a text-to-speech unit, and the text-to-speech unit can generate and output voice data.
  • the audio reproduction control unit 108 may transmit reproduction audio information of text data to the terminal 200.
  • the text-to-speech unit can be realized by, for example, an application having a text-to-speech function.
  • the format of the audio data file is not particularly limited, and various formats such as WAV, AIFF, mp3, ACC, WMA, ATRAC, and mp4 can be considered.
  • the terminal 200 has a function that allows a user to select and set a file format that can be reproduced.
  • the setting may be received by an application setting menu or the like, or a user registered in advance may log in to the voice message system 1 from the terminal 200 and receive the setting on a setting screen or the like.
  • the setting information can be registered by being included in the user information for each user.
  • the server device 100 can acquire the setting information and transmit the audio data to the terminal 200 in the set file format.
  • the earphone device can be predetermined in a predetermined file format.
  • the terminal 200 may read out at least one of the jingle from the jingle storage unit 110 and the reproduced audio information from the reproduced audio information storage unit 112 and reproduce and output the audio.
  • the audio reproduction control unit 108 of the server device 100 may transmit to the terminal 200 information that can specify at least one of a jingle to be output as audio and reproduced audio information.
  • FIG. 6 is a functional block diagram logically showing the configuration of the terminal 200 of the present embodiment.
  • the terminal 200 includes a position information acquisition unit 202, a position information transmission unit 204, a reproduced audio information reception unit 206, and an audio reproduction output unit 208.
  • the position information acquisition unit 202 acquires the position information of the terminal 200 or the vicinity of the terminal 200.
  • the method by which the terminal 200 acquires the position information is exemplified below, but is not limited thereto.
  • Position information is received from a GPS (Global Positioning System) satellite 60 or a quasi-zenith satellite.
  • C2 Obtain position information from the beacon signal received from the beacon transmitter 50.
  • the above (c1) is suitable for acquiring position information for an outdoor or wide area.
  • the above (c2) is suitable for acquiring position information indoors or a relatively narrow range.
  • the terminal 200 may switch between the method of acquiring the position information (c1) and the method of acquiring the position information (c2) by detecting whether the terminal 200 is indoor or outdoor using a geomagnetic sensor, for example.
  • the position information transmitting unit 204 transmits the obtained position information to the server device 100. Further, as described above, position information acquiring section 202 receives a beacon transmitted from beacon transmitter 50, and position information transmitting section 204 transmits information notifying that a beacon has been received to server apparatus 100. You may. In such a configuration, the server device 100 specifies the position information of the terminal 200.
  • the reproduction audio information receiving unit 206 receives the reproduction audio information from the server device 100.
  • the audio reproduction output unit 208 creates the reproduction audio information received by the reproduction audio information receiving unit 206 and outputs the generated audio information from a speaker (not shown).
  • the timing at which the audio reproduction output section 208 outputs the reproduction audio information is preferably when the reproduction audio information is received.
  • the reproduced audio information may be distributed by streaming from the server device 100, and the terminal 200 may reproduce the reproduced audio information by the audio reproduction output unit 208 while receiving the reproduced audio information by the reproduced audio information receiving unit 206.
  • a plurality of pieces of reproduction audio information of the terminal 200 are stored in advance, the information of the jingle 302 and the reproduction audio information 310 to be output from the server device 100 is received, and the audio data 300 is configured according to the received information. Playback output.
  • FIG. 7 is a block diagram illustrating an example of a configuration of a computer 80 that implements the server device 100 of FIG. 4 or the terminal 200 of FIG.
  • the computer 80 of the present embodiment stores a CPU (Central Processing Unit) 82, a memory 84, a program 90 for realizing the components of the functional block diagram of FIG. 4 or FIG. Storage 85, an input / output (I / O) 86, and a communication interface (communication I / F 87).
  • CPU Central Processing Unit
  • I / O input / output
  • communication interface communication I / F 87
  • the CPU 82, the memory 84, the storage 85, the I / O 86, and the communication I / F 87 are connected to each other via a bus 89, and the server device 100 or the terminal 200 is controlled by the CPU 82.
  • the memory 84 is a memory such as a RAM (Random Access Memory) and a ROM (Read Only Memory).
  • the storage 85 is a storage device such as a hard disk, a solid state drive (SSD), or a memory card. Further, the storage 85 may be a memory such as a RAM or a ROM.
  • the CPU 82 reads out the program 90 stored in the storage 85 into the memory 84 and executes the program 90, whereby each function of the server device 100 or the terminal 200 can be realized.
  • the I / O 86 controls input and output of data and control signals between the computer 80 and other input / output devices.
  • Other input / output devices include, for example, input devices (not shown) such as a keyboard, a touch panel, a mouse, operation switches, operation buttons, and a microphone connected to the computer 80, and output devices such as a display, a printer, and a speaker. (Not shown), and an interface between these input / output devices and the computer 80.
  • the I / O 86 may perform input / output control of data with a reading / writing device (not shown) of another recording medium.
  • the communication I / F 87 includes various communication interfaces for performing communication between the computer 80 and an external device.
  • the communication function of the server device 100 or the terminal 200 is exemplified below, but is not limited thereto.
  • (D1) Short-distance wireless communication function Short-distance wireless communication includes, for example, Bluetooth communication, infrared communication, wireless communication using an RFID (Radio Frequency Identification) system, wireless communication according to the NFC (Near Field Communication) standard, and the like. .
  • the terminal 200 can receive a beacon transmitted from the beacon transmitter 50 by the short-range wireless communication function.
  • the server apparatus 100 connects to a network 40 such as the Internet via an access point such as a router using a Wi-Fi communication function.
  • the terminal 200 can receive a beacon from an access point using the Wi-Fi communication function.
  • the terminal 200 connects to a network 40 such as the Internet via an access point using a Wi-Fi communication function.
  • (D3) Mobile data communication function for example, 3G (3rd Generation), 4G (4th Generation), LTE (Long Term Evolution), etc.
  • the terminal 200 may communicate with the server device 100 by connecting to a mobile phone network (not shown) via the base station 70 using the mobile data communication function.
  • the server device 100 and the terminal 200 can communicate via the network 40 or another network.
  • (D4) GPS receiving function The terminal 200 receives position information from the GPS satellites 60 using the GPS receiving function.
  • Each component of the server device 100 of FIG. 4 or the terminal 200 of FIG. 6 is realized by an arbitrary combination of hardware and software of the computer 80 of FIG. It will be understood by those skilled in the art that there are various modifications in the method and apparatus for realizing the method.
  • the functional block diagram showing the server device 100 or the terminal 200 of each embodiment described below does not show a configuration in a hardware unit but shows a block in a logical function unit. In each of the drawings, the configuration of a portion that does not relate to the essence of the present invention is omitted and is not shown.
  • the CPU 82 of the computer 80 in FIG. 7 reads out the program 90 stored in the storage 85 to the memory 84 and executes the program 90, so that each function of each unit in FIG. 4 of the server device 100 or each unit in FIG. Can be realized.
  • the computer program of the present embodiment may be recorded on a computer-readable recording medium.
  • the recording medium is not particularly limited, and various forms are conceivable.
  • the program may be loaded from a recording medium to a memory of the computer, or may be downloaded to the computer via a network and loaded into the memory.
  • the recording medium for recording the computer program 90 includes a non-transitory tangible computer-readable medium, in which a program code readable by the computer 80 is embedded.
  • the computer program 90 When the computer program 90 is executed on the computer 80, it causes the computer 80 to execute the following information processing method for realizing the server device 100 or the terminal 200.
  • the terminal 200 is, for example, a guide terminal or the like device lent to the user U1 on the spot
  • a program for realizing each function of each unit in FIG. 6 may be installed in the terminal 200 in advance.
  • the terminal 200 is a property of a user such as a smartphone
  • the terminal 200 of the present invention may be realized by installing and executing an application program that realizes each function of each unit in FIG.
  • the computer program of the present embodiment is a computer for realizing the server device 100, a procedure for acquiring the location information of the terminal 200 or the individual's location information, a procedure for selecting a jingle using the acquired location information, The procedure for determining the reproduction audio information using the position information, the procedure for generating the audio information so as to reproduce the jingle and the reproduction audio information in order, and the step of causing the terminal 200 to reproduce the generated audio information (the audio data 300) are executed. It is described as follows.
  • FIG. 8 is a flowchart illustrating an example of the operation of the server device 100.
  • the position information acquisition unit 102 acquires the position information of the terminal 200 (Step S101).
  • the selection unit 104 selects a jingle using the acquired position information (Step S103).
  • the determining unit 106 determines the reproduction audio information using the acquired position information (Step S105).
  • the audio reproduction control unit 108 generates audio information so as to reproduce in the order of the jingle and the reproduction audio information (step S107), and causes the terminal 200 to reproduce the generated audio information (step S109).
  • FIG. 9 is a flowchart illustrating an example of the operation of the terminal 200.
  • the position information acquisition unit 202 acquires position information (Step S201), and the acquired position information is transmitted to the server device 100 by the position information transmission unit 204 (Step S203).
  • the reproduced sound information receiving unit 206 reproduces the reproduced sound information received from the server device 100 and outputs the reproduced sound information from the speaker (Step S205).
  • the user U1 starts the action while carrying the terminal 200.
  • the application of the voice message system 1 of the terminal 200 is started.
  • the beacon transmitted from the beacon transmitter 50 is received by the position information acquisition unit 202.
  • position information acquiring section 102 acquires the position information included in the received beacon (step S201 in FIG. 9), and position information transmitting section 204 transmits the position information to terminal 200 (step S203 in FIG. 9). .
  • the position information acquisition unit 102 of the server device 100 receives the position information from the terminal 200 (Step S101 in FIG. 8).
  • the selecting unit 104 refers to the position information storage unit 114 in FIG. 2D, specifies the facility, the category of the facility, and the content of the experience as the position attribute from the position information, and further stores the jingle storage unit 110 in FIG.
  • the jiggle 302 corresponding to the attribute of the facility is selected by referring to (step S103 in FIG. 8).
  • the determination unit 106 determines the message 312 and the target name 314 corresponding to the position information or the attribute of the specified position (step S105 in FIG. 8). Then, the audio reproduction control unit 108 generates the audio data 300 in the order of the jingle 302, the message 312, and the target name 314 (Step S107 in FIG. 8), and transmits the generated audio data 300 to the terminal 200 (Step in FIG. 8). S109).
  • the reproduced audio information receiving unit 206 receives the audio data 300 transmitted from the server device 100 (Step S203 in FIG. 9). Then, the audio reproduction output unit 208 reproduces the received audio data 300 and outputs it from the speaker (Step S205 in FIG. 9).
  • the server device 100 acquires the position information of the individual, selects the jingle 302 based on the acquired position information, determines the reproduction audio information 310 corresponding to the position information,
  • the audio data 300 is generated in the order of the jingle 302 and the reproduced audio information 310 and the terminal 200 reproduces and outputs the audio data.
  • the playback audio information 310 has a configuration in which the message 312 and the target name 314 are played back in this order, and the message 312 includes information that reminds the user of the content that can be experienced at the place.
  • the recipient of the message 312 can easily accept the message 312 and determine that the message 312 takes immediate action.
  • the reproduction audio information 310 is output in the order of the object name 314 and the message 312, even if the user listens to the message 312 and is interested, if he listens to the object name 314, he or she cannot take an action to go there. .
  • the subject name 314 is output last, in the order of the message 312 and the subject name 314, as in the present embodiment, the user takes care of the subject after carefully interested in the contents of the message 312. The name 314 can be heard, and an action can be taken.
  • FIG. 10 is a functional block diagram logically showing the configuration of the server device 100 of the present embodiment.
  • the server apparatus 100 is the same as the above-described embodiment in FIG. 4 except that the jingle is selected using the reproduction combined with the action history or the content of the reproduced audio information is selected.
  • the server device 100 is connected to the action history storage unit 120.
  • the action history storage unit 120 may be a storage device inside the server device 100, an external storage device, or a combination thereof.
  • the action history including the attribute that caused the action is stored in the action history storage unit 120, and the content of the reproduced audio information is selected using the attribute included in the action history.
  • the action history storage unit 120 outputs the position information or the facility or area information and the voice data 300 to the user identification information (user ID: Identifier).
  • Information indicating whether or not an action has been performed is stored in association with the information.
  • the user identification information is information that can identify the terminal 200 (for example, an IP address, a mail address, a telephone number, a terminal identification number, or the like), or identification information such as a user ID that is issued when the use of the voice message system 1 is registered. It is.
  • the information indicating whether or not an action has occurred is a flag. For example, when an action has occurred, the flag is set to 1, and when no action has occurred, the flag is set to 0.
  • the action history storage unit 120 may store information on the facility or area where the user has taken action or positional information in association with the user ID. Conversely, information on the facility or area where the user did not take action or position information may be stored in association with the user ID.
  • the reproduced voice information storage unit 112 stores a message 312 in the case where there is an action and a message 312 in the case where there is no action in the position information or the information of the facility or the area. They are stored in association with each other.
  • the determining unit 106 When determining the position information, the determining unit 106 refers to the action history storage unit 120 in FIG. 11A and obtains information indicating whether there is an action corresponding to the position information. Further, the determining unit 106 acquires a message 312 corresponding to the presence or absence of the action in the position information with reference to the reproduced voice information storage unit 112 in FIG.
  • the action history storage unit 120 may further include the date and time when the voice data 300 was output to the user. For example, it may be determined from the action history storage unit 120 whether or not the user has come to the position information last time, and the message 312 may be changed according to whether or not the user has come. Alternatively, the action history storage unit 120 may determine whether the user has visited within a predetermined period, and change the message 312 according to whether the user has visited within the predetermined period.
  • the method of changing the message 312 may be a method of selecting from a plurality of messages 312 or a method of switching whether to output the message 312 or not.
  • the selection unit 104 or the determination unit 106 selects the jingle 302 or the message 312 using the information of the action history, and the timing may be variously considered. For example, a case where the immediately preceding history information is used, a case where the previous history information is used, and a case where the history information of a specific period is used can be considered.
  • a pattern of a message 312 prompting the user to visit the facility again a pattern of a message 312 recommending another experience possible at the facility, and another pattern of the same genre as the facility.
  • a pattern that prompts a visit to a facility, a pattern that prompts a visit to another facility of a genre (category) different from the facility, and the like can be considered.
  • a pattern suitable for the user may be determined by machine learning using the AI technology.
  • the presence or absence of the action may be detected within a predetermined time (for example, within 5 minutes) after the output of the voice message. That is, recording is performed only when it is considered that an action is taken by a voice message. Alternatively, when an action is taken, a time interval from the output time of the voice message to the time at which the action was taken may be recorded.
  • the present embodiment it is possible to select the jingle or the voice message by using the information of the action history including the attribute in which the action has been taken, in addition to the same effect as the above-described embodiment. It is possible to deliver an appropriate voice message according to the presence or absence of the message, and to effectively motivate the user to induce an action.
  • the action history storage unit 120 stores, for each user, at least one of information such as a moving speed, a moving direction, and a face direction together with time information (date and time) and position information. Is stored.
  • the position information or the information of the facility or the area is information obtained by the position information obtaining unit 102 by any one of the methods described above, and is stored in association with the date and time information at which the position information was obtained.
  • the server device 100 may receive a value measured by an acceleration sensor or a motion sensor included in the terminal 200, or a value calculated by the server device 100 from history information of position information and time information. May be. As the information of the face direction, the server device 100 may receive a value measured by a motion sensor included in the terminal 200.
  • the selection unit 104 or the determination unit 106 selects the jingle 302 or the message 312 using the information.
  • the selection timing is, as described above, the case where the immediately preceding history information is used, the case where the history information from a predetermined time ago to the present is used, the case where the previous history information is used, and the case where the history information of a specific period is used. Is considered.
  • the selecting unit 104 A jingle 302 with a high alert level is selected. Then, the determination unit 106 determines that the playback audio information 310 is "If you go in the opposite direction to the current direction, there is a BBB where you can experience AAA.”
  • a facility in the direction where the user is currently facing may be selected, and the corresponding jingle 302 and message 312 may be selected and determined.
  • the reproduction audio information 310 may be determined based on the determination result. For example, for a user traveling on foot, the reproduced voice information 310 such as "A dumpling capable of eating and walking is on the left hand after turning right at this corner. The name of the store is ABC store.” it can. For a user traveling on a vehicle, the reproduced voice information 310 such as “There is a rice cracker perfect for souvenirs in front of the next bus stop. The name of the store is XYZ store.”
  • the reproduction audio information 310 including information such as guidance of a departure time may be determined.
  • the user's behavior history storage unit 120 is used to analyze at least one of the purchase history information and the attribute information of the user and perform machine learning to analyze the user's hobbies, preferences and behavior patterns at that location. Then, for each location (within a predetermined area), information such as facilities recommended for the user, the category of the facility, and the contents of the experience are registered.
  • the selection unit 104 and the determination unit 106 specify a location from the position information, acquire information on facilities and the like recommended by the user, and set and determine the corresponding jingle 302 and playback audio information 310.
  • the reproduction audio information storage unit 112 stores the message 312 in association with the position information, and the determination unit 106 determines the message 312 based on the position information. Further, in the second embodiment, the message 312 is determined based on the action history. In other embodiments, the message 312 may be determined based on another condition in addition to the location information.
  • the condition may be an attribute of the user.
  • the user attributes include gender and age group.
  • information such as hobbies, preferences, and interests may be registered by the user, and may be stored as attributes of the user.
  • the information of the use unit such as an organization, a group, and an individual, or in the case of a group, information of a type such as a family, a friend, and a lover is registered by the user. May be stored.
  • information such as heart rate, energy consumption, and body temperature measured by the wearable terminal may be included as attributes of the user.
  • the surface temperature of the user may be measured using an infrared sensor provided at a predetermined position to determine the tension state of the user, and the like may be used as the attribute of the user.
  • Information such as a season, a month, a date, a day of the week, a specific period (such as a sales period of a specific store), or weather (temperature, pressure, etc.) may be used as a condition.
  • the beacon received by the terminal 200 does not include facility information.
  • the beacon transmitter 50 may transmit information on facilities around the beacon transmitter 50 to the terminal 200 in response to a response from the terminal 200 that has received the beacon.
  • the location information transmitting unit 204 of the terminal 200 may transmit the received facility information to the server device 100.
  • the terminal 200 may include the position information storage unit 114.
  • the position information transmission unit 204 refers to the position information storage unit 114 to acquire the information of the facility or area corresponding to the acquired position information, and 100.
  • the present invention uses audio output as the main user interface
  • the present invention can be combined with another user interface using display means and operation means.
  • the voice data 300 is output
  • the content of the voice message itself or information about the content may be displayed on the display of the terminal 200.
  • the display contents include, for example, the URL (Uniform Resource Locator) address of the website of the facility, contact information, a map of the location, route information, and the like.
  • the audio data 300 that has already been output may be displayed in a list and selected to be reproduced again. In this case, the jingle 302 may not be reproduced and output.
  • FIG. 13 is a functional block diagram illustrating a logical configuration of the first embodiment.
  • the server device 100 includes a history management unit 402, a name identification unit 404, a jingle selection unit 406, a message generation unit 408, and a message construction unit 410.
  • the history management unit 402 acquires the position information of the individual or the position information of the terminal 200, for example, the information received by the terminal 200 from the GPS satellite 60, and stores the information in the action history storage unit 120.
  • the name specifying unit 404 specifies the facility name of the facility and the category of the facility by referring to the location information storage unit 114 from the acquired location information.
  • the specified facility name 304 is transferred to the jingle selection unit 406 and the message construction unit 410, and the information of the specified facility is transferred to the message generation unit 408.
  • the jingle selection unit 406 selects a jingle using the facility category received from the name identification unit 404 and the action history information received from the history management unit 402. Then, the jingle selection unit 406 transfers the selected jingle 302 to the message construction unit 410.
  • the message generation unit 408 searches the Internet or the like, collects and accumulates information on the experience obtained at each facility, and stores the reproduction audio information 310 in the reproduction audio information storage unit 112. Further, the message generation unit 408 outputs the experience content of the facility selected from the reproduction audio information storage unit 112 according to the information of the facility specified by the name specification unit 404 or the information of the action history received from the history management unit 402. A message 312 is generated and passed to the message construction unit 410.
  • the message construction unit 410 generates and outputs the audio data 300 for reproducing the jingle 302, the message 312, and the target name 314 received in this order from the jingle selection unit 406, the message generation unit 408, and the name identification unit 404.
  • the audio data 300 is transmitted to the terminal 200 and reproduced and output.
  • the voice message system 1 is used at a construction site.
  • the terminal 200 is carried by each worker.
  • the beacon transmitter 50 is installed at a dangerous place or the like.
  • the position information acquisition unit 202 of the terminal 200 receives the beacon signal transmitted from the beacon transmitter 50, and the position information transmission unit 204 transmits the position information included in the beacon signal to the server device 100.
  • a plurality of jingles are stored in the jingle storage unit 110 according to the alert level of the danger point. Further, the jingle storage unit 110 stores the position information of each dangerous spot in the construction site and the alert level of the dangerous spot in association with each other.
  • the selecting unit 104 specifies the alert level of the dangerous spot from the received position information, and selects a jingle corresponding to the identified alert level. The higher the vigilance level, the more jingles the urgency can convey.
  • the voice information of a plurality of messages is stored in the action history storage unit 120 according to the attribute of the dangerous place. Further, the action history storage unit 120 stores the position information and the attribute of the dangerous place in association with each other.
  • the attributes of the dangerous spot include, for example, overhead attention, attention to feet, weight limitation, strict prohibition of fire, and the like. Alternatively, the attribute of the work content may be included, and the caution includes work at high places, prohibition of work by one person, ventilation required, and the like.
  • the determination unit 106 specifies the attribute of the dangerous spot from the position information, and selects a message corresponding to the specified attribute. Alternatively, the selection unit 104 may select a jingle according to the attribute of the dangerous spot. For example, a different jingle may indicate whether the place to be careful is overhead or at the feet.
  • the voice message system 1 is used as a sightseeing guide for foreign tourists.
  • the terminal 200 is lent to a foreign tourist at an airport, a tourist spot, or the like.
  • a service may be provided by distributing a QR code (registered trademark) that allows an application to be downloaded to a smartphone possessed by the user and having the user register as a user.
  • QR code registered trademark
  • the selection of the language of the message 312 may be accepted in the setting menu, and the message 312 may be output in the selected language.
  • Example 4 by outputting information of a store or the like by a voice message, the user is encouraged to use the store by a method different from a conventional advertisement or publicity. Recently, each advertiser has been excited to deliver more personalized and effective information to personal terminals such as personal computers, smartphones, and tablets.
  • the voice message of the present invention using sound as a user interface (UI: User @ Interface) is used.
  • a general voice message is mainly composed of information for explaining a target, and has a problem that has not been motivated or triggered.
  • voice messages that are reproduced by interrupting individual actions and conversations cause discomfort and are stressful.
  • the location information of the store or facility to which the advertisement is to be distributed is registered in the location information storage unit 114.
  • the voice message system 1 is used in a place such as an outlet mall where a plurality of stores exist in a certain area.
  • Location information of each store and equipment can be registered.
  • the jingle storage unit 110 stores a jingle 302 that reminds the user of awareness and experience without stressing the user for each store or facility, or for each category thereof. Then, the playback audio information storage unit 112 stores a message 312 including contents that can be experienced or executed at the store or facility.
  • Each store registers a message 312 for calling the user. For example, “You can eat sweet and cold Yubari Melon soft ice cream in Hokkaido”, “We will carry out a 30-minute time sale from 15:00. We have a wide selection of trendy lineups this fall. Please do not miss it . "Is registered for each store.
  • the delivery time may be specified like the latter message. What is necessary is just to register together with the distribution target time (for example, 14:00 to 15:00) so that it is selected only at the designated time.
  • the user can download and start the application and start using the voice message system 1.
  • the application may be dedicated to a certain outlet mall or may be commonly used in a plurality of commercial facilities, and various forms are conceivable.
  • a setting screen that allows the user to specify in advance the equipment information that the user wants to obtain may be provided.
  • information such as whether the user is a smoker, an infant, or an elderly person may be registered in advance as attributes of the user.
  • a configuration may be adopted in which the user's action cycle is estimated using the information on the action history, and the message is delivered at a cycle suitable for the user.
  • the present invention has been described with reference to the exemplary embodiments and examples. However, the present invention is not limited to the exemplary embodiments and examples. Various changes that can be understood by those skilled in the art can be made to the configuration and details of the present invention within the scope of the present invention. In the present invention, when acquiring and using information on a user, this shall be performed legally.
  • Location information acquisition means for acquiring the location information of the terminal, or personal location information
  • Selecting means for selecting a jingle using the acquired position information
  • Determining means for determining playback audio information using the obtained position information
  • a server configured to generate audio information so as to be reproduced in the order of the jingle and the reproduced audio information, and to reproduce the generated audio information to the terminal; 2.
  • the reproduced audio information includes, in this order, information on contents that can be experienced by an individual in relation to the position information, and information specifying a facility indicated by the position information. 3. 1. Or 2.
  • the server device wherein the selection unit specifies an attribute of the position of the position information acquired by the position information acquisition unit, and further selects the jingle based on the identified attribute. 4. 3. In the server device described in the above, The server device, wherein the selection unit specifies a facility using the position information, and sets a category of the facility as an attribute of the position. 5. 3. Or 4. In the server device described in the above, The server device, wherein the selection unit sets, as an attribute of the position, an attribute of content that can be experienced at the position indicated by the position information. 6. 1. To 5. In the server device according to any one of the above, The server device further stores an action history including an attribute in which the action has occurred in a storage device, and the determining unit selects the content of the reproduced voice information using the attribute included in the action history.
  • a data structure of a voice message generated to be played on a terminal The voice message is Jingle selected using the terminal location information, or personal location information, Playback audio information determined using the position information, and, and is played back in this order,
  • the reproduced audio information further includes: Information on contents that can be experienced by an individual in relation to the location information, A data structure of a voice message including information specifying a facility indicated by the position information, and reproduced in this order.
  • the reproduced audio information includes, in this order, information on contents that can be experienced by an individual in relation to the position information, and information specifying a facility indicated by the position information.
  • the server device is Obtain terminal location information or personal location information, Select a jingle using the acquired location information, Using the obtained position information to determine playback audio information, An information processing method, wherein audio information is generated so as to be reproduced in the order of the jingle and the reproduced audio information, and the terminal reproduces the generated audio information. 10. 9. In the information processing method described in the above, The information processing method, wherein the reproduced audio information includes, in this order, information on contents that can be experienced by an individual in relation to the position information, and information specifying a facility indicated by the position information. 11. 9. Or 10.
  • the server device is: An information processing method comprising: specifying a position attribute of the obtained position information; and selecting the jingle based on the specified attribute. 12. 11.
  • the server device is: An information processing method, wherein a facility is specified using the position information, and a category of the facility is set as an attribute of the position. 13. 11. Or 12.
  • the server device is: An information processing method, wherein an attribute of content that can be experienced at a position indicated by the position information is an attribute of the position. 14. 9. To 13.
  • an action history including the attribute that caused the action is stored in the storage device, An information processing method, wherein the server device selects the content of the reproduced audio information using the attribute included in the action history.
  • a procedure for acquiring the location information of the terminal or the location information of the individual A procedure for selecting a jingle using the acquired location information, A procedure for determining reproduction audio information using the acquired position information, A program for generating audio information so as to be reproduced in the order of the jingle and the reproduced audio information, and causing the terminal to reproduce the generated audio information.
  • a program for storing an action history including an attribute in which an action has occurred in a storage device and executing a procedure of selecting the content of the reproduced audio information using the attribute included in the action history.
  • a server device, And a terminal The server device, Location information of the terminal, or location information acquisition means for acquiring individual location information, Selecting means for selecting a jingle using the acquired position information, Determining means for determining playback audio information using the obtained position information, Transmitting means for generating audio information so as to be reproduced in the order of the jingle and the reproduced audio information, and transmitting the generated audio information to the terminal,
  • the terminal is Means for transmitting position information to the server device; Means for receiving the audio information from the server device, Output means for receiving the voice information and outputting the voice information. 22. 21.
  • the reproduced audio information includes, in this order, information on contents that can be experienced by an individual in relation to the position information, and information specifying a facility indicated by the position information. 23. 21. Or 22.
  • the selection unit specifies an attribute of the position of the position information acquired by the position information acquisition unit, and further selects the jingle based on the identified attribute. 24. 23.
  • the selection unit specifies a facility using the location information, and sets a category of the facility as an attribute of the location. 25. 23. Or 24.
  • the selection unit sets the attribute of the content that can be experienced at the position indicated by the position information as the attribute of the position. 26. 21. To 25.
  • an action history including an attribute that caused the action is stored in a storage device, and the determining unit selects the content of the reproduced audio information using the attribute included in the action history. .

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Telephonic Communication Services (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

サーバ装置(100)は、個人が保持又は個人の周囲に位置している端末の位置情報、又は個人の位置情報を取得する位置情報取得部(102)と、取得した位置情報を用いてジングルを選択する選択部(104)と、取得した位置情報を用いて再生音声情報を決定する決定部(106)と、ジングルおよび再生音声情報の順に再生させるように音声情報を生成し、生成した音声情報を端末に再生させる音声再生制御部(108)と、を備える。

Description

音声メッセージシステム、サーバ装置、サーバ装置の情報処理方法、プログラム、および音声メッセージのデータ構造
 本発明は、音声メッセージシステム、サーバ装置、サーバ装置の情報処理方法、プログラム、および音声メッセージのデータ構造に関し、特に、意欲前領域における音声ガイダンスの音声メッセージシステム、サーバ装置、サーバ装置の情報処理方法、プログラム、および音声メッセージのデータ構造に関する。
 昨今、パーソナルコンピュータ、スマートフォン、及びタブレットなどの個人向けの端末が普及している。情報配信者は、この個人向けの端末に、広告などの情報を配信している。
 特許文献1には、広告の内容を音声出力する技術が開示されている。
特開2018-28533号公報
 上記したように、端末に音声情報が配信されることがある。しかし、端末の保持者は、当該情報を認識しても、その情報に対して意欲を示さないことがある。
 本発明は上記事情に鑑みてなされたものであり、その目的とするところは、端末に音声情報を配信した場合において、端末の保持者にその情報に対する意欲を持たせることにある。
 本発明の各側面では、上述した課題を解決するために、それぞれ以下の構成を採用する。
 第一の側面は、音声メッセージシステムに関する。
 第一の側面に係る音声メッセージシステムは、
 サーバ装置と、
 端末と、を有し、
 前記サーバ装置は、
  前記端末の位置情報、又は個人の位置情報を取得する位置情報取得手段と、
  取得した前記位置情報を用いてジングルを選択する選択手段と、
  取得した前記位置情報を用いて再生音声情報を決定する決定手段と、
  前記ジングルおよび前記再生音声情報の順に再生させるように音声情報を生成し、生成した前記音声情報を前記端末に送信する送信手段と、を有し、
 前記端末は、
  前記サーバ装置に位置情報を送信する手段と、
  前記サーバ装置から前記音声情報を受信する手段と、
  前記音声情報を受信すると、当該音声情報を出力する出力手段と、を有する。
 第二の側面は、サーバ装置に関する。
 第二の側面に係るサーバ装置は、
 端末の位置情報、又は個人の位置情報を取得する位置情報取得手段と、
 取得した前記位置情報を用いてジングルを選択する選択手段と、
 取得した前記位置情報を用いて再生音声情報を決定する決定手段と、
 前記ジングルおよび前記再生音声情報の順に再生させるように音声情報を生成し、生成した前記音声情報を前記端末に再生させる音声再生制御手段と、を有する。
 第三の側面は、少なくとも1つのコンピュータにより実行される情報処理方法に関する。
 第三の側面に係る情報処理方法は、
 サーバ装置が、
 端末の位置情報、又は個人の位置情報を取得し、
 取得した前記位置情報を用いてジングルを選択し、
 取得した前記位置情報を用いて再生音声情報を決定し、
 前記ジングルおよび前記再生音声情報の順に再生させるように音声情報を生成し、生成した前記音声情報を前記端末に再生させる、ことを含む。
 第四の側面は、音声メッセージのデータ構造に関する。
 第四の側面に係る音声メッセージのデータ構造は、
  端末で再生されるように生成される音声メッセージのデータ構造であって、
 前記音声メッセージは、
  前記端末の位置情報、又は個人の位置情報を用いて選択されたジングルと、
  前記位置情報を用いて決定された再生音声情報と、をこの順に含み、かつ、この順に再生され、
 前記再生音声情報は、さらに、
  前記位置情報に関連して個人が体験できる内容に関する情報と、
  その位置情報が示す施設を特定する情報と、をこの順に含み、かつ、この順に再生される。
 なお、本発明の他の側面としては、上記第三の側面の方法を少なくとも1つのコンピュータに実行させるプログラムであってもよいし、このようなプログラムを記録したコンピュータが読み取り可能な記録媒体であってもよい。この記録媒体は、非一時的な有形の媒体を含む。
 このコンピュータプログラムは、コンピュータにより実行されたとき、コンピュータに、サーバ装置上で、その情報処理方法を実施させるコンピュータプログラムコードを含む。
 なお、以上の構成要素の任意の組合せ、本発明の表現を方法、装置、システム、記録媒体、コンピュータプログラムなどの間で変換したものもまた、本発明の態様として有効である。
 また、本発明の各種の構成要素は、必ずしも個々に独立した存在である必要はなく、複数の構成要素が一個の部材として形成されていること、一つの構成要素が複数の部材で形成されていること、ある構成要素が他の構成要素の一部であること、ある構成要素の一部と他の構成要素の一部とが重複していること、等でもよい。
 また、本発明の方法およびコンピュータプログラムには複数の手順を順番に記載してあるが、その記載の順番は複数の手順を実行する順番を限定するものではない。このため、本発明の方法およびコンピュータプログラムを実施するときには、その複数の手順の順番は内容的に支障のない範囲で変更することができる。
 さらに、本発明の方法およびコンピュータプログラムの複数の手順は個々に相違するタイミングで実行されることに限定されない。このため、ある手順の実行中に他の手順が発生すること、ある手順の実行タイミングと他の手順の実行タイミングとの一部ないし全部が重複していること、等でもよい。
 上記各側面によれば、端末に音声情報を配信した場合において、端末の保持者にその情報に対する意欲を持たせる音声メッセージシステム、サーバ装置、サーバ装置の情報処理方法、プログラム、および音声メッセージのデータ構造を提供することができる。
 上述した目的、およびその他の目的、特徴および利点は、以下に述べる好適な実施の形態、およびそれに付随する以下の図面によってさらに明らかになる。
本発明の実施の形態に係る音声メッセージシステムの構成を概念的に示す図である。 位置情報記憶部のデータ構造の例を示す図である。 音声データのデータ構造を示す図である。 サーバ装置の論理的な構成を示す機能ブロック図である。 ジングル記憶部のデータ構造の例を示す図である。 端末の構成を論理的に示す機能ブロック図である。 サーバ装置又は端末を実現するコンピュータの構成の一例を示すブロック図である。 サーバ装置の動作の一例を示すフローチャートである。 端末の動作の一例を示すフローチャートである。 サーバ装置の構成を論理的に示す機能ブロック図である。 行動履歴記憶部と再生音声情報記憶部のデータ構造の一例を示す図である。 行動履歴記憶部のデータ構造の他の例を示す図である。 実施例1の論理的な構成を示す機能ブロック図である。
 以下、本発明の実施の形態について、図面を用いて説明する。尚、すべての図面において、同様な構成要素には同様の符号を付し、適宜説明を省略する。
(第1の実施の形態)
 図1は、本発明の実施の形態に係る音声メッセージシステム1の構成を概念的に示す図である。
 音声メッセージシステム1は、サーバ装置100と、端末200と、を備える。サーバ装置100は、例えば、ビーコン発信機50の通信圏52内に進入した端末200に状況に応じた音声メッセージを再生出力させる。ビーコン発信機50は、例えば、ブルートゥース(登録商標)規格に準拠した通信によりビーコンを発信するものでもよいし、無線LAN(Local Area Network)通信、所謂Wi-Fi(Wireless Fidelity)通信のアクセスポイント(不図示)に含まれ、ビーコンを発信するものでもよい。
 ビーコンは位置情報を含み、端末200がビーコンから位置情報を取得してサーバ装置100に送信してもよい。あるいは、ビーコンは位置情報の代わりにIP(Internet Protocol)アドレス等の識別情報を含む構成でもよい。図2(a)に示すように、サーバ装置100は、識別情報と位置情報を対応付けて位置情報記憶部114に記憶しておく。端末200はビーコンから取得した識別情報をサーバ装置100に送信し、サーバ装置100は識別情報から位置情報を特定してもよい。言い換えれば、ビーコン発信機50は、その周辺の位置情報を特定できる情報を含むビーコンを発信する。
 さらに、位置情報記憶部114は、図2(b)のように、識別情報に施設または区域を示す情報を対応付けて記憶してもよい。
 本明細書において、「取得」とは、自装置が他の装置や記憶媒体に格納されているデータまたは情報を取りに行くこと(能動的な取得)、たとえば、他の装置にリクエストまたは問い合わせして受信すること、他の装置や記憶媒体にアクセスして読み出すこと等、および、自装置に他の装置から出力されるデータまたは情報を入力すること(受動的な取得)、たとえば、配信(または、送信、プッシュ通知等)されるデータまたは情報を受信すること等、の少なくともいずれか一方を含む。また、受信したデータまたは情報の中から選択して取得すること、または、配信されたデータまたは情報を選択して受信することも含む。
 また、ビーコンは位置情報および識別情報のいずれも含まなくてもよい。端末200はビーコンを受信したことをトリガとして、端末200のGPS(Global Positioning System)受信機能を用いて位置情報を取得し、端末200の位置情報をサーバ装置100に送信してもよい。あるいは、端末200はビーコンを受信したことをトリガとして、ビーコンを受信したことをサーバ装置100に通知し、通知を受けて、サーバ装置100が、例えば、携帯電話回線網(不図示)への端末200の位置登録の情報に基づいて端末200の位置情報を特定してもよい。
 端末200は、個人(利用者U1)に保持されている、又は、個人の周囲に位置している端末である。端末200は、個人の所有物であってもよいし、個人に貸与されるものであってもよい。
 端末200は、例えば、スマートフォン、タブレット端末、ノート型パーソナルコンピュータ、携帯電話機、PHS(Personal Handyphone System)、PDA(Personal Digital Assistants)、ウェアラブル端末、ポータブルデジタル音楽プレーヤ、ポータブルビデオプレーヤ、ポータブルゲーム機、ポータブルテレビ受像機等を含み、音声出力する機能を有するポータブル又はウェアラブルな端末であれば特に限定されない。また、端末200は、音声メッセージの出力に特化したイヤホンデバイス、所謂ガイド端末や、本システム専用の音声出力端末であってもよい。また、端末200は、利用者U1が利用する輸送用装置(一例として、車両、自動車、二輪自動車、自転車、列車、バス、リヤカー、人力車、船舶(ship and other watercraft)、飛行機、ロケット、人工衛星、ドローン、気球など)のアイテムであっても良い。
 また、複数の端末、例えば、ウェアラブル端末とスマートフォンが協働して、端末200の各機能を分担して実行し、端末200の機能全体を実現してもよい。例えば、利用者U1の位置情報、利用者U1の動作(移動速度、歩幅、移動方向、顔や体の向き等)、利用者U1の状態(心拍数、消費エネルギ、体温等)、または周辺の気候情報(気温、気圧等)等をウェアラブル端末が検出し、検出した情報をスマートフォンに送信し、スマートフォンが取得した情報をサーバ装置100に送信してもよい。また、他の例では、音声メッセージの出力をウェアラブル端末から行い、その他の処理はスマートフォンで行うなどでもよい。
 本発明は音声メッセージによって個人の意欲を喚起することを目的とする。そのためには、意欲後に即特定の行為(動詞)選択を行うように働きかけることが必要である。しかし、本発明では音声メッセージの配信のみによって意欲喚起を達成させるために、配信されるメッセージは、対象の説明をする情報というよりも、そこでの「体験」が想起される具体的な情報が含まれていることが重要である。
 メッセージ内容には、対象を説明する情報ではなく、そこでの「体験」が想起される具体的な情報が含まれている。メッセージ内容は、簡潔であることがより好ましい。意欲喚起または行為誘発を目的とした本発明では、メッセージの設計に関して、広告主である配信者の視座に立脚せずに、受信者の視座に定位する。これは、従来のマーケティングで言われてきた「消費者目線」でのアプローチとは、以下の点で意味が異なる。
(a1)メッセージ内容ではなく、その「形式」が消費者目線であること。
(a2)他との比較を可能にする内容が含まれ「ない」こと。
 上記の2点の具体例を以下に示す。
 まず、意欲喚起または行為誘発を行うには、対象の説明情報を伝達することが第一の目的とはならいない。そのため、メッセージは個人に特定の行為を促すために提示される情報、謂わば、「釣り針」であると考えられる。
 例えば、観光サービスにおいて観光地や施設などに関する情報を提供するメッセージ「AA寺は、BB時代にCCが建てた日本最古のお寺です」は、それを聞いた後にそこで何をどうするかを受信者が考えねばならない情報である。この類の情報は、認知および心理の観点から言えば意欲喚起または行為誘発までの距離が長い。意欲喚起または行為誘発に関わるメッセージは、より受信者にとって自分自身の行為選択(そこで何をするのか)が直接的および直感的に理解される方が好ましい。
 本発明のメッセージは、「この先で、座禅体験ができます/BBBが描いた美人画が御覧頂けます/」等のように、そこで何が可能になるかについて記述する形式とすることで、「体験」が想起されるメッセージとなる。これが、上記(a1)の意味である。
 また本発明のメッセージは、可能であれば、想起される「体験」が、「そこでだけ」可能であるという趣旨が強調されるメッセージであることが望ましい。これが、上記(a2)の意味である。
 過去に施設を訪れた際の体験や感想はブログ、ツイッター(登録商標)等のSNS(Social Networking Service)でインターネット上に多数公開されている。したがって、音声メッセージシステム1では、例えば、これら公開情報を蓄積および加工し、体験を想起するメッセージテキストを作ることができる。
 メッセージの生成は、人が作成してもよいし、AI(Artificial Intelligence)技術を用いて装置により自動的に生成されてもよいし、それらの組み合わせでもよい。生成されたメッセージは施設に対応付けて、後述する再生音声情報記憶部112に記憶される。
 また、個人が類似体験を経験している場合は、重複しないような体験メッセージテキストを配信することで、個人の意欲喚起または行為誘発をより促すことができる。類似体験を経験しているか否かは個人の行動履歴を参照することで判断できる。この行動履歴については後述する実施形態で詳細に説明する。
 個人にとって、メッセージ再生は個人の動作や会話に割り込む形で発生することになる。よって、唐突に音声が発せられることは混乱を招き、不快さを感じさせる可能性もある。本発明では、こうした問題点を解決するための手段として、ジングルの利用を採用する。ジングルはラジオなどの聴覚のみのメディアにおいて一般的に用いられる注意喚起手法で、コマーシャルや番組などのコンテキストの移り変わりを明示的にするために、特定のパターンの音要素を用いるものである。
 本発明では、ジングルとは、気付き、および所定のイメージを想起させる効果を持つ、短いメロディ(曲、音楽、歌を含む)、短い音(自然音、合成音、楽器音、音声、合成音声を含む)、または、これらの組み合わせとする。「短い」とは、ジングルの出力時間が、少なくとも1~3秒程度の長さであり、利用者U1が少なくともジングルを認識できる長さとする。
 図3は、本実施形態の音声データ300のデータ構造を示す図である。
 音声データ300は、ジングル302と、再生音声情報310とがこの順に再生されるように構成される。また、再生音声情報310は、メッセージ312と、対象名314と、がこの順に再生されるように構成される。
 このように、まずメッセージの冒頭でジングルを発音させることでメッセージの再生を予告し個人の受容度を上げる。つまり、ジングル機能は「自然に個人に割り込める音要素であること」となる。
 正弦波形を利用したブザーやアラート音は、一般に倍音成分が少なく認識しやすい反面、脳に直接的なサウンドとなる傾向があるため、危険や注意を促す点においては有用であるが心地よいサウンドとならないことが多い。また、イヤホンなどの音声デバイスは耳の至近距離で試聴することを前提としているため、サウンドのアタック部分(音の始まり)に鋭角な音を使用すると、ストレスを感じやすい。そのため、本発明では倍音構成の豊かなサウンドかつ、複数の音色を時間差で組み合わせることで受容しやすい聴覚体験をもたらすジングルとする。
 例えば、川であれば川のせせらぎ、滝であれば滝の音など場所を想起させる自然音を使用すると、物質的な理解度を上げることは可能であるが、自然音の場合、聴取時間を長くしないと認識しにくいという欠点がある。
 次に同じ生音でもピアノやバイオリンといったリアルな楽器音を使用した場合、一聴して楽器の形状や、聞いた人が今までに体験したそれぞれの楽器に対するイメージが明確となり、ジングルの印象度が増しすぎる危険性も含んでいる。
 一方、電子音の場合は具体的なイメージを想像しにくい反面、万人に対して一定の印象を与えることが可能である。また、リアルな楽器音の場合では、その楽器の特性上、演奏困難または著しく特異な奏法となってしまう音列を使用しても違和感が無いため、音程や和音の自由度が増し、音としての機能性をまとめやすい。結果として電子音でかつブザー音にならない程度のリアルさ(一般的に耳にする機会の多いサウンド)というバランス感が重要となる。
 このようにして設計されたジングルは、後述するジングル記憶部110に施設または体験内容等と対応付けて記憶される。
 再生音声情報310は、位置情報に関連して個人が体験できる内容に関する情報を示すメッセージ312と、その位置情報が示す施設等を特定する情報を示す対象名314を、図3に示したように、この順に含んでいる。
 メッセージ312に含まれる体験内容に関する情報とは、例えば、「舞妓さんの衣装に着替えて、舞妓さんになりきって京都の町を散策しよう。本物の舞妓さんと一緒に記念撮影もできるよ。」等である。このメッセージ312の後に続く対象名314は、例えば、「XYZ写真館」等である。
 図4は、本実施形態のサーバ装置100の論理的な構成を示す機能ブロック図である。
 サーバ装置100は、位置情報取得部102と、選択部104と、決定部106と、音声再生制御部108と、を備える。
 位置情報取得部102は、端末200の位置情報、又は個人(利用者U1)の位置情報を取得する。選択部104は、取得した位置情報を用いてジングルを選択する。決定部106は、取得した位置情報を用いて再生音声情報を決定する。音声再生制御部108は、ジングルおよび再生音声情報の順に再生させるように音声情報を生成し、生成した音声情報を端末200に再生させる。
 端末200の位置情報の取得方法は、以下に例示されるがこれらに限定されない。
(b1)端末200から受信する。
(b2)端末200の位置登録により取得した情報を基地局70から取得する。
(b3)端末200がアクセスしたアクセスポイントから取得する。
 サーバ装置100は、ジングル記憶部110および再生音声情報記憶部112に接続される。ジングル記憶部110および再生音声情報記憶部112は、サーバ装置100の内部の記憶装置でもよいし、外部の記憶装置でもよいし、それらの組み合わせでもよい。
 位置情報を取得するタイミングは、端末200から送信された位置情報、位置情報を特定するための識別情報、または、ビーコンを受信したことの通知を受信したとき、あるいは、一定期間毎に定期的となる。また、サーバ装置100が情報を能動的に取得してもよいし、外部から送信された情報を受動的に取得してもよい。
 なお、ビーコン発信機50から発信されたビーコンを受信した端末200が送信した位置情報を受信した場合は、端末200に再生音声情報(以後、「音声メッセージ」とも呼ぶ)を送信するタイミングであるため、サーバ装置100は、受信したタイミングで端末200に音声メッセージを送信してよい。
 一方、端末200の位置情報が定期的に受信したものである場合は、サーバ装置100の位置情報取得部102は、その位置情報に基づいて、音声メッセージを配信する条件を満たしているか否かを判定する処理をさらに行う。
 図2(c)に示すように、サーバ装置100は、音声メッセージを配信する対象施設または対象区域と、その位置情報を対応付けて位置情報記憶部114に記憶しておく。位置情報取得部102は、位置情報記憶部114を参照して、取得した位置情報が対象施設または対象区域に対応するか否かを判定することができる。対象施設または対象区域であると判定された場合に、その位置情報に基づいて、音声メッセージを配信する処理を行う。
 ジングル記憶部110には、複数のジングルが記憶される。
 選択部104は、位置情報取得部102が取得した位置情報の位置の属性を特定し、さらに、特定した属性に基づいて、ジングルを選択する。
 選択部104は、位置情報を用いて施設を特定し、その施設のカテゴリを位置の属性とする。選択部104は、位置情報が示す位置で体験できる内容の属性を、その位置の属性としてもよい。選択部104は、施設のカテゴリと位置情報が示す位置で体験できる内容の属性とを組み合わせて、位置の属性としてもよい。
 例えば、図2(d)に示すように、位置情報記憶部114は、対象施設または対象区域を示す情報と位置情報に、カテゴリと体験内容の少なくともいずれか一方を対応付けて記憶する。
 例えば、施設のカテゴリは、観光、グルメ、自然、文化、レジャー、商業、イベント、教育、政治、交通等を含む。例えば、図5(a)に示すように、施設のカテゴリ毎にジングルを対応付けてジングル記憶部110に記憶してもよい。また、図5(b)に示すように、施設毎に、その施設特有のジングルを対応付けてジングル記憶部110に記憶してもよい。
 図5(a)と図5(b)の両方のテーブルを用いてジングルを選択する場合について、説明する。選択部104は、図2の位置情報記憶部114を参照して位置情報から施設を特定した後、まず、図5(b)のテーブルを参照し、施設に対応付けられた施設特有のジングルがあれば、そのジングルを選択する。もし、施設に対応付けられた施設特有のジングルがなければ、次に図2(d)の位置情報記憶部114を参照して、その施設のカテゴリを特定する。そして、図5(a)のテーブルを参照して特定されたカテゴリに対応付けられたジングルを選択する。
 図5(c)の例では、体験できる内容の属性にジングルを対応付けてジングル記憶部110に記憶している。ジングル記憶部110は、図5(a)、図5(b)、および図5(c)のうち少なくともいずれか1つを含むのが好ましい。また、ジングル記憶部110は、位置情報または施設または区域を示す情報にジングルを対応付ける構成でもよい。
 再生音声情報記憶部112には、複数の再生音声情報が記憶され、音声データおよびテキストデータの少なくともいずれか一方のファイル形式で記憶される。
 再生音声情報記憶部112には、再生音声情報のファイル名やパスの情報と、位置情報、あるいは、施設または区域を示す情報とを対応付けたテーブルと、再生音声情報のデータファイルが記憶される。
 図5(a)~図5(c)の例では、1つの位置の属性に対して1つのジングルが対応付けられている例を示した。しかし、1種類の位置の属性に対して複数のジングルが対応付けられていてもよい。この場合、選択部104は、後述する行動履歴に基づいて、所定期間中に複数回同じ端末200または利用者U1の位置情報を取得したときに、毎回異なるジングルを選択してもよい。
 ファイル形式がテキストデータの場合は、サーバ装置100又は端末200がテキスト読み上げ手段を備え、テキスト読み上げ手段により音声データを生成して出力することができる。端末200がテキスト読み上げ手段を有している場合は、音声再生制御部108は端末200にテキストデータの再生音声情報を送信してもよい。テキスト読み上げ手段は、例えば、テキスト読み上げ機能を有するアプリケーションで実現できる。
 音声データファイルの形式は特に限定されず、WAV,AIFF,mp3,ACC,WMA,ATRAC,mp4等様々な形式が考えられるが、再生出力する端末200が再生可能な形式とする。
 例えば、端末200は、利用者が再生可能なファイル形式を選択設定できる機能を有しているのが好ましい。例えば、アプリケーションの設定メニュー等で設定を受け付けてもよいし、予めユーザ登録した利用者が端末200から音声メッセージシステム1にログインし、設定画面等で設定を受け付けてもよい。設定情報は、利用者毎に利用者情報に含めて登録することができる。
 サーバ装置100は設定情報を取得し、設定されたファイル形式で端末200に音声データを送信することができる。また、本発明の音声メッセージシステム1専用のイヤホンデバイスであれば、所定のファイル形式に予め定めておくこともできる。
 また、端末200がジングル記憶部110からジングルおよび再生音声情報記憶部112から再生音声情報の少なくともいずれか一方を読み出して音声を再生出力してもよい。その場合は、サーバ装置100の音声再生制御部108は、端末200に、音声出力すべきジングルおよび再生音声情報の少なくともいずれか一方を特定できる情報を送信すればよい。
 図6は、本実施形態の端末200の構成を論理的に示す機能ブロック図である。
 端末200は、位置情報取得部202と、位置情報送信部204と、再生音声情報受信部206と、音声再生出力部208と、を備える。
 位置情報取得部202は、端末200、または端末200周辺の位置情報を取得する。
 端末200が位置情報を取得する方法は、以下に例示されるがこれらに限定されない。
(c1)GPS(Global Positioning System)衛星60又は準天頂衛星から位置情報を受信する。
(c2)ビーコン発信機50から受信したビーコン信号から位置情報を取得する。
 例えば、上記(c1)は、屋外または広域を対象として位置情報を取得するのに適している。上記(c2)は、屋内または比較的狭い範囲を対象として位置情報を取得するのに適している。
 端末200は、例えば、地磁気センサを用いて屋内か屋外かを検知して上記(c1)と(c2)の位置情報の取得方法を切り替えてもよい。
 位置情報送信部204は、取得した位置情報をサーバ装置100に送信する。
 また、上記したように、位置情報取得部202は、ビーコン発信機50から発信されるビーコンを受信し、位置情報送信部204は、ビーコンを受信したことを通知する情報をサーバ装置100に送信してもよい。その構成では、サーバ装置100側で端末200の位置情報を特定する。
 再生音声情報受信部206は、サーバ装置100から再生音声情報を受信する。
 音声再生出力部208は、再生音声情報受信部206が受信した再生音声情報を作成してスピーカ(不図示)から出力する。
 音声再生出力部208が再生音声情報を出力するタイミングは、再生音声情報を受信したときが好ましい。また、再生音声情報はサーバ装置100からストリーミング配信され、端末200は再生音声情報を再生音声情報受信部206により受信しながら音声再生出力部208により再生してもよい。
 また、他の構成では、端末200再生音声情報を複数予め格納しておき、サーバ装置100から出力すべきジングル302および再生音声情報310の情報を受信し、受信した情報に従って音声データ300を構成して再生出力してもよい。
 図7は、図4のサーバ装置100又は図6の端末200を実現するコンピュータ80の構成の一例を示すブロック図である。
 本実施形態のコンピュータ80は、CPU(Central Processing Unit)82、メモリ84、メモリ84にロードされた後述する図4又は図6の機能ブロック図の構成要素を実現するプログラム90、そのプログラム90を格納するストレージ85、I/O(Input/Output)86、および通信用インタフェース(通信I/F87)を備える。
 CPU82、メモリ84、ストレージ85、I/O86、通信I/F87は、バス89を介して互いに接続され、CPU82によりサーバ装置100又は端末200が制御される。ただし、CPU82などを互いに接続する方法は、バス接続に限定されない。
 メモリ84は、RAM(Random Access Memory)やROM(Read Only Memory)などのメモリである。ストレージ85は、ハードディスク、SSD(Solid State Drive)、またはメモリカードなどの記憶装置である。また、ストレージ85は、RAMやROMなどのメモリであってもよい。
 CPU82が、ストレージ85に記憶されるプログラム90をメモリ84に読み出して実行することにより、サーバ装置100又は端末200の各機能を実現することができる。
 I/O86は、コンピュータ80と他の入出力装置間のデータおよび制御信号の入出力制御を行う。他の入出力装置とは、たとえば、コンピュータ80に接続されるキーボード、タッチパネル、マウス、操作スイッチ、操作ボタン、およびマイクロフォン等の入力装置(不図示)と、ディスプレイ、プリンタ、およびスピーカ等の出力装置(不図示)と、これらの入出力装置とコンピュータ80のインタフェースとを含む。さらに、I/O86は、他の記録媒体の読み取りまたは書き込み装置(不図示)とのデータの入出力制御を行ってもよい。
 通信I/F87は、コンピュータ80と外部の装置との通信を行うための各種の通信用インタフェースを含む。サーバ装置100または端末200の通信機能は、以下に例示されるが、これらに限定されない。
(d1)近距離無線通信機能
 近距離無線通信は、例えば、ブルートゥース通信、赤外線通信、RFID(Radio Frequency Identification)システムを用いた無線通信、NFC(Near Field Communication)規格に従った無線通信等を含む。端末200は近距離無線通信機能によりビーコン発信機50から発信されるビーコンを受信できる。
(d2)無線LAN(Local Area Network)(以下、Wi-Fiと呼ぶ)通信機能
 サーバ装置100はWi-Fi通信機能を用いてルータ等のアクセスポイント経由でインターネット等のネットワーク40に接続する。
 端末200はWi-Fi通信機能を用いてアクセスポイントからビーコンを受信できる。また、端末200はWi-Fi通信機能を用いてアクセスポイント経由でインターネット等のネットワーク40に接続する。
(d3)移動体データ通信機能(例えば、3G(3rd Generation)、4G(4th Generation)、LTE(Long Term Evolution)等)
 端末200は移動体データ通信機能を用いて基地局70を経由して携帯電話回線網(不図示)に接続してサーバ装置100と通信してもよい。
 サーバ装置100と端末200は、ネットワーク40または他のネットワークを介して通信できる。
(d4)GPS受信機能
 端末200はGPS受信機能を用いてGPS衛星60から位置情報を受信する。
 図4のサーバ装置100または図6の端末200の各構成要素は、図7のコンピュータ80のハードウェアとソフトウェアの任意の組合せによって実現される。そして、その実現方法、装置にはいろいろな変形例があることは、当業者には理解されるところである。以下説明する各実施形態のサーバ装置100または端末200を示す機能ブロック図は、ハードウェア単位の構成ではなく、論理的な機能単位のブロックを示している。
 なお、各図において、本発明の本質に関わらない部分の構成については省略してあり、図示されていない。
 図7のコンピュータ80のCPU82が、ストレージ85に記憶されるプログラム90をメモリ84に読み出して実行することにより、サーバ装置100の図4の各ユニット、または端末200の図6の各ユニットの各機能を実現することができる。
 本実施形態のコンピュータプログラムは、コンピュータで読み取り可能な記録媒体に記録されてもよい。記録媒体は特に限定されず、様々な形態のものが考えられる。また、プログラムは、記録媒体からコンピュータのメモリにロードされてもよいし、ネットワークを通じてコンピュータにダウンロードされ、メモリにロードされてもよい。
 コンピュータプログラム90を記録する記録媒体は、非一時的な有形のコンピュータ80が使用可能な媒体を含み、その媒体に、コンピュータ80が読み取り可能なプログラムコードが埋め込まれる。コンピュータプログラム90が、コンピュータ80上で実行されたとき、コンピュータ80に、サーバ装置100または端末200を実現する以下の情報処理方法を実行させる。
 端末200が、例えば、ガイド端末等でその場で利用者U1に貸与されるデバイスの場合、予め端末200に図6の各ユニットの各機能を実現するプログラムがインストールされていてもよい。端末200がスマートフォン等の利用者の所有物の場合、図6の各ユニットの各機能を実現するアプリケーションプログラムをインストールして実行することで、本発明の端末200を実現してもよい。
 本実施形態のコンピュータプログラムは、サーバ装置100を実現させるためのコンピュータに、端末200の位置情報、又は個人の位置情報を取得する手順、取得した位置情報を用いてジングルを選択する手順、取得した位置情報を用いて再生音声情報を決定する手順、ジングルおよび再生音声情報の順に再生させるように音声情報を生成し、生成した音声情報(音声データ300)を端末200に再生させる手順、を実行させるように記述されている。
 このように構成されたサーバ装置100の動作について以下説明する。
 図8は、サーバ装置100の動作の一例を示すフローチャートである。
 まず、サーバ装置100において、位置情報取得部102が、端末200の位置情報を取得する(ステップS101)。そして、選択部104が、取得した位置情報を用いてジングルを選択する(ステップS103)。そして、決定部106が、取得した位置情報を用いて再生音声情報を決定する(ステップS105)。そして、音声再生制御部108が、ジングルおよび前記再生音声情報の順に再生させるように音声情報を生成し(ステップS107)、生成した音声情報を端末200に再生させる(ステップS109)。
 次に、端末200の動作について説明する。
 図9は、端末200の動作の一例を示すフローチャートである。
 まず、端末200において、位置情報取得部202が位置情報を取得して(ステップS201)、取得した位置情報を位置情報送信部204がサーバ装置100に送信する(ステップS203)。そして、再生音声情報受信部206は、サーバ装置100から受信した再生音声情報を再生してスピーカから出力する(ステップS205)。
 以下、各図を用いてサーバ装置100と端末200の一連の動作を説明する。
 はじめに、利用者U1は端末200を携行して行動を開始する。このとき、端末200の本音声メッセージシステム1のアプリケーションを起動する。そして、利用者U1が移動して図1のビーコン発信機50の通信圏52内に進入すると、ビーコン発信機50から発信されているビーコンを位置情報取得部202が受信する。そして、位置情報取得部102は受信したビーコンに含まれる位置情報を取得して(図9のステップS201)、位置情報送信部204はその位置情報を端末200に送信する(図9のステップS203)。
 そして、サーバ装置100の位置情報取得部102は端末200から位置情報を受信する(図8のステップS101)。選択部104は、図2(d)の位置情報記憶部114を参照し、位置情報から施設、施設のカテゴリ、および体験内容を位置の属性として特定し、さらに、図5のジングル記憶部110を参照して、施設の属性に対応するジングル302を選択する(図8のステップS103)。
 さらに、決定部106は、位置情報または特定した位置の属性に対応するメッセージ312および対象名314を決定する(図8のステップS105)。そして、音声再生制御部108は、ジングル302、メッセージ312、対象名314の順に音声データ300を生成し(図8のステップS107)、生成した音声データ300を端末200に送信する(図8のステップS109)。
 端末200では、サーバ装置100から送信された音声データ300を再生音声情報受信部206が受信する(図9のステップS203)。そして、音声再生出力部208は、受信した音声データ300を再生し、スピーカから出力する(図9のステップS205)。
 以上説明したように、本実施形態において、サーバ装置100は、個人の位置情報を取得し、取得した位置情報に基づいてジングル302を選択し、位置情報に対応する再生音声情報310を決定し、ジングル302、再生音声情報310の順に音声データ300を生成して端末200に再生出力させる。位置情報に基づいて、端末200に音声データ300を出力させる際に、はじめにジングル302を出力することで、まず利用者に気付きと体験を想起させることができる。適切なジングル302を選択することで利用者に不快感を与えたりストレスを感じさせたりすることを防ぐことができる。そして、ジングル302に続いて再生音声情報310を出力することで、利用者に意欲喚起又は行為誘発を促すことができる。
 また、上記したように、再生音声情報310は、メッセージ312と対象名314とがこの順に再生される構成となっていて、メッセージ312には、その場所で体験できる内容を想起させる情報を含み、かつ、他との比較を可能にする内容が含まれないため、メッセージ312の受信者が、受け入れやすく、直ぐに行動を起こす判断ができる。
 対象名314、メッセージ312の順に再生音声情報310が出力される場合、メッセージ312を聴いて興味を持ったとしても、対象名314を聞きそびれてしまっているとそこに行く行動が起こせなくなってしまう。しかし、本実施形態のように、メッセージ312、対象名314の順な、対象名314が最後に出力されると、利用者は、メッセージ312の内容に興味を持った後で、注意して対象名314を聴くことができ、行動を起こすことが可能となる。
(第2の実施の形態)
 図10は、本実施形態のサーバ装置100の構成を論理的に示す機能ブロック図である。
 サーバ装置100は、さらに、行動履歴にと組まれる再生を用いてジングルを選択し、または再生音声情報の内容を選択する点以外は、図4の上記実施形態と同じである。
 サーバ装置100は、行動履歴記憶部120に接続される。行動履歴記憶部120は、サーバ装置100の内部の記憶装置でもよいし、外部の記憶装置でもよし、それらの組み合わせでもよい。
 行動を起こした属性を含む行動履歴を行動履歴記憶部120に記憶しておき、この行動履歴に含まれる属性を用いて、再生音声情報の内容を選択する。
 図11(a)に示すように、行動履歴記憶部120には、利用者の識別情報(利用者ID:Identifier)に、位置情報あるいは、施設または区域の情報と、音声データ300を出力した後に行動を起こしたか否かを示す情報が対応付けて記憶されている。
 利用者の識別情報は、端末200を特定できる情報(例えば、IPアドレス、メールアドレス、電話番号、端末識別番号等)、または、音声メッセージシステム1の利用登録時に発行されるユーザIDなどの識別情報である。また、行動を起こしたか否かを示す情報とは、フラグであり、例えば、行動を起こした場合、フラグは1にセットされ、行動をおこさなかった場合、フラグは0にセットされる。
 なお、他の構成では、行動履歴記憶部120は、利用者が行動を起こした施設または区域の情報あるいは、位置情報を利用者IDに対応付けて記憶してもよい。逆に利用者が行動を起こさなかった施設または区域の情報あるいは、位置情報を利用者IDに対応付けて記憶してもよい。
 また、図11(b)に示すように、再生音声情報記憶部112には、位置情報あるいは、施設または区域の情報に、行動有りの場合のメッセージ312と、行動無しの場合のメッセージ312とが対応付けて記憶される。
 決定部106は、位置情報を取得したとき、図11(a)の行動履歴記憶部120を参照し、位置情報に対応する行動の有無を示す情報を取得する。さらに、決定部106は、図11(b)の再生音声情報記憶部112を参照し、その位置情報における行動の有無に対応するメッセージ312を取得する。
 また、行動履歴記憶部120は、その利用者に音声データ300が出力された日時をさらに含んでもよい。例えば、前回当該位置情報に利用者が来たことがあるか否かを行動履歴記憶部120から判断し、来たことがあるかないかに応じてメッセージ312を変えてもよい。あるいは、所定期間内に訪れているか否かを行動履歴記憶部120から判断し、所定期間内に訪れているか否かに応じてメッセージ312を変えてもよい。メッセージ312の変更方法は、複数のメッセージ312の中から選択する方法と、メッセージ312を出力するかしないかの切り替える方法でもよい。
 選択部104または決定部106は、行動履歴の情報を用いてジングル302またはメッセージ312を選択するが、そのタイミングは様々考えられる。例えば、直前の履歴情報を用いる場合と、以前の履歴情報を用いる場合と、ある特定の期間の履歴情報を用いる場合が考えられる。
 また、以前に同じ施設を訪れている場合、再度、その施設の訪問を促すメッセージ312とするパターン、その施設で可能な他の体験を勧めるメッセージ312とするパターン、その施設と同じジャンルの別の施設の訪問を促すパターン、およびその施設とは異なるジャンル(カテゴリ)の別の施設の訪問を促すパターン等が考えられる。
 いずれのパターンにするかは、利用者毎または施設毎等で予め定めておくこともできるし、切替条件を予め設定しておいてもよい。あるいは、AI技術を用いて機械学習させて利用者に適したパターンを決定してもよい。
 また、行動の有無については、音声メッセージの出力後所定時間以内(例えば、5分以内等)について検知してよい。つまり、音声メッセージによって行動を起こしたと考えられる場合のみ記録する。あるいは、行動を起こした場合に、音声メッセージの出力時刻から行動を起こした時刻までの時間間隔を記録してもよい。
 本実施形態によれば、上記実施形態と同様な効果を奏するとともに、さらに、行動を起こした属性を含む行動履歴の情報を用いてジングルまたは音声メッセージを選択することができるので、利用者の行動の有無に応じて適切な音声メッセージを配信でき、効果的に利用者の意欲を喚起して行動を誘発することができる。
 第二の実施形態の変形態様について以下に説明する。
<他の行動履歴を用いる形態>
 上記実施形態では、行動履歴として、位置情報と、行動の有無の情報を用いていた。本変形態様では、利用者の移動速度、移動方向、顔の向き等の情報を行動履歴として用いる。
 図12に示すように、行動履歴記憶部120には、利用者毎に、時刻情報(日時)、位置情報とともに、移動速度、移動方向、および顔の向き等のうち少なくともいずれか1つの情報とが記憶されている。
 位置情報あるいは、施設または区域の情報は、上記したいずれかの方法で位置情報取得部102が取得した情報であり、位置情報を取得した日時情報に関連付けて記憶される。
 移動速度や移動方向は、端末200に含まれる加速度センサやモーションセンサで計測される値をサーバ装置100が受信してもよいし、位置情報と時刻情報の履歴情報からサーバ装置100が算出した値でもよい。顔の向きの情報は、端末200に含まれるモーションセンサで計測される値をサーバ装置100が受信してよい。
 選択部104または決定部106は、これらの情報を用いてジングル302またはメッセージ312を選択する。選択のタイミングは上記したように、直前の履歴情報を用いる場合と、所定時間前から現在までの間の履歴情報を用いる場合と、以前の履歴情報を用いる場合と、ある特定の期間の履歴情報を用いる場合とが考えられる。
 例えば、直前の履歴情報の顔の向きの情報を用いて、利用者が顔を向けている方向が、誘導しようとしている施設と反対の方向に向いていれると判定された場合、選択部104は注意喚起レベルの高いジングル302を選択する。そして、決定部106は、再生音声情報310を「いま向かっている方向とは反対の方向に行くと、AAAが体験できるBBBがあります。」と決定する。
 あるいは、現在利用者が顔を向けている方向にある施設を選択して、対応するジングル302およびメッセージ312を選択および決定してもよい。
 また、所定時間前から現在までの間の履歴情報の移動速度の情報を用いて、利用者が徒歩で移動中か、乗り物に乗って移動中かを判定してもよい。そして、判定結果に基づいて、再生音声情報310を決定してもよい。例えば、徒歩で移動中の利用者には、「食べ歩きのできるお団子がこの角を右に曲がった左手にあります。店の名前はABC店です。」等の再生音声情報310とすることができる。乗り物で移動中の利用者には、「お土産にピッタリな煎餅が次のバス停の目の前にあります。店の名前はXYZ店です。」等の再生音声情報310とすることができる。
 また、徒歩での移動が一定時間以上継続しているか否かを判定し、判定結果に基づいて、例えば、休憩できる施設の利用を促したり、乗り物利用を促したり、最寄り駅やバス停の行き方や出発時刻の案内等の情報を含む再生音声情報310を決定してもよい。
<購買履歴を用いる形態>
 利用者の行動履歴記憶部120に、当該利用者の購買履歴情報、および属性情報の少なくともいずれか一方を組み合わせて、機械学習することで、利用者のその場所での趣味嗜好、行動パターンを分析し、場所(所定の区域内)毎に、利用者に推奨される施設、施設のカテゴリ、体験内容等の情報を登録する。
 選択部104および決定部106は、位置情報から場所を特定し、利用者に推奨される施設等の情報を取得し、対応するジングル302および再生音声情報310を設定および決定する。
 以上、図面を参照して本発明の実施形態について述べたが、これらは本発明の例示であり、上記以外の様々な構成を採用することもできる。
 上記第1の実施形態では、再生音声情報記憶部112は、位置情報にメッセージ312を対応付けて記憶されていて、決定部106は位置情報に基づいて、メッセージ312を決定していた。さらに、上記第2の実施形態では、さらに行動履歴に基づいて、メッセージ312を決定していた。他の実施形態では、位置情報に加え、別の条件に基づいて、メッセージ312を決定してもよい。
 例えば、利用者個人の属性を条件としてもよい。利用者の属性とは、性別、年齢層を含む。また、予めユーザ登録時に、趣味、嗜好、興味などの情報も利用者に登録させ、利用者の属性として記憶しておいてもよい。また、専用端末200を貸し出す場合などに、団体、グループ、個人等の利用単位の情報、あるいは、グループの場合は家族、友達、恋人等の種別の情報を利用者に登録させ、利用者の属性として記憶してもよい。
 また、利用者の属性として、ウェアラブル端末で計測された心拍数、消費エネルギ、体温等の情報を含んでもよい。あるいは、所定の位置に設けられた赤外線センサを用いて、利用者の表面温度を計測し、人の緊張状態等を判定し、利用者の属性としてもよい。
 また、季節、月、日付、曜日、特定の期間(特定の店舗のセール開催期間等)、または気象(気温、気圧等)などの情報を条件としてもよい。
 上記実施形態では、端末200が受信するビーコンには、施設情報は含まれていなかった。他の実施形態では、ビーコン発信機50は、ビーコンを受信した端末200からの応答に呼応して、ビーコン発信機50の周辺の施設の情報を端末200に送信してもよい。端末200の位置情報送信部204は、受信した施設の情報をサーバ装置100に送信してもよい。
 あるいは、端末200が位置情報記憶部114を備えてもよい。端末200の位置情報取得部202が位置情報を取得した後、位置情報送信部204が、位置情報記憶部114を参照し、取得した位置情報に対応する施設または区域の情報を取得し、サーバ装置100に送信してもよい。
 また、本発明は、音声出力を主なユーザインターフェースとしているが、表示手段および操作手段を用いた他のユーザインターフェースと組み合わせることもできる。音声データ300が出力された後、その音声メッセージの内容そのもの、またはその内容に関する情報を端末200のディスプレイに表示させてもよい。表示内容は、例えば、施設のウェブサイトのURL(Uniform Resource Locator)アドレス、連絡先、所在地の地図、経路情報等を含む。また、出力済みの音声データ300をリスト表示し、選択することで再度再生できる構成としてもよい。この場合は、ジングル302は再生出力しない構成とすることもできる。
(実施例1)
 実施例1では、利用者のスマートフォンに音声メッセージシステム1のサービスを提供するアプリケーションをインストールして利用する。
 図13は、実施例1の論理的な構成を示す機能ブロック図である。
 サーバ装置100は、履歴管理部402と、名称特定部404と、ジングル選択部406と、メッセージ生成部408と、メッセージ構築部410と、を備える。
 履歴管理部402は、個人の位置情報または端末200の位置情報を例えば、GPS衛星60から端末200が受信した情報を取得し、行動履歴記憶部120に蓄積する。
 名称特定部404は、取得した位置情報から、位置情報記憶部114を参照して、施設の施設名と、その施設のカテゴリを特定する。特定した施設名304をジングル選択部406とメッセージ構築部410に受け渡すとともに、特定した施設の情報をメッセージ生成部408に受け渡す。
 ジングル選択部406は、名称特定部404から受け取った施設のカテゴリと、履歴管理部402から受け取った行動履歴の情報を用いてジングルを選択する。そして、ジングル選択部406は、選択されたジングル302をメッセージ構築部410に受け渡す。
 メッセージ生成部408は、インターネット等を検索して、各施設で得た体験に関する情報を収集して蓄積し、再生音声情報310を再生音声情報記憶部112に記憶する。さらに、メッセージ生成部408は、名称特定部404で特定された施設の情報、または履歴管理部402から受け取った行動履歴の情報に応じて再生音声情報記憶部112から選別された施設の体験内容を含むメッセージ312を生成し、メッセージ構築部410に受け渡す。
 メッセージ構築部410は、ジングル選択部406、メッセージ生成部408、および名称特定部404から受け取った、ジングル302、メッセージ312、および対象名314をこの順に再生させる音声データ300を生成して出力する。この音声データ300は、端末200に送信され、再生出力される。
(実施例2)
 実施例2では、工事現場で音声メッセージシステム1を利用する。
 端末200は、各作業員が携行する。ビーコン発信機50は危険箇所等に設置する。
 危険箇所に作業員が接近すると、端末200の位置情報取得部202が、ビーコン発信機50から発信されるビーコン信号を受信し、位置情報送信部204がサーバ装置100にビーコン信号に含まれる位置情報を送信する。
 ジングル記憶部110には、危険箇所の警戒レベルに応じて複数のジングルが記憶されている。さらに、ジングル記憶部110には、工事現場内の各危険箇所の位置情報と、当該危険箇所の警戒レベルとが対応付けて記憶されている。選択部104は、受信した位置情報から危険箇所の警戒レベルを特定し、特定された警戒レベルに対応するジングルを選択する。警戒レベルが高い程、緊急性が伝わるジングルにすることができる。
 さらに、行動履歴記憶部120には、危険箇所の属性に応じて複数のメッセージの音声情報が記憶されている。さらに、行動履歴記憶部120には、位置情報と危険箇所の属性が対応付けて記憶されている。危険箇所の属性とは、例えば、頭上注意、足もと注意、重量制限、火気厳禁等を含む。あるいは、作業内容の属性を含んでもよく、高所作業注意、一人作業禁止、要換気等を含む。そして、決定部106は、位置情報から危険箇所の属性を特定し、特定した属性に対応するメッセージを選択する。あるいは、選択部104は、危険箇所の上記属性に応じてジングルを選択してもよい。例えば、注意すべき場所が頭上なのか足もとなのかを異なるジングルで知らせてもよい。
(実施例3)
 実施例3では、外国人観光客の観光ガイドとして音声メッセージシステム1を利用する。
 例えば、空港や観光地等で外国人観光客に端末200を貸し出す。あるいは、利用者の所持しているスマートフォンにアプリケーションをダウンロードさせるQRコード(登録商標)を配布し、ユーザ登録してももらい、サービスを提供してもよい。
 メッセージ312の言語(日本語、英語、中国語、韓国語、フランス語等)の選択を設定メニューで受け付け、選択された言語で出力してもよい。
 (実施例4)
 実施例4では、店舗等の情報を音声メッセージで出力することで、従来の広告や宣伝とは異なる手法で利用者の店舗利用を促す。
 昨今、各広告主は、パーソナルコンピュータ、スマートフォン、及びタブレットなどの個人向けの端末に、よりパーソナライズ化した効果的な情報を配信しようと躍起になっている。
 一方で、情報を受けた個人は端末を取り出す煩わしさから、その情報が自分の欲している情報であったとしても端末をわざわざ取り出すことはせず取りこぼし、広告主にとっては思うように個人に情報をリーチできていないという課題があった。
 そこで、端末取り出しを克服する手段として、音をユーザインターフェース(UI:User Interface)とした本発明の音声メッセージを利用する。
 なお、一般的な音声メッセージは、対象の説明をする情報が主体であり、意欲喚起又は行為誘発までには至っていない課題があった。また、個人の動作や会話に割り込んで再生される音声メッセージは不快感を生み、ストレスとなる課題があった。
 本発明の音声メッセージシステム1を採用することで、これらの課題を解決することができる。
 まず、広告を配信したい店舗や施設の位置情報を位置情報記憶部114に登録する。例えば、アウトレットモール等のような一定の区域内に複数の店舗が存在しているような場所で音声メッセージシステム1を利用する。各店舗や設備(授乳設備、おむつ替え用ベッド、ベンチ、喫煙所、トイレ、エレベータ、非常口等)の位置情報を登録することができる。
 ジングル記憶部110には、利用者にストレスを与えずに、気付きと体験を想起させるジングル302を店舗や設備毎、あるいは、それらのカテゴリ毎に格納する。そして、再生音声情報記憶部112には、その店舗や設備で体験または実行できる内容を含むメッセージ312を格納する。
 各店舗は、利用者を呼び込むためのメッセージ312をそれぞれ登録する。例えば、「甘くて冷たい北海道の夕張メロンのソフトクリームが食べられます。」、「15時から30分間のタイムセールを実施します。この秋流行のラインナップを豊富に取りそろえました。どうぞお見逃しなく。」等のメッセージを店舗毎に登録する。
 後者のメッセージのように、配信時間を特定できてもよい。指定した時間にのみ選択されるように配信対象時間(例えば、14時~15時)とともに登録すればよい。
 例えば、利用者は、アプリケーションをダウンロードして起動し、本音声メッセージシステム1の利用を開始することができる。アプリケーションは、あるアウトレットモール専用のものでもよいし、複数の商業施設で共通して利用できるものであってもよく、様々な形態が考えられる。
 また、利用者が得たいと考える設備情報を予め指定できる設定画面を設けてもよい。あるいは、利用者の属性として、喫煙者か、乳児を連れているか、老人か等の情報を予め登録できてもよい。喫煙者には喫煙所の位置情報を用いたメッセージを、乳児を連れている利用者には授乳室の位置情報を用いたメッセージを、老人にはエレベータ、エスカレータ、またはベンチ等の位置情報を用いたメッセージを配信してもよい。
 また、上記の喫煙、授乳、休憩等に関連する位置情報に対応するメッセージは、その場所に近づいた場合に都度配信されると情報過多になる可能性もある。そこで、これらのメッセージを配信した時刻を記録しておき、前回メッセージを配信した時刻から一定期間は同じ位置情報に対応するメッセージの配信を行わないようにするのがよい。
 また、行動履歴の情報を用いて利用者の行動周期を推定し、利用者にあった周期でメッセージ配信する構成としてもよい。
 以上、実施形態および実施例を参照して本願発明を説明したが、本願発明は上記実施形態および実施例に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
 なお、本発明において利用者に関する情報を取得、利用する場合は、これを適法に行うものとする。
 以下、参考形態の例を付記する。
1. 端末の位置情報、又は個人の位置情報を取得する位置情報取得手段と、
 取得した前記位置情報を用いてジングルを選択する選択手段と、
 取得した前記位置情報を用いて再生音声情報を決定する決定手段と、
 前記ジングルおよび前記再生音声情報の順に再生させるように音声情報を生成し、生成した前記音声情報を前記端末に再生させる音声再生制御手段と、を備えるサーバ装置。
2. 1.に記載のサーバ装置において、
 前記再生音声情報は、前記位置情報に関連して個人が体験できる内容に関する情報と、その位置情報が示す施設を特定する情報を、この順に含んでいる、サーバ装置。
3. 1.または2.に記載のサーバ装置において、
 前記選択手段は、前記位置情報取得手段が取得した前記位置情報の位置の属性を特定し、さらに、特定した前記属性に基づいて前記ジングルを選択する、サーバ装置。
4. 3.に記載のサーバ装置において、
 前記選択手段は、前記位置情報を用いて施設を特定し、その施設のカテゴリを前記位置の属性とする、サーバ装置。
5. 3.又は4.に記載のサーバ装置において、
 前記選択手段は、前記位置情報が示す位置で体験できる内容の属性を、前記位置の属性とする、サーバ装置。
6. 1.から5.のいずれか一つに記載のサーバ装置において、
 さらに、行動を起こした属性を含む行動履歴を記憶装置に記憶しておき、前記決定手段は、この行動履歴に含まれる前記属性を用いて、前記再生音声情報の内容を選択する、サーバ装置。
7. 端末で再生されるように生成される音声メッセージのデータ構造であって、
 前記音声メッセージは、
  前記端末の位置情報、又は個人の位置情報を用いて選択されたジングルと、
  前記位置情報を用いて決定された再生音声情報と、を含み、かつ、この順に再生され、
 前記再生音声情報は、さらに、
  前記位置情報に関連して個人が体験できる内容に関する情報と、
  その位置情報が示す施設を特定する情報と、を含み、かつ、この順に再生される、音声メッセージのデータ構造。
8. 7.に記載のデータ構造において、
 前記再生音声情報は、前記位置情報に関連して個人が体験できる内容に関する情報と、その位置情報が示す施設を特定する情報を、この順に含んでいる、データ構造。
9. サーバ装置が、
 端末の位置情報、又は個人の位置情報を取得し、
 取得した前記位置情報を用いてジングルを選択し、
 取得した前記位置情報を用いて再生音声情報を決定し、
 前記ジングルおよび前記再生音声情報の順に再生させるように音声情報を生成し、生成した前記音声情報を前記端末に再生させる情報処理方法。
10. 9.に記載の情報処理方法において、
 前記再生音声情報は、前記位置情報に関連して個人が体験できる内容に関する情報と、その位置情報が示す施設を特定する情報を、この順に含んでいる、情報処理方法。
11. 9.または10.に記載の情報処理方法において、
 前記サーバ装置が、
 取得した前記位置情報の位置の属性を特定し、さらに、特定した前記属性に基づいて前記ジングルを選択する、情報処理方法。
12. 11.に記載の情報処理方法において、
 前記サーバ装置が、
 前記位置情報を用いて施設を特定し、その施設のカテゴリを前記位置の属性とする、情報処理方法。
13. 11.又は12.に記載の情報処理方法において、
 前記サーバ装置が、
 前記位置情報が示す位置で体験できる内容の属性を、前記位置の属性とする、情報処理方法。
14. 9.から13.のいずれか一つに記載の情報処理方法において、
 さらに、行動を起こした属性を含む行動履歴を記憶装置に記憶しておき、
 前記サーバ装置が、この行動履歴に含まれる前記属性を用いて、前記再生音声情報の内容を選択する、情報処理方法。
15. コンピュータに、
 端末の位置情報、又は個人の位置情報を取得する手順、
 取得した前記位置情報を用いてジングルを選択する手順、
 取得した前記位置情報を用いて再生音声情報を決定する手順、
 前記ジングルおよび前記再生音声情報の順に再生させるように音声情報を生成し、生成した前記音声情報を前記端末に再生させる手順、を実行させるためのプログラム。
16. 15.に記載のプログラムにおいて、
 前記再生音声情報は、前記位置情報に関連して個人が体験できる内容に関する情報と、その位置情報が示す施設を特定する情報を、この順に含んでいる、プログラム。
17. 15.または16.に記載のプログラムにおいて、
 コンピュータに、
 取得した前記位置情報の位置の属性を特定し、さらに、特定した前記属性に基づいて前記ジングルを選択する手順を実行させるためのプログラム。
18. 17.に記載のプログラムにおいて、
 コンピュータに、
 前記位置情報を用いて施設を特定し、その施設のカテゴリを前記位置の属性とする手順を実行させるためのプログラム。
19. 17.又は18.に記載のプログラムにおいて、
 コンピュータに、
 前記位置情報が示す位置で体験できる内容の属性を、前記位置の属性とする手順を実行させるためのプログラム。
20. 15.から19.のいずれか一つに記載のプログラムにおいて、
 コンピュータに、
 さらに、行動を起こした属性を含む行動履歴を記憶装置に記憶しておき、この行動履歴に含まれる前記属性を用いて、前記再生音声情報の内容を選択する手順を実行させるためのプログラム。
21. サーバ装置と、
 端末と、を備え、
 前記サーバ装置は、
  前記端末の位置情報、又は個人の位置情報を取得する位置情報取得手段と、
  取得した前記位置情報を用いてジングルを選択する選択手段と、
  取得した前記位置情報を用いて再生音声情報を決定する決定手段と、
  前記ジングルおよび前記再生音声情報の順に再生させるように音声情報を生成し、生成した前記音声情報を前記端末に送信する送信手段と、を備え、
 前記端末は、
  前記サーバ装置に位置情報を送信する手段と、
  前記サーバ装置から前記音声情報を受信する手段と、
  前記音声情報を受信すると、当該音声情報を出力する出力手段と、を備える、音声メッセージシステム。
22. 21.に記載の音声メッセージシステムにおいて、
 前記再生音声情報は、前記位置情報に関連して個人が体験できる内容に関する情報と、その位置情報が示す施設を特定する情報を、この順に含んでいる、音声メッセージシステム。
23. 21.または22.に記載の音声メッセージシステムにおいて、
 前記選択手段は、前記位置情報取得手段が取得した前記位置情報の位置の属性を特定し、さらに、特定した前記属性に基づいて前記ジングルを選択する、音声メッセージシステム。
24. 23.に記載の音声メッセージシステムにおいて、
 前記選択手段は、前記位置情報を用いて施設を特定し、その施設のカテゴリを前記位置の属性とする、音声メッセージシステム。
25. 23.又は24.に記載の音声メッセージシステムにおいて、
 前記選択手段は、前記位置情報が示す位置で体験できる内容の属性を、前記位置の属性とする、音声メッセージシステム。
26. 21.から25.のいずれか一つに記載の音声メッセージシステムにおいて、
 さらに、行動を起こした属性を含む行動履歴を記憶装置に記憶しておき、前記決定手段は、この行動履歴に含まれる前記属性を用いて、前記再生音声情報の内容を選択する、音声メッセージシステム。 
 この出願は、2018年9月28日に出願された日本出願特願2018-185716号を基礎とする優先権を主張し、その開示の全てをここに取り込む。

Claims (26)

  1.  端末の位置情報、又は個人の位置情報を取得する位置情報取得手段と、
     取得した前記位置情報を用いてジングルを選択する選択手段と、
     取得した前記位置情報を用いて再生音声情報を決定する決定手段と、
     前記ジングルおよび前記再生音声情報の順に再生させるように音声情報を生成し、生成した前記音声情報を前記端末に再生させる音声再生制御手段と、を備えるサーバ装置。
  2.  請求項1に記載のサーバ装置において、
     前記再生音声情報は、前記位置情報に関連して個人が体験できる内容に関する情報と、その位置情報が示す施設を特定する情報を、この順に含んでいる、サーバ装置。
  3.  請求項1または2に記載のサーバ装置において、
     前記選択手段は、前記位置情報取得手段が取得した前記位置情報の位置の属性を特定し、さらに、特定した前記属性に基づいて前記ジングルを選択する、サーバ装置。
  4.  請求項3に記載のサーバ装置において、
     前記選択手段は、前記位置情報を用いて施設を特定し、その施設のカテゴリを前記位置の属性とする、サーバ装置。
  5.  請求項3又は4に記載のサーバ装置において、
     前記選択手段は、前記位置情報が示す位置で体験できる内容の属性を、前記位置の属性とする、サーバ装置。
  6.  請求項1から5のいずれか一項に記載のサーバ装置において、
     さらに、行動を起こした属性を含む行動履歴を記憶装置に記憶しておき、前記決定手段は、この行動履歴に含まれる前記属性を用いて、前記再生音声情報の内容を選択する、サーバ装置。
  7.  端末で再生されるように生成される音声メッセージのデータ構造であって、
     前記音声メッセージは、
      前記端末の位置情報、又は個人の位置情報を用いて選択されたジングルと、
      前記位置情報を用いて決定された再生音声情報と、を含み、かつ、この順に再生され、
     前記再生音声情報は、さらに、
      前記位置情報に関連して個人が体験できる内容に関する情報と、
      その位置情報が示す施設を特定する情報と、を含み、かつ、この順に再生される、音声メッセージのデータ構造。
  8.  請求項7に記載のデータ構造において、
     前記再生音声情報は、前記位置情報に関連して個人が体験できる内容に関する情報と、その位置情報が示す施設を特定する情報を、この順に含んでいる、データ構造。
  9.  サーバ装置が、
     端末の位置情報、又は個人の位置情報を取得し、
     取得した前記位置情報を用いてジングルを選択し、
     取得した前記位置情報を用いて再生音声情報を決定し、
     前記ジングルおよび前記再生音声情報の順に再生させるように音声情報を生成し、生成した前記音声情報を前記端末に再生させる情報処理方法。
  10.  請求項9に記載の情報処理方法において、
     前記再生音声情報は、前記位置情報に関連して個人が体験できる内容に関する情報と、その位置情報が示す施設を特定する情報を、この順に含んでいる、情報処理方法。
  11.  請求項9または10に記載の情報処理方法において、
     前記サーバ装置が、
     取得した前記位置情報の位置の属性を特定し、さらに、特定した前記属性に基づいて前記ジングルを選択する、情報処理方法。
  12.  請求項11に記載の情報処理方法において、
     前記サーバ装置が、
     前記位置情報を用いて施設を特定し、その施設のカテゴリを前記位置の属性とする、情報処理方法。
  13.  請求項11又は12に記載の情報処理方法において、
     前記サーバ装置が、
     前記位置情報が示す位置で体験できる内容の属性を、前記位置の属性とする、情報処理方法。
  14.  請求項9から13のいずれか一項に記載の情報処理方法において、
     さらに、行動を起こした属性を含む行動履歴を記憶装置に記憶しておき、
     前記サーバ装置が、この行動履歴に含まれる前記属性を用いて、前記再生音声情報の内容を選択する、情報処理方法。
  15.  コンピュータに、
     端末の位置情報、又は個人の位置情報を取得する手順、
     取得した前記位置情報を用いてジングルを選択する手順、
     取得した前記位置情報を用いて再生音声情報を決定する手順、
     前記ジングルおよび前記再生音声情報の順に再生させるように音声情報を生成し、生成した前記音声情報を前記端末に再生させる手順、を実行させるためのプログラム。
  16.  請求項15に記載のプログラムにおいて、
     前記再生音声情報は、前記位置情報に関連して個人が体験できる内容に関する情報と、その位置情報が示す施設を特定する情報を、この順に含んでいる、プログラム。
  17.  請求項15または16に記載のプログラムにおいて、
     コンピュータに、
     取得した前記位置情報の位置の属性を特定し、さらに、特定した前記属性に基づいて前記ジングルを選択する手順を実行させるためのプログラム。
  18.  請求項17に記載のプログラムにおいて、
     コンピュータに、
     前記位置情報を用いて施設を特定し、その施設のカテゴリを前記位置の属性とする手順を実行させるためのプログラム。
  19.  請求項17又は18に記載のプログラムにおいて、
     コンピュータに、
     前記位置情報が示す位置で体験できる内容の属性を、前記位置の属性とする手順を実行させるためのプログラム。
  20.  請求項15から19のいずれか一項に記載のプログラムにおいて、
     コンピュータに、
     さらに、行動を起こした属性を含む行動履歴を記憶装置に記憶しておき、この行動履歴に含まれる前記属性を用いて、前記再生音声情報の内容を選択する手順を実行させるためのプログラム。
  21.  サーバ装置と、
     端末と、を備え、
     前記サーバ装置は、
      前記端末の位置情報、又は個人の位置情報を取得する位置情報取得手段と、
      取得した前記位置情報を用いてジングルを選択する選択手段と、
      取得した前記位置情報を用いて再生音声情報を決定する決定手段と、
      前記ジングルおよび前記再生音声情報の順に再生させるように音声情報を生成し、生成した前記音声情報を前記端末に送信する送信手段と、を備え、
     前記端末は、
      前記サーバ装置に位置情報を送信する手段と、
      前記サーバ装置から前記音声情報を受信する手段と、
      前記音声情報を受信すると、当該音声情報を出力する出力手段と、を備える、音声メッセージシステム。
  22.  請求項21に記載の音声メッセージシステムにおいて、
     前記再生音声情報は、前記位置情報に関連して個人が体験できる内容に関する情報と、その位置情報が示す施設を特定する情報を、この順に含んでいる、音声メッセージシステム。
  23.  請求項21または22に記載の音声メッセージシステムにおいて、
     前記選択手段は、前記位置情報取得手段が取得した前記位置情報の位置の属性を特定し、さらに、特定した前記属性に基づいて前記ジングルを選択する、音声メッセージシステム。
  24.  請求項23に記載の音声メッセージシステムにおいて、
     前記選択手段は、前記位置情報を用いて施設を特定し、その施設のカテゴリを前記位置の属性とする、音声メッセージシステム。
  25.  請求項23又は24に記載の音声メッセージシステムにおいて、
     前記選択手段は、前記位置情報が示す位置で体験できる内容の属性を、前記位置の属性とする、音声メッセージシステム。
  26.  請求項21から25のいずれか一項に記載の音声メッセージシステムにおいて、
     さらに、行動を起こした属性を含む行動履歴を記憶装置に記憶しておき、前記決定手段は、この行動履歴に含まれる前記属性を用いて、前記再生音声情報の内容を選択する、音声メッセージシステム。 
PCT/JP2019/036724 2018-09-28 2019-09-19 音声メッセージシステム、サーバ装置、サーバ装置の情報処理方法、プログラム、および音声メッセージのデータ構造 WO2020066825A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2020548588A JP7099534B2 (ja) 2018-09-28 2019-09-19 音声メッセージシステム、サーバ装置、サーバ装置の情報処理方法、および、プログラム
US17/279,290 US20220007134A1 (en) 2018-09-28 2019-09-19 Sound message system, server apparatus, information processing method of server apparatus, program, and data structure of sound message
JP2022104792A JP7294506B2 (ja) 2018-09-28 2022-06-29 音声メッセージシステム、サーバ装置、情報処理方法、および、プログラム

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2018185716 2018-09-28
JP2018-185716 2018-09-28

Publications (1)

Publication Number Publication Date
WO2020066825A1 true WO2020066825A1 (ja) 2020-04-02

Family

ID=69950688

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2019/036724 WO2020066825A1 (ja) 2018-09-28 2019-09-19 音声メッセージシステム、サーバ装置、サーバ装置の情報処理方法、プログラム、および音声メッセージのデータ構造

Country Status (3)

Country Link
US (1) US20220007134A1 (ja)
JP (2) JP7099534B2 (ja)
WO (1) WO2020066825A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022079778A1 (ja) * 2020-10-12 2022-04-21 日本電気株式会社 情報処理装置、サービス提供方法、非一時的なコンピュータ可読媒体、及びサービス提供システム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007251575A (ja) * 2006-03-15 2007-09-27 Xing Inc 音出力方法、音データ送信方法、音出力システム、携帯端末装置、サーバ装置、及びコンピュータプログラム
US20120289217A1 (en) * 2005-09-26 2012-11-15 Zoomsafer Inc. Safety features for portable electronic device
JP2018129860A (ja) * 2014-08-22 2018-08-16 シャープ株式会社 ネットワークシステム、および情報処理方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3164902B2 (ja) * 1992-08-19 2001-05-14 アイシン・エィ・ダブリュ株式会社 車両用ナビゲーション装置
JP2003240582A (ja) * 2002-02-15 2003-08-27 Mitsubishi Electric Corp 車両位置表示装置および音声情報取得方法
JP2005326209A (ja) * 2004-05-13 2005-11-24 Pioneer Electronic Corp 報知制御装置、その方法、そのプログラム、および、そのプログラムを記録した記録媒体
JP4722688B2 (ja) * 2005-12-07 2011-07-13 株式会社ナビタイムジャパン 情報配信システム、経路探索サーバおよび携帯端末装置
JP5989822B2 (ja) * 2015-03-02 2016-09-07 エヌエイチエヌ エンターテインメント コーポレーションNHN Entertainment Corporation 音声システム
US10489496B1 (en) * 2018-09-04 2019-11-26 Rovi Guides, Inc. Systems and methods for advertising within a subtitle of a media asset

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120289217A1 (en) * 2005-09-26 2012-11-15 Zoomsafer Inc. Safety features for portable electronic device
JP2007251575A (ja) * 2006-03-15 2007-09-27 Xing Inc 音出力方法、音データ送信方法、音出力システム、携帯端末装置、サーバ装置、及びコンピュータプログラム
JP2018129860A (ja) * 2014-08-22 2018-08-16 シャープ株式会社 ネットワークシステム、および情報処理方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022079778A1 (ja) * 2020-10-12 2022-04-21 日本電気株式会社 情報処理装置、サービス提供方法、非一時的なコンピュータ可読媒体、及びサービス提供システム

Also Published As

Publication number Publication date
JP2022133354A (ja) 2022-09-13
JP7099534B2 (ja) 2022-07-12
US20220007134A1 (en) 2022-01-06
JP7294506B2 (ja) 2023-06-20
JPWO2020066825A1 (ja) 2021-08-30

Similar Documents

Publication Publication Date Title
JP6670350B2 (ja) サードパーティサービスをデジタルアシスタントと統合するシステム及び方法
US9639854B2 (en) Voice-controlled information exchange platform, such as for providing information to supplement advertising
JP6312564B2 (ja) 情報処理装置、制御方法および制御プログラム
US9230018B2 (en) Mobile audio player with individualized radio program
US11298080B2 (en) Reproduction terminal and reproduction method
JP6310796B2 (ja) 制御装置、制御方法および制御プログラム
JP7294506B2 (ja) 音声メッセージシステム、サーバ装置、情報処理方法、および、プログラム
JP7136099B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP2015130907A (ja) 音楽再生装置、音楽情報共有システム、および音楽再生プログラム
US20140006167A1 (en) Systems and methods for integrating advertisements with messages in mobile communication devices
JP6500141B2 (ja) 情報処理装置、制御方法および制御プログラム
WO2016052501A1 (ja) ユーザインタフェース装置、プログラム及びコンテンツの通知方法
EP3605439A1 (en) Information processing device, information processing method, and program
JP2016212478A (ja) 端末装置、通知方法、プログラム及びコンテンツ提供システム
JP2012129663A (ja) 発話指示装置
JP6482703B1 (ja) 推定装置、推定方法および推定プログラム
JP2020027397A (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
JP2017032895A (ja) 音楽再生装置、音楽再生プログラム、音楽再生方法、音楽配信システム
JP6559290B1 (ja) 情報提供装置、情報提供方法、および情報提供プログラム
US11170630B2 (en) Audio conditioning chimes
JP6791829B2 (ja) 制御装置、制御方法および制御プログラム
US20240029109A1 (en) Information providing apparatus, information providing system, information providing method, and non-transitory computer readable medium
JP2005270620A (ja) 自己改善関連データの提供方法及び自己改善コンテンツの再生プログラム
US20160299969A1 (en) System and Method for Generating Personalized Tones
JP2022191125A (ja) バーチャルアシスタント装置及びバーチャルアシスタント装置用のプログラム

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19864174

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2020548588

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 19864174

Country of ref document: EP

Kind code of ref document: A1