WO2003102816A1 - Systeme fournisseur de donnees - Google Patents

Systeme fournisseur de donnees Download PDF

Info

Publication number
WO2003102816A1
WO2003102816A1 PCT/JP2003/006851 JP0306851W WO03102816A1 WO 2003102816 A1 WO2003102816 A1 WO 2003102816A1 JP 0306851 W JP0306851 W JP 0306851W WO 03102816 A1 WO03102816 A1 WO 03102816A1
Authority
WO
WIPO (PCT)
Prior art keywords
information
voice
unit
image
terminal
Prior art date
Application number
PCT/JP2003/006851
Other languages
English (en)
French (fr)
Inventor
Takuichi Nishimura
Masanori Ihara
Original Assignee
National Institute Of Advanced Industrial Science And Technology
Sharp Kabushiki Kaisha
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National Institute Of Advanced Industrial Science And Technology, Sharp Kabushiki Kaisha filed Critical National Institute Of Advanced Industrial Science And Technology
Priority to US10/516,259 priority Critical patent/US20050228645A1/en
Priority to EP03733193A priority patent/EP1513078A4/en
Publication of WO2003102816A1 publication Critical patent/WO2003102816A1/ja

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/432Query formulation
    • G06F16/433Query formulation using audio data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/432Query formulation
    • G06F16/434Query formulation using image data, e.g. images, photos, pictures taken by a user

Definitions

  • the present invention relates to an information providing system. More specifically, the present invention relates to a new information providing system capable of easily registering various information such as city information in a database and searching from the database, and a portable information terminal and an information processing device used for the new information providing system. It is.
  • the information is stored in an electronic format, such as a map of power navigation or a map on the Internet. It consists of digitized drawing data and character symbols.
  • the digitization of information is performed by a skilled person who is accustomed to the operation of various devices for digitization, such as input devices such as a keyboard and mouse, image capture devices, and dedicated map reading programs. It is not possible for anyone to easily digitize, enter, and register in a database. The same is true for city information.
  • Searching from the database also requires, for example, computer keyboard input, which is inconvenient for those unfamiliar with those operations.
  • computer keyboard input which is inconvenient for those unfamiliar with those operations.
  • mobile terminals such as mobile phones
  • small input keys are not only for those who are unfamiliar with operation but also those who are accustomed to operation. It ’s time-consuming and easy Absent.
  • the present invention has been made in view of the circumstances described above, and allows anyone to easily and accurately register various types of information represented by city information on a data base and search from the data base.
  • the task is to provide a new information provision system that can be performed well, and a portable information terminal and an information processing device used for the new information provision system. Disclosure of the invention
  • an information providing system for providing information to be registered in a database from a portable information terminal to an information processing device.
  • a voice input unit for inputting voice as registration information
  • a voice calculation unit for obtaining voice information based on the voice input by the voice input unit
  • position information of the portable information terminal as registration information when registering information
  • a position confirmation unit for acquiring the position information
  • an additional information input unit for inputting the voice information as registration information and additional information related to the position information at the time of information registration, and the voice information and position obtained by the voice operation unit.
  • a transmission unit that transmits the position information obtained by the confirmation unit and the additional information input by the additional information input unit to an information processing device
  • a receiving unit that receives the voice information, the position information, and the additional information transmitted from the portable information terminal; and a database that associates the voice information, the position information, and the additional information received by the receiving unit with each other.
  • An information providing system comprising: an information processing unit that stores the information in a storage device.
  • an information providing system for providing information registered on a data base basis to a portable information terminal that has requested information provision from an information processing device, and the portable information terminal uses a search key as a search key when the information provision request is made.
  • a voice input unit for inputting voice related to requested information
  • a voice calculation unit for obtaining voice information based on the voice input by the voice input unit
  • a position information of the portable information terminal as a search key when requesting information provision.
  • a position confirmation unit for acquiring information, a transmission unit for transmitting the voice information obtained by the voice calculation unit and the position information obtained by the position confirmation unit to the information processing device, and a transmission unit for transmitting the information from the information processing device.
  • the information processing apparatus receives the voice information and the position information transmitted from the portable information terminal.
  • An information processing unit that retrieves, from a database in which audio information, position information, and additional information are stored in advance in association with each other, the audio information and the additional information related to the position information received by the reception unit.
  • a transmission unit for transmitting the additional information retrieved by the information processing unit to the portable information terminal.
  • the information to be registered in the database is provided from the portable information terminal to the information processing apparatus, and the information registered in the database is provided from the information processing apparatus to the portable information terminal that has requested the information provision.
  • An information providing system wherein a voice as registration information is input when registering information, and a voice input section for inputting a voice related to information requested as a search key when requesting information provision, and a voice input when registering information.
  • a voice calculation unit that obtains voice information based on the voice input by the voice input unit and obtains voice information based on the voice input by the voice input unit at the time of requesting information provision;
  • a position confirmation unit for acquiring the position information of the portable information terminal and acquiring the position information of the portable information terminal as a search key when requesting information provision;
  • An additional information input unit for inputting the voice information as registration information and additional information related to the position information at the time of information registration; the voice information obtained by the blue voice operation unit at the time of information registration;
  • the position information and the additional information input by the additional information input unit are transmitted to an information processing device, and the audio information obtained by the audio calculation unit and the position information obtained by the position confirmation unit at the time of the information provision request.
  • a receiving unit for receiving the additional information sent from the information processing device as the requested information.
  • the information processing device sends the additional information from the portable information terminal at the time of registering the information.
  • a receiving unit that receives the position information, and stores the voice information, the position information, and the additional information received by the receiving unit at the time of information registration in a database in association with each other.
  • An information processing unit for searching for additional information related to the voice information and the position information received by the receiving unit at times, and a transmitting unit for transmitting the additional information searched for by the information processing unit to the portable information terminal.
  • An information providing system is provided.
  • the present invention is intended to solve the above-mentioned problems.
  • the present invention provides an information providing system for providing information to be registered on a data basis from a portable information terminal to an information processing apparatus,
  • the information terminal includes a voice input unit for inputting voice as registration information when registering information, a voice calculation unit for obtaining voice information based on the voice input by the voice input unit, and a portable information as registration information when registering information.
  • a position confirming unit for acquiring position information of the terminal, an image photographing unit for photographing an image as registration information at the time of information registration, and an image calculating unit for acquiring image information based on the image photographed by the image photographing unit.
  • An additional information input unit for inputting additional information related to the audio information, the position information, and the image information as registration information when registering information; Transmitting the voice information obtained by the above, the position information obtained by the position confirmation unit, the image information obtained by the image calculation unit, and the additional information input by the additional information input unit to the information processing apparatus.
  • a receiving unit that receives the audio information, the position information, the image information, and the additional information sent from the portable information terminal; and the audio received by the receiving unit.
  • An information providing system comprising: an information processing unit that stores information, the position information, the image information, and the additional information in a database in association with each other.
  • an information providing system for providing information registered in a database to a portable information terminal that has requested information provision from an information processing apparatus, wherein the portable information terminal uses the information requested as a search key when the information provision is requested.
  • a voice input unit for inputting voice related to the voice
  • a voice operation unit for obtaining voice information based on the voice input by the voice input unit, and a position information of the portable information terminal as a search key when an information provision request is obtained.
  • a position confirming unit that captures an image as a search key when an information provision request is made; an image computing unit that acquires image information based on the image captured by the image capturing unit; and a voice computing unit.
  • An information processing system comprising: an information processing unit that searches for additional information related to the image information; and a transmission unit that transmits the additional information searched by the information processing unit to a portable information terminal.
  • information provision to provide information to be registered in the database from the portable information terminal to the information processing device, and to provide information registered on a data base to the portable information terminal that requested information provision from the information processing device
  • a voice input unit for inputting voice as registration information at the time of information registration, and a voice related to information requested as a search key at an information provision request, and a voice input unit at the time of information registration.
  • a voice operation unit that obtains voice information based on the voice input from the voice input unit and obtains voice information based on the voice input by the voice input unit when requesting information provision;
  • a position confirmation unit that acquires the position information of the terminal and acquires the position information of the portable information terminal as a search key when requesting information provision; and as registration information when registering the information.
  • An image capturing unit that captures an image of the image, and captures an image as a search key when requesting information provision, and obtains image information based on the image captured by the image capturing unit when registering information;
  • An image calculation unit that obtains image information based on the image captured by the imaging unit; and inputting the audio information, the position information, and the additional information related to the image information as registration information at the time of information registration.
  • the additional information input unit the voice information obtained by the voice calculation unit at the time of information registration, the position information obtained by the position confirmation unit, the image information obtained by the image calculation unit, and the input by the additional information input unit
  • the additional information obtained is transmitted to the information processing device, and the voice information obtained by the voice calculation unit at the time of requesting the information provision; the position information obtained by the position confirmation unit;
  • An information processing device comprising: a transmission unit that transmits the image information obtained by the image calculation unit to the information processing device; and a reception unit that receives the additional information transmitted from the information processing device as the requested information.
  • a receiving unit that receives position information and the image information; and the audio information received by the receiving unit at the time of information registration.
  • the position information, the image information, and the additional information are stored in a database in association with each other, and the audio information, the position information, and the image information received by the receiving unit at the time of the information provision request from the database.
  • An information providing system comprising: an information processing unit for searching for related additional information; and a transmitting unit for transmitting the additional information searched by the information processing unit to a portable information terminal.
  • the information providing system is characterized in that the audio information is information including a phoneme string of the audio.
  • the image information is a characteristic of the image. It also provides an information provision system.
  • a portable information terminal for providing information to be registered on a data base to an information processing apparatus, wherein a voice as registration information is input at the time of information registration.
  • a transmitting unit that transmits the additional information input by the additional information input unit to an information processing apparatus that stores the additional information in a data base in association with each other;
  • a tenth aspect of the present invention is a portable information terminal that is provided from an information processing apparatus by requesting information provision of information registered in a database, and is provided with a search key when the information provision request is made.
  • a voice input unit for inputting voice related to the information requested by the user, a voice calculation unit for obtaining voice information based on the voice input by the voice input unit, and a portable information terminal serving as a search key when requesting information provision.
  • a position confirmation unit for acquiring position information, a transmission unit for transmitting the audio information obtained by the audio calculation unit and the position information obtained by the position confirmation unit to the information processing device; Information and additional information And a receiving unit that receives, as the requested information, the additional information related to the voice information and the position information, which has been searched and transmitted from a database stored in advance in association with each other.
  • the portable information terminal is characterized by: a portable information terminal for providing information to be registered in a database to an information processing device; a voice input unit for inputting voice as registration information at the time of information registration; A voice operation unit that obtains voice information based on the voice input by the voice input unit; a position confirmation unit that obtains position information of the portable information terminal as registration information at the time of information registration; and an image as registration information at the time of information registration
  • An image capturing unit that captures an image, an image calculating unit that acquires image information based on the image captured by the image capturing unit,
  • An additional information input unit for inputting the voice information, the position information and the additional information related to the image information, the voice information obtained by the voice operation unit, the position information obtained by the position confirmation unit, the image calculation
  • a transmitting unit that transmits the image information obtained by the unit and the additional information input by the additional information input unit to an information processing device that stores the image information in a database in association with each other.
  • a portable information terminal characterized by the following features: (1) A portable information terminal that provides information registered in a database to a portable information terminal that has requested information provision from an information processing device.
  • a voice input unit for inputting a voice related to information requested as a search key at the time of a request, a voice operation unit for obtaining voice information based on the voice input by the voice input unit,
  • a position confirmation unit that acquires position information of the portable information terminal as a search key when requesting information provision; an image pickup unit that captures an image as a search key when requesting information provision; and the image captured by the image pickup unit
  • the image information obtaining unit obtains image information based on the voice information, the voice information obtained by the voice calculation unit, the position information obtained by the position confirmation unit, and the image information obtained by the image calculation unit.
  • the transmitting section that transmits the information and the information processing device associate the audio information, the position information, the image information, and the additional information with each other and preliminarily associate them.
  • a receiving unit that receives, as the request information, the additional information related to the audio information, the position information, and the image information, which is searched and transmitted from a stored database.
  • a portable information terminal characterized in that, in the thirteenth aspect, the voice information is information including a phoneme string of the voice, and in a fourteenth aspect, the image information is a feature of the image.
  • a portable information terminal characterized by the following is provided.
  • the present invention solves the above-mentioned problems.
  • the present invention relates to an information processing device for registering information provided from a portable information terminal in a database, which has been transmitted from the portable information terminal.
  • a receiving unit that receives voice information based on voice input at the mobile information terminal, location information of the mobile information terminal, and additional information related to the voice information and the location information input at the mobile information terminal;
  • An information processing unit for storing the voice information, the position information, and the additional information received by a receiving unit in a database in association with each other, and an information processing unit.
  • An information processing apparatus for providing information registered in a database to a portable information terminal that has requested information provision, the information processing apparatus being sent from the portable information terminal.
  • a receiving unit for receiving voice information based on the voice input by the mobile information terminal and the location information of the mobile information terminal; and associating the voice information, the location information, and the additional information with each other as registration information.
  • An information processing unit for searching for the additional information related to the voice information and the position information received by the receiving unit from a pre-stored data base; and a portable information terminal for storing the additional information searched for by the information processing unit.
  • a seventeenth information processing device for registering information provided from a portable information terminal in a database, the information processing device comprising: Voice information sent from the mobile information terminal based on the voice input by the mobile information terminal, position information of the mobile information terminal, image information based on an image captured by the mobile information terminal And the mobile device A receiving unit that receives the audio information, the position information, and the additional information related to the image information input by the unit; and associates the audio information, the position information, the image information, and the additional information received by the receiving unit with each other.
  • An information processing device comprising: an information processing unit for storing the information registered on a data base to a portable information terminal that has requested information provision;
  • An information processing device comprising: voice information transmitted from the mobile information terminal, based on voice input at the mobile information terminal, position information of the mobile information terminal, and an image captured by the mobile information terminal.
  • a receiving unit that receives image information based on the received image, and a receiving base that pre-stores audio information, position information, image information, and additional information in association with each other.
  • An information processing unit that searches for the additional information related to the audio information, the position information, and the image information received by the communication unit; and a transmission unit that transmits the additional information searched by the information processing unit to the portable information terminal.
  • An information processing apparatus wherein the audio information is information including a phoneme sequence of the audio; and The information is an information processing apparatus characterized in that the information is a feature of the image.
  • FIG. 1 is a diagram showing a flow of registration on a data base in the present invention.
  • FIG. 2 is a diagram showing a flow of retrieval from a database in the present invention.
  • FIG. 3 is a functional block diagram showing an embodiment of the portable information terminal (terminal station) according to the present invention.
  • FIG. 4A is a functional block diagram showing an embodiment of an information processing apparatus (base station) according to the present invention
  • FIG. 4B is a system configuration showing an embodiment of an information providing system according to the present invention.
  • FIG. 5 is a more specific flowchart of the registration process on the data base in the present invention. It is a chart.
  • FIG. 6 is a diagram showing a data configuration example of a database according to the present invention.
  • FIG. 7 is a more specific flow chart of the search processing from the database in the present invention.
  • A A 'Mobile information terminal (terminal station)
  • phoneme refers to a vowel or a consonant that is a component of a voice.
  • phoneme fragment or “continuous phoneme fragment” may be considered as the phoneme.
  • a “phoneme fragment” is an element obtained by dividing one phoneme into smaller pieces.
  • the “continuous phoneme” is information indicating the continuous state of the phoneme, such as the beginning of “a”, the middle of “a”, the end of “a”, and how This is information indicating whether these elements are connected.
  • phoneme sequence refers to a sequence in which these phonemes are arranged.
  • Such a phoneme sequence is used as voice information, and this is associated with position information such as the position and direction of the mobile information terminal when the voice is spoken, and further, an imaging device attached to the mobile information terminal.
  • Information processing device that associates information with nearby image data captured by a separate imaging device that can provide data to mobile devices and portable information terminals, and manages information such as registration on a data base and retrieval from a database. If they are provided, information registration and information retrieval can be realized easily and with high accuracy. In this case, by making the city information to be registered / searched statistically converged, it is possible to provide efficient registration of city information and services associated with browsing the registered contents.
  • the information processing device is configured by a device capable of registering and retrieving information having a main storage unit, an auxiliary storage unit, an arithmetic processing unit, a communication unit, and the like.
  • Computers can be considered. It is more preferable that the apparatus be capable of analyzing information using a program for statistically analyzing information recorded in a database.
  • the above-mentioned portable information terminal can be, for example, a so-called portable information terminal such as a mobile phone, a PDA (Persona 1 Digita 1 Assistant), a notebook computer, a wearable computer, a wristwatch computer, and a vehicle-mounted computer.
  • a so-called portable information terminal such as a mobile phone, a PDA (Persona 1 Digita 1 Assistant), a notebook computer, a wearable computer, a wristwatch computer, and a vehicle-mounted computer.
  • the method, form, shape, etc. of moving, mounting, holding, etc. are not limited.
  • the information processing device and the portable information terminal are configured to be able to exchange information and search each other via a communication network such as the Internet or an intranet via a wireless LAN or mobile phone, etc. Good.
  • the database may be built in the information processing device or may be separate from the information processing device. If the database is separate from the information processing device, the information processing device may be wirelessly wired. It is constructed to enable two-way communication by some means. Based on the above consideration, an information providing technique according to an embodiment of the present invention will be described below with reference to the drawings.
  • step S1 a speech waveform and position information are input.
  • step S2 speech features are extracted.
  • step S3 a phoneme sequence is determined using an evaluation function.
  • step S4 the phoneme string and the position information are associated and registered in the database.
  • step S11 a speech waveform and position information are input.
  • step S12 speech features are extracted.
  • step S13 a phoneme string is determined using an evaluation function.
  • step S14 a search for data in the database is performed based on the phoneme sequence and the position information.
  • step S "" l5 the search result is output.
  • FIG. 3 is a functional block diagram showing a configuration example of a portable information terminal (terminal station).
  • FIG. 4 (A) is a functional block diagram showing a configuration example of an information processing device (base station), and
  • FIG. 4 (B) is a schematic diagram showing a configuration example of the entire system.
  • the portable information terminal A on the user side displays an antenna 10, a control unit 11 for controlling the entire terminal A, an input unit 15 for inputting data, and data.
  • a display unit 17 using an LCD or the like an operation unit 21 for performing various operations, a communication control unit 23 for controlling communication with other devices, and an imaging unit for acquiring image data and the like
  • a unit 25 a position (including direction) including GPS and the like checking unit 27, an information synthesizing unit 31 for synthesizing various information, and a storage unit 33 for storing data are provided.
  • the input unit 15 includes a character input unit 15a and a voice input unit 15b.
  • the calculation unit 21 includes a voice feature extraction unit 21a, a phoneme sequence generation unit 21b, and an image feature extraction unit 21c.
  • the audio feature extraction unit 21a constitutes an audio feature by expressing features extracted from the audio waveform of the audio input from the audio input unit 15a by numerical values, for example.
  • the phoneme sequence generation unit 2 lb generates a phoneme sequence, which is a sequence of phonemes, based on the voice input from the voice input unit 15 a.
  • the image feature extraction unit 21c configures image features (such as a tendency obtained from an image) based on the image captured by the imaging unit 25.
  • the information processing apparatus B such as a server on the service provider side includes an antenna 40, a communication control unit 41, an information processing unit 47, and a storage unit 51. It is comprised including and.
  • the storage unit stores an audio information storage area 53 for storing information relating to audio, a position information storage area 53 for storing information relating to the position and direction, and stores information relating to a captured image. And an additional information storage area 61 for storing additional information related to such information.
  • FIG. 4A illustrates a configuration in which the communication control unit 41 and the information processing device 45 are integrated in the information processing device B. It may be separate as shown.
  • the database in which data is registered, stored, and searched through the portable information terminal A and the information processing device B is created in, for example, the storage unit 33 in the portable information terminal A shown in FIG.
  • the information may be provided in the storage unit 51 in the information processing apparatus B shown in FIG. 4A.
  • Fig. 4 (B) shows an example of a system configuration in which the databases DB and DB 'are separate from the portable information terminals A and A' as terminal stations and the information processing devices B and B 'as base stations.
  • database DB and DB ' are associated with information processing devices (base stations) B and B' via network C.
  • various other connection forms may be provided.
  • FIG. 5 is a specific flowchart showing the flow of a process for registering information on a data base. This registration process can also be called a database creation process.
  • step S21 a database registration process is started.
  • step S22 the voice from the user of the mobile information terminal A is input by the voice input unit 15 of the input unit 15 of the mobile information terminal A.
  • step S23 the speech feature extraction unit 21a of the calculation unit 21 analyzes the input speech to extract speech features and phoneme features.
  • step S24 the phoneme sequence generation unit 2lb of the calculation unit 21 generates a phoneme sequence from the extracted speech features and phoneme features.
  • step S25 in response to the voice input, the position of the portable information terminal A is confirmed by the position confirmation unit 27 using GPS or the like (position / direction detection step).
  • position information the position specified using the latitude and longitude, the unique position specified by the address, etc., and the direction in which the target exists relative to the position reference of a specific building, etc. Information such as a relative position such as ⁇ is included.
  • step S26 'necessary position information is selected and specified from these information.
  • step S27 an image is taken by the imaging unit 25 in accordance with the voice input.
  • step S28 an image feature is extracted from the captured image by the image feature extraction unit 21c of the calculation unit 21.
  • step S29 the information synthesizer 31 associates the phoneme string with the selected position information and the image feature.
  • step S31 the phoneme string, the selected position information, the image feature, and the related additional information are registered on a data base in a state where they are associated with each other.
  • step S32 the registration processing to the database ends.
  • Figure 6 shows an example of the structure of the data registered in the database.
  • the audio information, the position information, the image information, and the additional information are arranged in association with each other.
  • the audio information is indicated by the reading of Kiki Yutaka. Actually, it is stored using a phonetic symbol or the like as a phoneme string.
  • the first night's de-night composition is when the voice information is Shibuya department store (actually, the actual name is used), the location information is Shibuya-ku ..., and the image information (feature) is the image of the Shibuya department store. Is shown.
  • the additional information for example, information on a refurbishment opening sale in the Shibuya department store is included.
  • the data configuration on the second line shows a case where the voice information is a bee, the position information is Shibuya-ku ..., and the image information (feature) is an image of a loyal dog Hachiko. Additional information includes, for example, map information of Shibuya Station Hachiko Exit.
  • the overnight configuration on the fifth line shows the case where the voice information is Kai Lacuen, the location information is Mito City, and the image information (features) is an image of Bairin. Additional information includes, for example, information on the time of the plum festival at Mito Kairakuen and Kudokan.
  • a person carrying a wearable computer with multiple cameras (imaging unit) and GPS (position confirmation unit) can be walked, or a wearable computer with multiple cameras and GPUs can be used in a wheelchair, bicycle, etc.
  • the camera can be used to move objects, operate a radio control, monitor the surrounding conditions while patroling the mouth pot, etc. Make the name pronounce.
  • the image features obtained by the image feature extraction unit 2.1c based on the image captured in step 5 may also be stored in the database in a corresponding manner.
  • the information is analyzed based on the position and the symbol string is statistically converged.
  • the calculation method for these convergences can be easily configured by a known statistical method. For example, how to find the Euclidean distance based on mean and variance,
  • VQ VectorQuitnty: vector quantization
  • image features may be directly associated and recorded by image processing technology, etc., or characters such as signs may be recognized and used for labeling information, and the recognized character strings may be expanded into phoneme strings. Then, the information may be used by the information providing system of the present invention.
  • the Japanese notation used when expanding phonemes during recording and registering them in the database is "shib uy ahy akkaten" or "shib uy adepa-to", etc.
  • the utterances of multiple users can be recorded on an overnight basis. Processing can also take into account additional information such as the speaker's age, gender, and hometown.
  • Creating a database by the above-described process also corresponds to recording regional information while giving audio labels to map information and surrounding image features.
  • By analyzing the recorded information by the above-mentioned statistical method based on the position it is possible to construct a database of names of buildings and the like and related terms that enter the view when walking in a certain area. At this time, it is possible to associate with various information based not only on the phoneme string but also on a word character string, a speech waveform feature, or a speech VQ code.
  • the word is developed in a time-series format formed by symbols such as phonemes and phoneme fragments.
  • symbols such as phonemes and phoneme fragments.
  • this may be used as a search label.
  • the database configured in this manner, it is not necessary to perform the process of converting into a text label including a word or a kanji by voice recognition.
  • the phoneme strings can be evaluated and searched by DP matching or HMM (Hidden Ma "rkov Mode 1: Hidden Markov Model).
  • HMM Hidden Markov Model
  • step S51 a search process is started.
  • step S52 the voice related to the information requested by the user of the portable information terminal A, which is the information providing request, is input by the speech input unit 15b of the input unit 15 of the portable information terminal A.
  • step S53 the speech feature extraction unit 21a of the calculation unit 21 calculates Speech analysis of the input speech is performed to extract speech features and phoneme features.
  • a phoneme sequence is generated by the phoneme sequence generation unit 21b of the calculation unit 21 based on the extracted speech feature phoneme features.
  • step S55 the position of the portable information terminal A is detected by the position confirmation unit 27 in step S55 in response to the voice input.
  • step S26 necessary position information is selected and specified.
  • step S57 the imaging unit 25 captures an image of the surrounding environment in response to the voice input, and in step S28, the image feature extraction unit 21c of the calculation unit 21 executes Image features are extracted from the captured image.
  • step S59 the information processing apparatus B searches for relevant information from the database based on the information obtained in each of the above steps and obtained in response to the same voice input. At the same time, additional information is added and sent to the portable information terminal A.
  • the related information is displayed on the display unit 17 of the portable information terminal A, for example.
  • the user can act with reference to the information displayed on the display unit 17.
  • the service that presents the above search results to the user for example, displays a graphical map or route moving image, and A route to the store may be presented, or a voice may be used to give directions at key points.
  • employees working at the store or users of the store should add information such as advertisements and evaluations, and switch to meals during the day and izakaya at night depending on the time of use. Thus, effective and efficient information support can be provided.
  • the confirmed location is specified, for example, in Mito city or in the vicinity of Edo Shimomachi. Search results may differ. For example, if the location information is specified as Mito City, information on popular TV programs related to “Mito City” that have a “Hachi” related person and be added with priority will be added. It may be. If the location information is downtown Tokyo, information related to classical rakugo, which is a story about a poor row house person in “Tokyo downtown” related to bee j, is presented.
  • a GPS, a speed sensor, a geomagnetic sensor, etc. are combined to detect the position like a car navigation system, a tag that sends an ID indicating the position to each place, etc. May be provided, and the position may be detected based on the received ID.
  • these labels are not limited to local information such as stores, signs, timetables, guide maps, monuments, etc., as well as growing trees, flowers, animals, Suburban natural information such as insects may be used.
  • the voice information is “Oze J and the location information is heading in the direction of Oze, related information such as the highlights of Mizubasho flowers in Oze may be provided.
  • the input surrounding scenery changes in shape, contour frequency distribution, color, brightness, saturation, and other image information, noise and environmental sound, etc., which change according to natural conditions such as the season, weather, and time zone.
  • Conditions are constructed and classified based on changes in specific conditions in nature, such as acoustic information, wind, temperature, rainfall, and changes in geomagnetism.
  • We analyze the bias of statistical features by using feature information related to images and regions.We use this evaluation result for labeling of registered information on natural information, and based on changes in conditions such as weather conditions in searches. It can also be used to modify or correct the contents of transmissions to the user, or used as a search key by the user himself, or as a search key automatically inserted by the system.
  • the label inputter may be established as an indexer or a labeler.
  • labelers who input lies, mistakes, and false information will be an issue in paying wages.
  • similarities with other labelers such as similarity of objective information such as specific names and weather in the same area, evaluation of data users for labeling information, dispatch of reliable staff from the database construction side, Using a method such as the status of registration of objective information based on the registered mapping method, it is possible to use It is possible to statistically evaluate the credibility of the problem and to solve the problem.
  • this information input work can be moved and speak the name and situation of the surrounding objects, it is more efficient than inputting on the keyboard while looking at documents such as conventional maps and local signs. It is possible to input information related to the “region”. For this reason, it is possible to provide a working environment that is not affected by differences in abilities such as age, education, and experience, and it is feasible to establish a one-night base with a workforce such as long-term unemployed persons and retired workers. These wage systems are based on user evaluations of information such as credibility and labelers who input information that other labelers do not know, and labelers who input information with many users. Then you can take the auction-like method that you have come to expect.
  • a new information providing system that enables anyone to easily and accurately register and search various types of information, such as city information, in a database, and a new information providing system.
  • a portable information terminal and an information processing device to be used are provided. This makes it possible to link time-consuming labeling tasks based on voice and location information. This makes it possible to build a city database and to improve the convenience of living by realizing information support for consumers.

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Remote Sensing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)
  • Mobile Radio Communication Systems (AREA)

Description

明 細 書
情報提供システム
技術分野
本発明は、 情報提供システムに関するものである。 さらに詳しくは、 本発明 は、 市街情報などの各種情報のデータベースへの登録およびデータベースから の検索を簡単に行うことのできる、 新しい情報提供システム、 ならびにそれに 用いられる携帯情報端末および情報処理装置に関するものである。
背景技術
一般的に、 市街情報などの各種情報のデータベースへの登録やデータべ一 スからの検索を行うシステムにおいて、 その情報は、 力一ナビゲーシヨンの地 図やインターネット上の地図などのように、 電子化された図面データや文字記 号デ一夕により構成されている。
しかしながら、 一般的に情報の電子化作業は、 キーボードやマウスなどの入 力用装置、 画像取込み装置、 専用の地図読込プログラムなどの電子化用の各種 装置の操—作に慣れた熟練者が正確に行う必要があり、 誰にでも簡単に電子化し てデータベースへ入力し登録できるというわけではない。 このことは市街情報 であっても同様である。
また、 データベースからの検索も、 たとえばコンピュータのキーボード入力 などが必要であり、 それらの操作に不慣れな人にとってはやはり不便である。 また、 昨今、 携帯電話などの携帯端末で市街情報を検索し取得できるように もなつてきているが、 操作に不慣れな人にとってはもちろんのこと、 操作に慣 れている人にとっても小さな入力キーでは時間がかかり、 簡単な作業とは言え ない。
そこで、 音声入力を利用して登録や検索を行う.方法も考えられるが、 従来の 音声認識技術では固有名詞や造語、 短縮された表現や俗語のような辞書に登録 されていない単語の認識に関しては単語データへの変換精度が低く、 特に固有 名詞が頻繁に用いられる市街情報については認識精度が非常に低いという問題 がある。
本発明は、 以上のとおりの事情に鑑みてなされたものであり、 市街情報を代 表とする各種情報のデ一夕ベースへの登録およびデ一夕ベースからの検索を、 誰でも簡単 かつ精度良く行うことのできる、 新しい情報提供システム、 なら びにそれに用いられる携帯情報端末および情報処理装置を提供することを課題 としている。 発明の開示
本発明は、 上記の課題を解決するものとして、 第 1には、 データベースに登 録する情報を携帯情報端末から情報処理装置へ提供する情報提供システムであ つて、 携帯情報端末は、 情報登録時に登録情報としての音声を入力する音声入 力部と、 音声入力部により入力された前記音声に基づく音声情報を取得する音 声演算部—と、 情報登録時に登録情報としての携帯情報端末の位置情報を取得す る位置確認部と、 情報登録時に登録情報としての前記音声情報および前記位置 情報に関連する付加情報を入力する付加情報入力部と、 音声演算部により得ら れた前記音声情報、 位置確認部により得られた前記位置情報および付加情報入 力部により入力された前記付加情報を情報処理装置へ送信する送信部とを備え ており、 情報処理装置は、 携帯情報端末から送られてきた前記音声情報、 前記 位置情報および前記付加情報を受信する受信部と、 受信部により受信された前 記音声情報、 前記位置情報および前記付加情報を互いに関連付けてデータべ一 スに記憶させる情報処理部とを備えている、 ことを特徴とする情報提供システ ムを提供する。
第 2には、 デ一夕ベースに登録されている情報を情報提供要求した携帯情報 端末へ情報処理装置から提供する情報提供システムであって、 携帯情報端末は 、 情報提供要求時に検索キーとしての要求する情報に関連する音声を入力する 音声入力部と、 音声入力部により入力された前記音声に基づく音声情報を取得 する音声演算部と、 情報提供要求時に検索キーとしての携帯情報端末の位置情 報を取得する位置確認部と、 音声演算部により得られた前記音声情報および位 置確認部により得られた前記位置情報を情報処理装置へ送信する送信部と、 情 報処理装置から送られてきた付加情報を前記要求する情報として受信する受信 部とを備えており、 情報処理装置は、 携帯情報端末から送られてきた前記音声 情報および前記位置情報を受信する受信部と、 音声情報、 位置情報および付加 情報を互いに関連付けて予め記憶しているデータベースから、 受信部により受 信された前記音声情報および前記位置情報に関連する付加情報を検索する情報 処理部と、 情報処理部により検索された付加情報を携帯情報端末へ送信する送 信部とを備えている、 ことを特徴とする情報提供システムを提供する。
第 3には、 データべ—ースに登録する情報を携帯情報端末から情報処理装置へ 提供し、—またデータベースに登録されている情報を情報提供要求した携帯情報 端末へ情報処理装置から提供する情報提供システムであって、 情報登録時に登 録情報としての音声を入力し、 また情報提供要求時に検索キーとしての要求す る情報に関連する音声を入力する音声入力部と、 情報登録時に音声入力部によ り入力された前記音声に基づく音声情報を取得し、 また情報提供要求時に音声 入力部により入力された前記音声に基づく音声情報を取得する音声演算部と、 情報登録時に登録情報としての携帯情報端末の位置情報を取得し、 また情報提 供要求時に検索キーとしての携帯情報端末の位置情報を取得する位置確認部と 、 情報登録時に登録情報としての前記音声情報および前記位置情報に関連する 付加情報を入力する付加情報入力部と、 情報登録時に青声演算部により得られ た前記音声情報、 位置確認部により得られた前記位置情報および付加情報入力 部により入力された前記付加情報を情報処理装置へ送信し、 また情報提供要求 時に音声演算部により得られた前記音声情報および位置確認部により得られた 前記位置情報を情報処理装置へ送信する送信部と、 情報処理装置から送られて きた付加情報を前記要求する情報として受信する受信部とを備えており、 情報 処理装置は、 情報登録時に携帯情報端末から送られてきた前記音声情報、 前記 位置情報および前記付加情報を受信し、 また情報提供要求時に携帯情報端末か ら送られてきた前記音声情報および前記位置情報を受信する受信部と、 情報登 録時に受信部により受信された前記音声情報、 前記位置情報および前記付加情 報を互いに関連付けてデータベースに記憶させ、 また当該データベースから、 情報提供要求時に受信部により受信された前記音声情報および前記位置情報に 関連する付加情報を検索する情報処理部と、 情報処理部により検索された付加 情報を携帯情報端末へ送信する送信部とを備えている、 ことを特徴とする情報 提供システムを提供する。
また、 本発明は、 上記の課題を解決するものとし 、 第 4には、 デ一夕べ一 スに登録-する情報を携帯情報端末から情報処理装置へ提供する情報提供システ ムであって、 携帯情報端末は、 情報登録時に登録情報としての音声を入力する 音声入力部と、 音声入力部により入力された前記音声に基づく音声情報を取得 する音声演算部と、 情報登録時に登録情報としての携帯情報端末の位置情報を 取得する位置確認部と、 情報登録時に登録情報としての画像を撮像する画像撮 像部と、 画像撮像部により撮像された前記画像に基づく画像情報を取得する画 像演算部と、 情報登録時に登録情報としての前記音声情報、 前記位置情報およ び前記画像情報に関連する付加情報を入力する付加情報入力部と、 音声演算部 により得られた前記音声情報、 位置確認部により得られた前記位置情報、 画像 演算部により得られた前記画像情報および付加情報入力部により入力された前 記付加情報を情報処理装置へ送信する送信部とを備えており、 情報処理装置は 、 携帯情報端末から送られてきた前記音声情報、 前記位置情報、 前記画像情報 および前記付加情報を受信する受信部と、 受信部により受信された前記音声情 報、 前記位置情報、 前記画像情報および前記付加情報を互いに関連付けてデー 夕ベースに記憶させる情報処理部とを備えている、 ことを特徴とする情報提供 システムを提供する。
第 5には、 データベースに登録されている情報を情報提供要求した携帯情報 端末へ情報処理装置から提供する情報提供システムであって、 携帯情報端末は 、 情報提供要求時に検索キーとしての要求する情報に関連する音声を入力する 音声入力部と、 音声入力部により入力された前記音声に基づく音声情報を取得 する音声演算部と、 情報提供要求時に検索キーとしての携帯情報端末の位置情 報を取得する位置確認部と、 情報提供要求時に検索キーとしての画像を撮像す る画像撮像部と、 画像撮像部により撮像された前記画像に基づく画像情報を取 得する画像演算部と、 音声演算部により得られた前記音声情報、 位置確認部に より得られた前記位置情報および画像演算部により得られた前記画像情報を倩 報処理装一置へ送信する送信部と、 情報処理装置から送られてきた付加情報を前 記要求する情報として受信する受信部とを備えており、 情報処理装置は、 携帯 情報端末から送られてきた前記音声情報、 前記位置情報および前記画像情報を 受信する受信部と、 音声情報、 位置情報、 画像情報および付加情報を互いに関 連付けて予め記憶しているデータベースから、 受信部により受信された前記音 声情報、 前記位置情報および前記画像情報に関連する付加情報を検索する情報 処理部と、 情報処理部により検索された付加情報を携帯情報端末へ送信する送 信部とを備えている、 ことを特徴とする情報提供システムを提供する。 第 6には、 データベースに登録する情報を携帯情報端末から情報処理装置へ 提供し、 またデ一夕ベースに登録されている情報を情報提供要求した携帯情報 端末へ情報処理装置から提供する情報提供システムであって、 情報登録時に登 録情報としての音声を入力し、 また情報提供要求時に検索キーとしての要求す る情報に関連する音声を入力する音声入力部と、 情報登録時に音声入力部によ り入力された前記音声に基づく音声情報を取得し、 また情報提供要求時に音声 入力部により入力された前記音声に基づく音声情報を取得する音声演算部と、 情報登録時に登録情報としての携帯情報端末の位置情報を取得し、 また情報提 供要求時に検索キーとしての携帯情報端末の位置情報を取得する位置確認部と 、 情報登録時に登録情報としての画像を撮像し、 また情報提供要求時に検索キ —としての画像を撮像する画像撮像部と、 情報登録時に画像撮像部により撮像 された前記画像に基づく画像情報を取得し、 情報提供要求時に画像撮像部によ り撮像された前記画像に基づく画像情報を取得する画像演算部と、 情報登録時 に登録情報としての前記音声情報、 前記位置情報および前記画像情報に関連す る付加情報を入力する付加情報入力部と、 情報登録時に音声演算部により得ら れた前記音声情報、 位置確認部により得られた前記位置情報、 画像演算部によ り得られた画像情報および付加情報入力部により入力された前記付加情報を情 報処理装一俊へ送信し、 また情報提供要求時に音声演算部により得られた前記音 声情報、 位置確認部により得られた前記位置情報および画像演算部により得ら れた画像情報を情報処理装置へ送信する送信部と、 情報処理装置から送られて きた付加情報を前記要求する情報として受信する受信部とを備えており、 情報 処理装置は、 情報登録時に携帯情報端末から送られてきた前記音声情報、 前記 位置情報、 前記画像情報および前記付加情報を受信し、 また情報提供要求時に 携帯情報端末から送られてきた前記音声情報、 前記位置情報および前記画像情 報を受信する受信部と、 情報登録時に受信部により受信された前記音声情報、 前記位置情報、 前記画像情報および前記付加情報を互いに関連付けてデータべ ースに記憶させ、 また当該データベースから、 情報提供要求時に受信部により 受信された前記音声情報、 前記位置情報および前記画像情報に関連する付加情 報を検索する情報処理部と、 情報処理部により検索された付加情報を携帯情報 端末へ送信する送信部とを備えている、 ことを特徴とする情報提供システム。 そして、 第 7には、 前記音声情報は前記音声の音素列を含む情報であること を特徴とする情報提供システム、 第 8には、 前記画像情報は前記画像の特徴で あることを特徴とする情報提供システムをも提供する。
またさらに、 本発明は、 上記の課題を解決するものとして、 デ一夕ベースに 登録する情報を情報処理装置へ提供する携帯情報端末であって、 情報登録時に 登録情報としての音声を入力する音声入力部と、 音声入力部により入力された 前記音声に基づく音声情報を取得する音声演算部と、 情報登録時に登録情報と しての携帯情報端末の位置情報を取得する位置確認部と、 情報登録時に登録情 報としての前記音声情報および前記位置情報に関連する付加情報を入力する付 加情報入力部と、 音声演算部により得られた前記音声情報、 位置確認部により 得られた前記位置情報および付加情報入力部により入力された前記付加情報を 、 それらを互いに関連付けてデ一夕ベースに記憶させる情報処理装置へ送信す る送信部—とを備えている、 ことを特徴とする携帯情報端末、 第 1 0には、 デー 夕ベースに登録されている情報を情報提供要求して情報処理装置から提供され る携帯情報端末であって、 情報提供要求時に検索キーとしての要求する情報に 関連する音声を入力する音声入力部と、 音声入力部により入力された前記音声 に基づく音声情報を取得する音声演算部と、 情報提供要求時に検索キーとして の携帯情報端末の位置情報を取得する位置確認部と、 音声演算部により得られ た前記音声情報および位置確認部により得られた前記位置情報を情報処理装置 へ送信する送信部と、 情報処理装置により音声情報、 位置情報および付加情報 が互いに関連付けて予め記憶されているデータベースから検索されて送られて きた、 前記音声情報および前記位置情報に関連する付加情報を前記要求する情 報として受信する受信部とを備えている、 ことを特徴とする携帯情報端末、 第 1 1には、 データベースに登録する情報を情報処理装置へ提供する携帯情報端 末であって、 情報登録時に登録情報としての音声を入力する音声入力部と、 音 声入力部により入力された前記音声に基づく音声情報を取得する音声演算部と 、 情報登録時に登録情報としての携帯情報端末の位置情報を取得する位置確認 部と、 情報登録時に登録情報としての画像を撮像する画像撮像部と、 画像撮像 部により撮像された前記画像に基づく画像情報を取得する画像演算部と、 情報 登録時に登録情報としての前記音声情報、 前記位置情報および前記画像情報に 関連する付加情報を入力する付加情報入力部と、 音声演算部により得られた前 記音声情報、 位置確認部により得られた前記位置情報、 画像演算部により得ら れた前記画像情報および付加情報入力部により入力された前記付加情報を、 そ れらを互いに関連付けてデータベースに記憶させる情報処理装置へ送信する送 信部とを備えている、 ことを特徴とする携帯情報端末、 第 1 2には、 データべ ースに登録されている情報を情報提供要求した携帯情報端末へ情報処理装置か —ら提供する携帯情報端末であって、 情報提供要求時に検索キーとしての要求す る情報に-関連する音声を入力する音声入力部と、 音声入力部により入力された 前記音声に基づく音声情報を取得する音声演算部と、 情報提供要求時に検索キ 一としての携帯情報端末の位置情報を取得する位置確認部と、 情報提供要求時 に検索キーとしての画像を撮像する画像撮像部と、 画像撮像部により撮像され た前記画像に基づく画像情報を取得する画像演算部と、 音声演算部により得ら れた前記音声情報、 位置確認部により得られた前記位置情報および画像演算部 により得られた前記画像情報を情報処理装置へ送信する送信部と、 情報処理装 置により音声情報、 位置情報、 画像情報および付加情報が互いに関連付けて予 め記憶されているデータベースから検索されて送られてきた、 前記音声情報、 前記位置情報および前記画像情報に関連する付加情報を前記要求する情報とし て受信する受信部とを備えている、 ことを特徴とする携帯情報端末、 第 1 3に は、 前記音声情報は前記音声の音素列を含む情報であることを特徴とする携帯 情報端末、 第 1 4には、 前記画像情報は前記画像の特徴であることを特徴とす る携帯情報端末を提供する。
そしてさらに、 本発明は、 上記の課題を解決するものとして、 第 1 5には、 携帯情報端末から提供された情報をデータベースに登録する情報処理装置であ つて、 携帯情報端末から送られてきた、 当該携帯情報端末にて入力された音声 に基づく音声情報、 当該携帯情報端末の位置情報および当該携帯情報端末にて 入力されたこれら音声情報および位置情報に関連する付加情報を受信する受信 部と、 受信部により受信された前記音声情報、 前記位置情報および前記付加情 報を互いに関連付けてデータベースに記憶させる情報処理部とを備えている、 ことを特徴とする情報処理装置、 第 1 6には、 データベースに登録されている 情報を情報提供要求した携帯情報端末へ提供する情報処理装置であって、 携帯 情報端末から送られてきた、 当該携帯情報端末にて入力された音声に基づく音 声情報および当該携帯情報端—末の位置情報を受信する受信部と、 音声情報、 位 置情報お—よび付加情報を互いに関連付けて登録情報として予め記憶しているデ 一夕ベースから、 受信部により受信された前記音声情報および前記位置情報に 関連する付加情報を検索する情報処理部と、 情報処理部により検索された付加 情報を携帯情報端末へ送信する送信部とを備えている、 ことを特徴とする情報 処理装置、 第 1 7には、 携帯情報端末から提供された情報をデータべ一スに登 録する情報処理装置であって、 携帯情報端末から送られてきた、 当該携帯情報 端末にて入力された音声に基づく音声情報、 当該携帯情報端末の位置情報、 当 該携帯情報端末にて撮像された画像に基づく画像情報および当該携帯倩報端末 にて入力されたこれら音声情報、 位置情報および画像情報に関連する付加情報 を受信する受信部と、 受信部により受信された前記音声情報、 前記位置情報、 前記画像情報および前記付加情報を互いに関連付けてデータベースに記憶させ る情報処理部とを備えている、 ことを特徴とする情報処理装置、 第 1 8には、 デ一夕ベースに登録されている情報を情報提供要求した携帯情報端末へ提供す る情報処理装置であって、 携帯情報端末から送られてきた、 当該携帯情報端末 にて入力された音声に基づく音声情報、 当該携帯情報端末の位置情報および当 該携帯情報端末にて撮像された画像に基づく画像情報を受信する受信部と、 音 声情報、 位置情報、 画像情報および付加情報を互いに関連付けて予め記憶して いるデ一夕ベースから、 受信部により受信された前記音声情報、 前記位置情報 および前記画像情報に関連する付加情報を検索する情報処理部と、 情報処理部 により検索された付加情報を携帯情報端末へ送信する送信部とを備えている、 ことを特徴とする情報処理装置、 第 1 9には、 前記音声情報は前記音声の音素 列を含む情報であることを特徴とする情報処理装置、 第 2 0には、 前記画像情 報は前記画像の特徴であることを特徴とする情報処理装置を提供する。 図面の簡単な説明
図 1は-、 本発明におけるデ一夕ベースへの登録の流れを示す図である。 図 2は、 本発明におけるデ一夕べ一スからの検索の流れを示す図である。 図 3は、 本発明における携帯情報端末 (端末局) の一実施形態を示す機能ブ ロック図である。
図 4 (A ) は、 本発明における情報処理装置 (基地局) の一実施形態を示す 機能ブロック図であり、 図 4 ( B ) は、 本発明における情報提供システムの一 実施形態を示すシステム構成図である。
図 5は、 本発明におけるデ一夕ベースへの登録処理のより具体的なフローチ ャ一卜図である。
図 6は、 本発明におけるデータベースのデータ構成例.を示す図である。 図 7は、 本発明におけるデータベースからの検索処理のより具体的なフロー チャート図である。
図中の各符号は以下のとおりである。
A, A' 携帯情報端末 (端末局)
10 アンテナ
1 1 制御部
1 5 入力部
1 5 a 文字入力部
1 5 b 音声入力部
1 7 表示部
2 1 演算部
21 a 音声特徴抽出部
2 1 b 音声列生成部
2 1 c 画像特徴抽出部
23 通信制御部
25 像
27 位置確認部
3 1 情報合成部
33 記憶部
B, B' 情報処理装置 (基地局)
40 アンテナ
41 通信制御部
45 情報処理装置 4 7 情報処理部
5 1 記憶部
5 3 音声情報記憶領域
5 5 位置情報記憶領域
5 7 画像情報記憶領域
6 1 付加情報記憶領域
C ネットワーク
D B , D B ' データべ一ス 発明を実施するための最良の形態
本発明の実施の形態について説明する前に、 まず、 本発明の発明者の行った 考察について説明する。
発明者は、 特に地名などには特有の固有名詞が多く用いられており、 声を入 力しこれを単語に変換する際の変換効率 ·変換精度が良くないという状況と、 携帯情報端末においてはキーによる文字入力が困難であるという状況に鑑み、 誤認識の発生しやすい単語レベルの音声認識を行うのではなく、 より音声波形 に近い音声特徴や音素特徴などの記号列、 つまり 「音素列」 を音声情報として 用いて市-街情報の入力を行うことで、 効率的な情報の入力を実現できると考え た。
「音素」 とは、 音声を構成する要素である母音や子音を指し、 ここではこの 音素として 「音素片」 や 「連続音素片」 を考慮してもよい。 「音素片」 とは、 1つの音素をより細かく分割した要素である。 「連続音素片」 とは、 音素片の 連続状態を示した情報、 たとえば 「あ」 の始端、 「あ」 の中盤、 「あ」 の終端と 分割した音素片の変化を踏まえて、 どのようにこれらの要素が繋がるかを示し た情報である。 そして 「音素列」 とは、 これら音素が並んだ列を指す。 このような 「音素列」 を音声情報として用い、 これと音声が発話された際の 携帯情報端末の位置や方向などの位置情報とを関連付けして、 さらには携帯情 報端末に付属する撮像装置や携帯情報端末にデータ提供可能な別体の撮像装置 などにより撮影された近隣の画像情報とを関連付けして情報のデ一夕ベースへ の登録やデータベースからの検索などの管理を行う情報処理装置に提供するよ うにすれば、 情報登録および情報検索を簡単にかつ高精度で実現できるのであ る。 なお、 この際、 登録 ·検索対象としての市街情報を統計的に収束させるこ とにより、 市街情報の効率的な登録と、 該登録内容の閲覧に伴うサービスを提 供することもできる。
ここで、 上記情報処理装置は、 たとえば、 主記憶部、 補助記憶部、 演算処理 部、 通信部などを有する情報登録および情報検索が可能な装置により構成され るものとし、 パーソナルコンピュー夕や大型コンピュー夕などを考慮できる。 また、 データベースに記録されている情報の統計的分析を行うプログラムを用 いて情報分析が可能な装置とするこがより好ましい。
上記携帯情報端末は、 たとえば、 携帯電話や P D A ( P e r s o n a 1 D i g i t a 1 A s s i s t a n t )、 ノート型コンピュータ、 ウェアラブル コンピュータ、 腕時計型コンピュータ、 車載型コンピュータなどのいわゆる可 搬型の情—報端末を考慮でき、 移動 ·装着 ·保持等の方法や形態、 形状などは限 定されるものではない。
これら情報処理装置と携帯情報端末との間は、 無線 L A Nや携帯電話などを 経由してインターネット、 イントラネットなどの通信網により情報の交換や相 互検索を行うことができるように構成されていてもよい。
データべ—スは、 情報処理装置に内蔵されていても、 情報処理装置とは別体 のものとされていても良く、 別体のものである場合には情報処理装置に無線有 線を問わず何らかの手段により双方向通信可能に構築する。 上記考察に基づき、 以下に本発明の一実施の形態による情報提供技術につい て、 図面を参照して説明する。
<<登録 ·検索処理の原理説明 >>
まず、 図 1およぴ図 2に基づき、 本実施の形態による情報提供技術のうち、 デ一夕をデータベースに登録するための処理とデータベースを用いたデ一夕の 検索処理の原理を簡単に説明する。
<登録処理の原理フロー >
図 1に示すように、 まずステップ S 1において、 音声波形と位置情報とを入 力する。 ステップ S 2において、 音声特徴を抽出する。 ステップ S 3において 、 評価関数により音素列判定を行う。 次いで、 ステップ S 4において、 音素列 と位置情報とを関連付けてデータベースに登録する。
ぐ検索処理の原理フロー >
図 2に示すように、 まずステップ S 1 1において、 音声波形と位置情報とを 入力する。 ステップ S 1 2において、 音声特徴を抽出する。 ステップ S 1 3に おいて、 評価関数により音素列判定を行う。 次いで、 ステップ S 1 4において 、 音素列と位置情報とに基づいてデータベース中のデータの検索を行う。 ステ ップ S"" l 5において、 検索された結果を出力する。
<<携—帯情報端末、 情報処理装置、 データベース、 システムの説明 >> 以下に、 登録処理および検索処理に用いられる携帯情報端末、 情報処理装置 、 およびデータベースならびにそれらで構成されるシステムのより具体的な例 について、 図面を参照して説明する。 図 3は、 携帯情報端末 (端末局) の構成 例を示す機能ブロック図である。 図 4 (A) は、 情報処理装置 (基地局) の構 成例を示す機能ブロック図であり、 図 4 ( B ) は、 システム全体の構成例を示 す概略図である。
ぐ携帯情報端末 > . 図 3に示すように、 ユーザ側の携帯情報端末 Aは、 アンテナ 1 0と、 端末 A 全体の制御を行う制御部 1 1と、 データ入力を行う入力部 1 5と、 データ等の 表示を行う例えば L C Dなどを用いた表示部 1 7と、 種々の演算を行う演算部 2 1と、 他の機器との間の通信を制御する通信制御部 2 3と、 画像データなど を取得するための撮像部 2 5と、 G P Sなどを含む位置 (方向を含む) 確認部 2 7と、 各種情報を合成する情報合成部 3 1と、 データの記憶を行う記憶部 3 3とを備えている。
入力部 1 5は、 文字入力部 1 5 aと音声入力部 1 5 bとを備えている。 演算 部 2 1は、 音声特徴抽出部 2 1 aと音素列生成部 2 1 bと画像特徴抽出部 2 1 cとを備えている。
音声特徴抽出部 2 1 aは、 音声入力部 1 5 aから入力された音声の音声波形 から抽出される特徴を例えば数値で表して、 音声特徴を構成する。 音素列生成 部 2 l bは、 音声入力部 1 5 aから入力された音声に基づいて、 音素の列であ る音素列を生成する。 画像特徴抽出部 2 1 cは、 撮像部 2 5により撮像された 画像に基づいて、 画像の特徴 (ある画像から得られる傾向など) を構成する。 ぐ情報処理装置 >
図 4 (A ) に示すように、 サ一-ビス提供者側のサーバなどの情報処理装置 B は、 アンテナ 4 0と、 通信制御部 4 1と、 情報処理部 4 7と、 記憶部 5 1とを 含んで構成される。
記憶部は、 音声に閧する情報を記憶するための音声情報記憶領域 5 3と、 位 置 ·方向に関する情報を記憶するための位置情報記憶領域 5 5と、 撮影された 画像に関する情報を記憶するための画像情報記憶領域 5 7と、 これらの情報と 関連する付加的な情報を記憶する付加情報記憶領域 6 1とを有している。
なお、 図 4 (A) は、 情報処理装置 B中において、 通信制御部 4 1と情報処 理装置 4 5とが一体化されている構成を例示しているが、 これらが記号 L 1で 表されるように別体となっていてもよい。
<デ一夕べ一ス>
これらの携帯情報端末 Aおよび情報処理装置 Bを介してデータの登録 ·蓄積 および検索が行われるデータベースに'ついては、 たとえば、 図 3に示す携帯情 報端末 A内の記憶部 3 3に作成してもよいが、 多数のユーザから情報が提供さ れたり要求されたりするという観点から、 図 4 (A) に示す情報処理装置 B内 の記憶部 5 1に設けるようにしてもよい。
<システム >
図 4 ( B ) は、 データベース D B, D B ' が端末局としての携帯情報端末 A , A ' および基地局としての情報処理装置 B , B ' とは別になつているシステ ム構成例を示している。 これにおいて、 携帯情報端末 (端末局) A—情報処理 装置 (基地局) Bの対と携帯情報端末 (端末局) A ' —情報処理装置 (基地局 ) B ' の対とが、 それぞれネットワーク Cに関連付けされており、 さらにデー 夕べ一ス D B , D B ' がネットワーク Cを介して情報処理装置 (基地局) B, B ' と関連付けされている。 もちろん、 この他の様々な接続形態を有していて もよい。
<<登録 ·検索処理の具体的説明 >>
次に、 _図 5から図 7までを参照して、 本発明の一実施の形態による情報提供 システムにおける処理の流れとデータベースのデータ構成例とを説明する。 適 宜、 図 3およぴ図 4をも参照する。
<登録処理の具体的フロー >
図 5は、 デ一夕ベースへ情報を登録する処理の流れを示す具体的なフローチ ヤート図である。 なお、 この登録処理はデータベース作成処理とも呼ぶことが できる。
まず、 ステップ S 2 1において、 データベース登録処理を開始する。 ステツ プ S 2 2において、 携帯情報端末 Aにおける入力部 1 5の音声入力部 1 5 に より、 携帯情報端末 Aのユーザからの音声を入力する。.ステップ S 2 3におい て、 演算部 2 1の音声特徴抽出部 2 1 aにより、 入力された音声の分析を行つ て音声特徴や音素特徴を抽出する。 ステップ S 2 4において、 演算部 2 1の音 素列生成部 2 l bにより、 抽出された音声特徴や音素特徴から音素列を生成す る。
さらに、 ステップ S 2 5において、 音声入力に応じて、 位置確認部 2 7によ り、 G P S等を用いて携帯情報端末 Aの位置を確認する (位置 ·方向検出ステ ップ)。 位置情報中には、 緯度 ·経度を用いて特定される位置、 住所番地など により特定される固有の位置、 ある特定の建物などの位置基準に対してどの方 向に対象物が存在するか否かなどの相対的な位置などの情報が含まれる。 ステ ップ S 2 6において、 これらの情報中から'必要な位置情報を選択 ·特定する。 さらに、 ステップ S 2 7において、 音声入力に応じて、 撮像部 2 5により撮 像を行う。 ステップ S 2 8において、 演算部 2 1の画像特徴抽出部 2 1 cによ り、 撮像された画像から画像特徴を抽出する。
そして、 ステップ S 2 9において、 情報合成部 3 1により、 上記音素列と選 択された上記位置情報と上記画像特徴とを関連付けする。 併せて、 ステップ S
3 0に示すように、 上記音素列と選択された上記位置情報と上記画像特徴とに 関連する関連付加情報を作成する。 ステップ S 3 1において、 上記音素列と選 択された上記位置情報と上記画像特徴と、 そして関連付加情報とを関連付けし た状態で、 デ一夕ベースに登録する。 ステップ S 3 2において、 データベース への登録処理が終了する。
データベース内に登録されているデータの構成例を図 6に示す。 音声情報と 位置情報と画像情報と付加情報とが対応付けされて配置されている。 なお、 図 6に示す例では、 説明の便宜上、 音声情報を力夕カナの読みで示しているが、 実際には音素列としてアルファべットゃ発音記号等を用いて格納されている。
1行目のデ一夕構成は、 音声情報がシブャデパート (実際には実在する名称 が用いられる) であり、 位置情報が渋谷区…であり、 画像情報 (特徴) がその シブャデパートの画像である場合を示している。 付加情報としては、 たとえば シブャデパート内における新装開店セールの情報が載せられている。
2行面のデータ構成は、 音声情報がハチであり、 位置情報が渋谷区…であり 、 画像情報 (特徴) が忠犬ハチ公の画像である場合を示している。 付加情報と しては、 たとえば渋谷駅ハチ公口の地図情報が載せ.られている。
- 5行目のデ一夕構成は、 音声情報がカイラクェンであり、 位置情報が水戸市 …であり、 画像情報 (特徴) が梅林の画像である場合を示している。 付加情報 としては、 たとえば水戸偕楽園、 弘道館の梅祭り開催時期の情報が載せられて いる。
以上のように、 音声情報、 位置情報および画像情報に基づいて、 お互いに関 連するデータを対応付けしたデータベースに構築することができる。
なお、 3行目と 4行目のデータに関しては後述する。
以上の処理について、 以下により具体的に説明する。
たとえば、 渋谷において、 複数のカメラ (撮像部) や G P S (位置確認部) 等が付属したウェアラブルコンピュータを所持する人を散歩させたり、 複数の カメラや G P U等が付属したウェアラブルコンピュータを車椅子、 自転車など に装着して動かしたり、 あるいは、 ラジコンなどを操作したり、 口ポットを巡 回させつつ周囲の状況をモニタ一したりする動作などにより、 カメラに写る事 物、 視線上にある画像、 風景の名称などを発音させる。
たとえば、 ハチ公の銅像にあわせ 「ハチ」 又は 「ハチ公」 と発音させ、 デパ ートの前で 「シブャデパート」 と発音させ、 これらの音声に基づいて、 時系列 的な音声特徴パラメ一夕、 音素記号、 音韻記号、 音素片記号などと、 携帯情報 端末 Aの位置情報とを対応させてデータベースに登録する。 この際、 撮像部 2
5により撮像した画像に基づき画像特徴抽出部 2.1 cにより得られた画像特徴 なども対応させてデ一夕ベースに記憶させてもよい。
次に、 これらの情報を、 位置に基づいて分析し記号列を統計的に収束させる 。 これらの収束における演算方法は、 公知の統計学的な手法によって容易に構 成できる。 たとえば、 平均と分散に基づいてユークリッド距離を求める方法や
、 ベイズ式による類似度評価、 kミーンズクラスタリングによる VQ (Ve c t o r Qu a n t i t y :べク卜ル量子化) コード化後の V Qコードの距離 評価等があげられる。 この結果、 ある位置から見える事象に関する音声から変 換される記号列が統計的に評価され、 ある位置において、 頻繁に発話された音 声から変換された記号列を位置や方向に基づいて分類し記録することが可能と なり、 細部にわたりデ一夕べ一ス化することができる。
データベースを作成する際に、 画像処理技術等により画像特徴を直接関連付 けて記録してもよいし、 看板などの文字を認識してラベリングの情報に用い、 認識した文字列を音素列に展開して、 本発明の情報提供システムにより利用で きるようにしてもよい。 また、 収録の際に音素展開しデータベースに登録する ときの日本語表記が 「シプヤ百貨店」 に対して 「s h i b uy ahy a k k a t e n」 と [s h i b uy a d e p a— t o] などのような複数通りの読み方 (発音) が入力される可能性があることをも考慮し、 複数の利用者の発話をデ 一夕ベースに記録することもできる。 また、 話者の年齢や性別、 出身地などの 付随的な情報を加味して処理を行うこともできる。 発音する音素系列において 、 出現頻度の高い方を統計的に割り出してデータベースに登録する処理を行う ことにより、 間違った呼び方や方言による変化、 喋り方の癖、 言語の違いなど を吸収するように統計的処理によりデータを収束させてもよい。 これらの分析 において、 イントネ一シヨンやアクセントの情報を付加させるとより効率的な 分析や検索が可能となる。 さらに、 携帯情報端末 A、 情報処理装置 Bに学習機 能を付加することにより、 一層効率的な分析や検索が可能となる。
上述のような処理によりデータベースを作成することは、 地図情報と周囲の 画像特徴とに対して音声ラベルを与えながら地域情報を収録することにも対応 する。 収録された情報を位置に基づき前述の統計的手法により分析することで 、 ある地域を歩いた時に視界内に入る建物等の名称や関連用語のデ一夕べ一ス を構築することができる。 この際、 音素列だけではなく、 単語文字列、 音声波 形特徴または音声 V Qコードなどに基づいて種々の情報との関連付けを行うこ とも可能である。 あるいは、 上記各要素を適宜組み合わせることにより、 関連 情報との対応の精度を向上させてラベリングを行うことも可能である。
また、 画像を見ながらキーボードゃ入力キーなどにより単語を入力して位置 に関する内容をラベリングしたい場合には、 その単語を、 音素や音素片等の記 号により形成される時系列デ一夕に展開し、 これを検索ラベルとして用いても よい。
このように構成されたデータベースによれば、 音声認識により単語や漢字を 含むテキストラベルに変換する処理を行わなくてもよい。 すなわち、 音素列が 連続して 力されるため、 音素列同士を D Pマッチングや H MM (H i d d e n M a" r k o v M o d e 1 :隠れマルコフモデル) などの手法により評価 し、 検索することが可能となり、 正確な単語を同定せずに現在位置における適 切な情報の検索が可能となる。
もちろん、 音素同士の類似性を距離評価のためのテ一ブルとしてまとめてお き、 D P ( D y n a m i c P r o g r a mm i n g :動的計画法) マツチン グにおける一致度評価の効率を向上させる方法も考えられる。 また、 1つの音 素列に対し複数の意味タグや画像特徴を付加することにより、 1つの呼称に対 して幾つかの意味や形状情報を与えたり、 1つの意味タグや形状情報に対して 複数の音素列を関連させて構成させたりすることにより、 同じ音素列タグに関 連している事象を、 同音異義語や同一形状に対する別の呼称として収束させた り、 逆に同じ形状の呼称や意味タグに関連する音素列を異音同義語としたり、 意味タグ自体を音素列で構成するといつた方法を用いて意味検索を実現するこ とも可能である。
また、 類似性の高い画像特徴に対し、 異なる音素列を有するものは異音同義 語として取り扱う場合に、 言語の違いによる音素の出現率や遷移確率などを考 慮して、 異言語間での意味を共有できるように構成してもよい。 さらに、 異な る画像特徵に対する類似した音素ラベル系列から、 視線方向に基づく形状の違 いとして評価する方法も可能である。
上記データベースを用いる際に、 店舗などの商業を目的とした検索であれば 、 店舗の種類や店舗の開店時間、 店舗のジャンル、 大型店舗内の出店一覧とい つた、 より細かい項目によって分類しておくことで、 より効率的な検索が可能 となる。 また、 インタ一ネット上の情報を併せて用いたり、 インタ一ネット経 由で情報を共有したりしてもよい。 また、 携帯電話やウェアラブルコンピュー 夕、 力一ナビゲーシヨンシステムなどの携行 ·装着型の端末だけではなく、 ぺ ットロポットゃエージェントロポットなどの情報処理機能を有する装置、 ロボ ットを用いることも可能である。
<検索処理の具体的フロー >
次に、 図 7を参照して、 音声に基づいて情報をキーにしてデータベースから 関連する情報を検索する処理を説明する。
まず、 ステップ S 5 1において、 検索処理を開始する。 ステップ S 5 2にお いて、 携帯情報端末 Aにおける入力部 1 5の音声入力部 1 5 bにより、 情報提 供要求者である携帯情報端末 Aのユーザが要求する情報に関連する音声を入力 する。 ステップ S 5 3において、 演算部 2 1の音声特徴抽出部 2 1 aにより、 入力された音声の音声分析を行って音声特徴や音素特徴を抽出する。 ステップ
S 5 4において、 演算部 2 1の音素列生成部 2 l. bにより、 抽出された音声特 徵ゃ音素特徴に基づいて音素列を生成する。
音声に関する上記処理とともに、 ステップ S 5 5において、 音声入力に応じ て、 位置確認部 2 7により、 携帯情報端末 Aの位置を検出する。 ステップ S 2 6において、 必要な位置情報を選択 ·特定する。 加えて、 ステップ S 5 7にお いて、 音声入力に応じて、 撮像部 2 5により周辺環境に関する撮像を行い、 ス テツプ S 2 8において、 演算部 2 1の画像特徴抽出部 2 1 cにより、 撮像され た画像から画像特徴を抽出する。
上記各ステップにおいて得られた各情報であって、 同じ音声入力に応じて得 られた情報に基づき、 ステップ S 5 9において、 情報処理装置 Bにより、 デ一 夕ベースから関連する情報を検索し、 併せて付加情報をも付加して、 携帯情報 端末 Aに送られる。
これらの関連する情報が、 たとえば携帯情報端末 Aの表示部 1 7に表示され る。 ユーザは表示部 1 7に表示された情報を参考にして行動することができる 上記検索結果を利用者に提示するサービスは、 たとえば、 グラフィ—カルな地 図や経路動画像を表示し、 指定の店舗までの経路を提示したり、 音声を用いて 要所要所において方向を指示したりしてもよい。 また、 店舗に勤務する者やそ の店舗の利用者が、 宣伝や評価などの情報を付加すること、 利用時間帯に応じ て昼は食事、 夜は居酒屋の情報に切り替えるなどの工夫をすることで、 有効か つ効率的な情報支援を行うことができる。
さらに、 上記サービスに関する統合的な応用例として、 G P Sなどの様々な 技術で渋谷駅の 「ハチ公像」 の前であることを位置情報により特定した後、 「 八チ」 「ビデオ」 などのキーワードを用いた多重条件検索を行うと 「忠犬ハチ 公」 の映画を見ることができるようにすることも可能である。 また、 映画の中 の会話で 「ハチ」 と言う単語が出てきている場面や 「ハチ公」 の出ている画面 のみを検索することも可能である。
なお、 再び図 6を参照して説明すると、 「八チ」 という音声情報が入力され た場合であっても、 確認された位置が、 例えば水戸市内である場合や、 江戸下 町界隈に特定された場合における検索結果は、 異なるものとなる場合がある。 たとえば、 位置情報が水戸市と特定された場合には、 「ハチ」 に関連した登 場人物を有し、 且つ 「水戸市」 に関連した人気テレビ番組の情報が優先的に付 加されるようにしてもよい。 また、 位置情報が東京下町である場合には、 「ハ チ j に関連した 「東京下町」 の貧乏長屋の人物についての話しである古典落語 に関連する情報が提示される。
このように、 同音である塲合には紛らわしいため、 位置情報をも加味するこ とにより、 認識の精度を向上させることができる。
上述の水戸偕楽園の例に示すように、 各地の名所案内とその名所に関連する 情報の提示も可能であり、 旅行ガイドとして用いることもできる。 また、 障害 者の誘導などに応用することも可能であろう。
この際、 従来の音声認識技術を用いて、 複数の単語の関係に対し文法的規制 'を入れた一り、 構文解析を施したりすることにより、 より効率的な検索条件の設 定を行ってもよい。
なお、 位置や方向を検出する方法としては、 G P S、 速度センサー、 地磁気 センサ一などを組み合わせ、 カーナビゲーシヨンシステムのように位置を検出 したり、 それぞれの場所に位置を示す I Dを発信するタグなどを設け、 受信し た I Dに基づいて位置を検出してもよい。
もちろん、 これらのラベリングを施す倩報は店舗や看板、 時刻表、 案内図、 記念碑などの地域に根ざした市街情報に限らず、 生えている木や草花、 動物や 昆虫などの郊外の自然情報などであってもよい。 たとえば、 音声情報が 「ォゼ J であり、 位置情報が尾瀬の方向に向かっている場合には、 尾瀬の水芭蕉の花 の見所などの関連情報が提供されるようにしてもよい。 そして、 これらの検索 に自然情報を用いる場合、 次のような手法が考えられる。
まず、 入力された周囲の風景を季節、 天候、 時間帯といった自然状況に応じ て変化する形状や輪郭の周波数分布、 色彩や輝度、 彩度の変化をはじめとした 画像情報や騒音や環境音などの音響情報、 風力、 気温、 雨量、 地磁気の変化な どの自然における具体的な状況の変化に基づいて条件を構成しデータ分類する 。 次に、 画像や地域に関わる特徴情報を用いて統計的な特徴の偏りを分析する そして、 この評価結果を登録された情報の自然情報に関するラベリングに用 いたり、 検索における天候などの状況変化を踏まえた利用者への送信内容の修 正や補正に用いたりするといつた方法や、 利用者自身が検索キーに用いたり、 システムが自動的に挿入する検索キ一として利用することも可能である。 もち ろん、 これらの情報を表現する音声を元に I Dや音素列による意味タグを構成 してもよいし、 その音声特徴を調査、 研究するための音素デ一夕ベースを構築 に用いてもよい。
このよ—うなデ一夕ベース構成するために、 そのラベル入力者はインデクサ一 もしくはラベラーという職業として確立されるようにしてもよい。 また、 この 作業を職業として行う上で、 嘘や間違い、 偽りの情報を入力するラベラーが賃 金支払いに関し課題となると予想できる。 しかし、 他のラベラーとの、 たとえ ば、 同一地域における特定の名称や天候といった客観的情報の類似度、 データ 利用者のラベリング情報に対する評価といった情報、 データベース構築側から の信頼できるスタッフの派遣、 既に登録されている地図方法に基づいた客観的 な情報の登録状況といった手法を用いて、 個々のラベラ一における発言登録内 容の信憑性を統計的に評価し課題の解決を図ることが可能である。
また、 これらの情報入力作業は、 移動することができ、 周囲の物体の名称や 状況を発話できれば、 従来の地図などの書類や現地の看板を見ながらキ一ボー ドにより入力するよりも効率的な地域'関連情報の入力が可能となる。 このため 、 年齢や教育、 経験といった能力差の影響を受けない労働環境の提供も可能と なり、 長期失業者や定年退職者といった労働力によるデ一夕ベース構築が実現 可能である。 そして、 これらの賃金体系は先の信憑性や他のラベラ一が気付か ない情報を入力してくれるラベラー、 利用者の多い情報を入力するラベラーと いった情報の利用者評価に基づいて勤務評価をするといつたオークション的方 法を取ることもできる。 また、 ラベラーはデ一夕ベース側に登録されていなか つたり、 デ一夕べ一ス内での類似度や尤度の評価において的確な対象特徴情報 群が特定できない場合に、 データベース側からの依頼に応じて、 新しくラベリ ングを施すための情報を提供してもよい。 もちろん、 画像、 音声または位置な どの情報を得るために、 光学や画像、 音像、 形状、 色彩、 音響などの各種特徴 を相互に組み合わせたり、 統計的関連性による重み付けを行い検索することも 可能である。
もちろん、 本発明は以上の実施形態に限定されるものではなく、 細部につい ては様々な態様が可能である。 産業上の利用可能性
以上詳しく説明したとおり、 本発明によって、 市街情報を代表とする各種情 報のデータベースへの登録およびデータベースからの検索を、 誰でも簡単にか つ精度良く行うことのできる新しい情報提供システム、 ならびにそれに用いら れる携帯情報端末および情報処理装置が提供される。 これにより、 手間を要す るラベリング作業を、 音声と位置に関する情報に基づいて関連付けすることに より、 都市データベースを構築することが可能となり、 生活者に対する情報支 援を実現することにより、 生活利便性の向上を図.ること.も可能である。

Claims

請求の範囲
1 . データベースに登録する情報を携帯情報端末から情報処理装置へ提供す る情報提供システムであって、
携帯情報端末は、
情報登録時に登録情報としての音声を入力する音声入力部と、
音声入力部により入力された前記音声に基づく音声情報を取得する音声演 算部と、 ' 情報登録時に登録情報としての携帯情報端末の位置情報を取得する位置確 認部と、
情報登録時に登録情報としての前記音声情報および前記位置情報に関連す る付加情報を入力する付加情報入力部と、
音声演算部により得られた前記音声情報、 位置確認部により得られた前記 位置情報および付加情報入力部により入力された前記付加情報を情報処理装置 へ送信する送信部とを備えており、
情報処理装置は、
携帯情報端末から送られてきた前記音声-情報、 前記位置情報および前記付 加情報を-受信する受信部と、
受信部により受信された前記音声情報、 前記位置情報および前記付加情報 を互いに関連付けてデータベースに記憶させる情報処理部とを備えている、 ことを特徴とする情報提供システム。
2 . データベースに登録されている情報を情報提供要求した携帯情報端末へ 情報処理装置から提供する情報提供システムであって、
携帯情報端末は、
情報提供要求時に検索キーとしての要求する情報に関連する音声を入力す る音声入力部と、
音声入力部により入力された前記音声に基づく音声情報を取得する音声演 算部と、
情報提供要求時に検索キーとしての携帯情報端末の位置情報を取得する位 置確認部と、
音声演算部により得られた前記音声情報および位置確認部により得られた 前記位置情報を情報処理装置へ送信する送信部と、
情報処理装置から送られてきた付加情報を前記要求する情報として受信す る受信部とを備えており、 - 情報処理装置は、
携帯情報端末から送られてきた前記音声情報および前記位置情報を受信す る受信部と、
音声情報、 位置情報および付加情報を互いに関連付けて予め記憶している データベースから、 受信部により受信された前記音声情報および前記位置情報 に関連する付加情報を検索する情報処理部と、
情報処理部により検索された付加情報を携帯情報端末へ送信する送信部と を備えている、
ことを特-徵とする情報提供システム。
3 . データベースに登録する情報を携帯情報端末から情報処理装置へ提供し 、 またデータベースに登録されている情報を情報提供要求した携帯情報端末へ 情報処理装置から提供する情報提供システムであって、
携帯情報端末は、
情報登録時に登録情報としての音声を入力し、 また情報提供要求時に検索 キーとしての要求する情報に関連する音声を入力する音声入力部と、
情報登録時に音声入力部により入力された前記音声に基づく音声情報を取 得し、 また情報提供要求時に音声入力部により入力された前記音声に基づく音 声情報を取得する音声演算部と、 .
情報登録時に登録情報としての携帯情報端末の位置情報を取得し、 また倩 報提供要求時に検索キーとしての携帯情報端末の位置情報を取得する位置確認 部と、
情報登録時に登録情報としての前記音声情報および前記位置情報に関連す る付加情報を入力する付加情報入力部と、
情報登録時に音声演算部により得られた前記音声情報、 位置確認部により 得られた前記位置情報および付加情報入力部により入力された前記付加情報を 情報処理装置へ送信し、 また情報提供要求時に音声演算部により得られた前記 音声倩報および位置確認部により得られた前記位置情報を情報処理装置へ送信 する送信部と、
情報処理装置から送られてきた付加情報を前記要求する情報として受信す る受信部とを備えており、
情報処理装置は、
情報登録時に携帯情報端末から送られてきた前記音声情報、 前記位置情報 および前記付加情報を受信し、 また情報提供要求時に携帯情報端末から送られ てきた前—記音声情報および前記位置情報を受信する受信部と、
情報登録時に受信部により受信された前記音声情報、 前記位置情報および 前記付加情報を互いに関連付けてデータベースに記憶させ、 また当該データべ ースから、 情報提供要求時に受信部により受信された前記音声情報および前記 位置情報に関連する付加情報を検索する情報処理部と、
情報処理部により検索された付加情報を携帯情報端末へ送信する送信部と を備えている、
ことを特徴とする情報提供システム。
4 . データベースに登録する情報を携帯情報端末から情報処理装置へ提供す る情報提供システムであって、
携帯情報端末は、
情報登録時に登録情報としての音声を入力する音声入力部と、
音声入力部により入力された前記音声に基づく音声情報を取得する音声演 算部と、
情報登録時に登録情報としての携帯情報端末の位置情報を取得する位置確 認部と、
情報登録時に登録情報としての画像を撮像する画像撮像部と、
画像撮像部により撮像された前記画像に基づく画像情報を取得する画像演 算部と、
情報登録時に登録情報としての前記音声情報、 前記位置情報および前記画 像情報に関連する付加情報を入力する付加情報入力部と、
音声演算部により得られた前記音声情報、 位置確認部により得られた前記 位置情報、 画像演算部により得られた前記画像情報および付加情報入力部によ り入力された前記付加情報を情報処理装置へ送信する送信部とを備えており、 情報処理装置は、
携帯—情報端末から送られてきた前記音声情報、 前記位置情報、 前記画像情 報および前記付加情報を受信する受信部と、
受信部により受信された前記音声情報、 前記位置情報、 前記画像情報およ び前記付加情報を互いに関連付けてデータベースに記憶させる情報処理部とを 備えている、
ことを特徴とする情報提供システム。
5 . データベースに登録されている情報を情報提供要求した携帯情報端末へ 情報処理装置から提供する情報提供システムであって、 携帯情報端末は、
情報提供要求時に検索キーとしての要求する情報に関連する音声を入力す る音声入力部と、
音声入力部により入力された前記音声に基づく音声情報を取得する音声演算 部と、
情報提供要求時に検索キーとしての携帯情報端末の位置情報を取得する位 置確認部と、
倩報提供要求時に検索キーとしての画像を撮像する画像撮像部と、 画像撮像部により撮像された前記画像に基づく画像情報を取得する画像演算 部と、
音声演算部により得られた前記音声情報、 位置確認部により得られた前記 位置情報およぴ画像演算部により得られた前記画像情報を情報処理装置へ送信 する送信部と、
情報処理装置から送られてきた付加情報を前記要求する情報として受信す る受信部とを備えており、
情報処理装置は、
携帯情報端末から送られてきた前記音声情報、 前記位置情報および前記画 像情報を一受信する受信部と、
音声情報、 位置情報、 画像情報および付加情報を互いに関連付けて予め記 憶しているデータベースから、 受信部により受信された前記音声情報、 前記位 置情報および前記画像情報に関連する付加情報を検索する情報処理部と、
情報処理部により検索された付加情報を携帯情報端末へ送信する送信部と を備えている、
ことを特徴とする情報提供システム。
6 . データベースに登録する情報.を携帯情報端末から情報処理装置へ提供し 、 またデータベースに登録されている情報を情報提供要求した携帯情報端末へ 情報処理装置から提供する情報提供システムであって、 .
携帯情報端末は、
情報登録時に登録情報としての音声を入力し、 また情報提供要求時に検索 キーとしての要求する情報に関連する音声を入力する音声入力部と、
情報登録時に音声入力部により入力された前記音声に基づく音声情報を取 得し、 また情報提供要求時に音声入力部により入力された前記音声に基づく音 声情報を取得する音声演算部と、
情報登録時に登録情報としての携帯情報端末の位置情報を取得し、 また情 報提供要求時に検索キーとしての携帯情報端末の位置情報を取得する位置確認 部と、
情報登録時に登録情報としての画像を撮像し、 また情報提供要求時に検索 キーとしての画像を撮像する画像撮像部と、
情報登録時に画像撮像部により撮像された前記画像に基づく画像情報を取 得し、 情報提供要求時に画像撮像部により撮像された前記画像に基づく画像情 報を取得する画像演算部と、
情報登録時に登録情報としての前記音声情報、 前記位置情報および前記画 像情報に関連する付加情報を入力する付加情報入力部と、
情報登録時に音声演算部により得られた前記音声情報、 位置確認部により 得られた前記位置情報、 画像演算部により得られた画像情報および付加情報入 力部により入力された前記付加情報を情報処理装置へ送信し、 また情報提供要 求時に音声演算部により得られた前記音声情報、 位置確認部により得られた前 記位置情報および画像演算部により得られた画像情報を情報処理装置へ送信す る送信部と、
情報処理装置から送られてきた付加情報を前記要求する情報として受信す る受信部とを備えており、
情報処理装置は、
情報登録時に携帯情報端末から送られてきた前記音声情報、 前記位置情報 、 前記画像情報および前記付加情報を受信し、 また情報提供要求時に携帯情報 端末から送られてきた前記音声情報、 前記位置情報および前記画像情報を受信 する受信部と、
情報登録時に受信部により受信された前記音声情報、 前記位置情報、 前記 画像情報および前記付加情報を互いに関連付けてデータベースに記憶させ、 ま た当該デ一夕ベースから、 情報提供要求時に受信部により受信された前記音声 情報、 前記位置情報および前記画像情報に関連する付加情報を検索する情報処 理部と、
情報処理部により検索された付加情報を携帯情報端末へ送信する送信部と を備えている、
ことを特徴とする情報提供システム。
7 . 前記音声情報は前記音声の音素列を含む情報である、
ことを特徴とする請求項 1ないし 6のいずれかに記載の情報提供システム。
8 . 前記画像情報は前記画像の特徴である、
ことを特徴とする請求項 4ないし 6のいずれかに記載の情報提供システム。
9 . データベースに登録する情報を情報処理装置へ提供する携帯情報端末で あって、
情報登録時に登録情報としての音声を入力する音声入力部と、
音声入力部により入力された前記音声に基づく音声情報を取得する音声演算 部と、
情報登録時に登録情報としての携帯情報端末の位置情報を取得する位置確認 部と、 情報登録時に登録情報としての前記音声情報および前記位置情報に関連する 付加情報を入力する付加情報入力部と、
音声演算部により得られた前記音声情報、 位置確認部により得られた前記位 置情報および付加情報入力部により入力された前記付加情報を、 それらを互い に関連付けてデータベースに記憶させる情報処理装置へ送信する送信部とを備 えている、
ことを特徴とする携帯情報端末。
1 0 . データベースに登録されている情報を情報提供要求して情報処理装置 から提供される携帯情報端末であって、
情報提供要求時に検索キーとしての要求する情報に関連する音声を入力する 音声入力部と、
音声入力部により入力された前記音声に基づく音声情報を取得する音声演算 部と、
情報提供要求時に検索キーとしての携帯情報端末の位置情報を取得する位置 確認部と、
音声演算部により得られた前記音声情報および位置確認部により得られた前 記位置情報を情報処理装置へ送信する送信部と、
情報処 装置により音声情報、 位置情報および付加情報が互いに関連付けて 予め記憶されているデータベースから検索されて送られてきた、 前記音声情報 および前記位置情報に関連する付加情報を前記要求する情報として受信する受 信部とを備えている、
ことを特徴とする携帯情報端末。
1 1 . データベースに登録する情報を情報処理装置へ提供する携帯情報端末 であって、
情報登録時に登録情報としての音声を入力する音声入力部と、 音声入力部により入力された前記音声に基づく音声情報を取得する音声演算 部と、
情報登録時に登録情報としての携帯情報端末の位置情報を取得する位置確認 部と、
情報登録時に登録情報としての画像を撮像する画像撮像部と、
画像撮像部により撮像された前記画像に基づく画像情報を取得する画像演算 部と、
情報登録時に登録情報としての前記音声情報、 前記位置情報および前記画像 情報に関連する付加情報を入力する付加情報入力部と、
音声演算部により得られた前記音声情報、 位置確認部により得られた前記位 置情報、 画像演算部により得られた前記画像情報および付加情報入力部により 入力された前記付加情報を、 それらを互いに関連付けてデータベースに記憶さ せる情報処理装置へ送信する送信部とを備えている、
ことを特徴とする携帯情報端末。
1 2 . データベースに登録されている情報を情報提供要求した携帯情報端末 へ情報処理装置から提供する携帯情報端末であって、
情報提供要求時に検索キーとしての要求する情報に関連する音声を入力する 音声入力一部と、
音声入力部により入力された前記音声に基づく音声情報を取得する音声演算 部と、
情報提供要求時に検索キーとしての携帯情報端末の位置情報を取得する位置 確認部と、
情報提供要求時に検索キーとしての画像を撮像する画像撮像部と、 画像撮像部により撮像された前記画像に基づく画像情報を取得する画像演算 部と、 音声演算部により得られた前記音声情報、 位置確認部により得られた前記位 置情報および画像演算部により得られた前記画像情報を情報処理装置へ送信す る送信部と、
情報処理装置により音声情報、 位置情報、 画像情報および付加情報が互いに 関連付けて予め記憶されているデータべ一スから検索されて送られてきた、 前 記音声情報、 前記位置情報および前記画像情報に関連する付加情報を前記要求 する情報として受信する受信部とを備えている、
ことを特徴とする携帯情報端末。
1 3 . 前記音声情報は前記音声の音素列を含む情報である、
ことを特徴とする請求項 9ないし 1 2のいずれかに記載の携帯情報端末。
1 4 . 前記画像情報は前記画像の特徴である、
ことを特徴とする請求項 1 1または 1 2に記載の携帯情報端末。
1 5 . 携帯情報端末から提供された情報をデータベースに登録する情報処理 装置であって、
携帯情報端末から送られてきた、 当該携帯情報端末にて入力された音声に基 づく音声情報、 当該携帯情報端末の位置情報および当該携帯情報端末にて入力 されたこれら音声情報および位置情報に関連する付加情報を受信する受信部と 受信部により受信された前記音声情報、 前記位置情報および前記付加情報を 互いに関連付けてデータベースに記億させる情報処理部とを備えている、 • ことを特徴とする情報処理装置。
1 6 . データべ一スに登録されている情報を情報提供要求した携帯情報端末 へ提供する情報処理装置であって、
携帯情報端末から送られてきた、 当該携帯情報端末にて入力された音声に基 づく音声情報および当該携帯情報端末の位置情報を受信する受信部と、 音声情報、 位置情報および付加情報を互いに関連付けて登録情報として予め 記憶しているデータベースから、 受信部により受信された前記音声情報および 前記位置情報に関連する付加情報を検索する情報処理部と、
情報処理部により検索された付加情報を携帯情報端末へ送信する送信部とを 備えている、
ことを特徴とする情報処理装置。
1 7 . 携帯情報端末から提供された情報をデータベースに登録する情報処理 装置であって、
携帯情報端末から送られてきた、 当該携帯情報端末にて入力された音声に基 づく音声情報、 当該携帯情報端末の位置情報、 当該携帯情報端末にて撮像され た画像に基づく画像情報および当該携帯情報端末にて入力されたこれら音声情 報、 位置情報および画像情報に関連する付加情報を受信する受信部と、 受信部により受信された前記音声情報、 前記位置情報、 前記画像情報および 前記付加情報を互いに関連付けてデータベースに記憶させる情報処理部とを備 えている、
ことを特徴とする情報処理装置。
1 8 . データベースに登録されている情報を情報提供要求した携帯情報端末 へ提供す _る情報処理装置であって、
携帯情報端末から送られてきた、 当該携帯情報端末にて入力された音声に基 づく音声情報、 当該携帯情報端末の位置情報および当該携帯情報端末にて撮像 された画像に基づく画像情報を受信する受信部と、
音声情報、 位置情報、 画像情報および付加情報を互いに関連付けて予め記憶 しているデ一夕ベースから、 受信部により受信された前記音声情報、 前記位置 情報および前記画像情報に関連する付加情報を検索する情報処理部と、 情報処理部により検索された付加情報を携帯情報端末へ送信する送信部とを 備えている、
ことを特徴とする情報処理装置。
1 9 . 前記音声情報は前記音声の音素列を含む情報である、
ことを特徴とする請求項 1 5ないし 1 8のいずれかに記載の情報処理装置
2 0 . 前記画像情報は前記画像の特徴である、
ことを特徴とする請求項 1 7または 1 8に記載の情報処理装置。
PCT/JP2003/006851 2002-05-30 2003-05-30 Systeme fournisseur de donnees WO2003102816A1 (fr)

Priority Applications (2)

Application Number Priority Date Filing Date Title
US10/516,259 US20050228645A1 (en) 2002-05-30 2003-05-30 Information providing system
EP03733193A EP1513078A4 (en) 2002-05-30 2003-05-30 DATA PROVIDER SYSTEM

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2002-156928 2002-05-30
JP2002156928 2002-05-30
JP2003153421A JP2004054915A (ja) 2002-05-30 2003-05-29 情報提供システム
JP2003-153421 2003-05-29

Publications (1)

Publication Number Publication Date
WO2003102816A1 true WO2003102816A1 (fr) 2003-12-11

Family

ID=29714292

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2003/006851 WO2003102816A1 (fr) 2002-05-30 2003-05-30 Systeme fournisseur de donnees

Country Status (4)

Country Link
US (1) US20050228645A1 (ja)
EP (1) EP1513078A4 (ja)
JP (1) JP2004054915A (ja)
WO (1) WO2003102816A1 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100547858B1 (ko) * 2003-07-07 2006-01-31 삼성전자주식회사 음성인식 기능을 이용하여 문자 입력이 가능한 이동통신단말기 및 방법
JP2006285654A (ja) * 2005-03-31 2006-10-19 Dainippon Printing Co Ltd 商品情報検索システム
JP5059080B2 (ja) * 2009-10-23 2012-10-24 株式会社エヌ・ティ・ティ・ドコモ 音声情報検索システム及び音声情報検索方法
US20120011142A1 (en) * 2010-07-08 2012-01-12 Qualcomm Incorporated Feedback to improve object recognition
JP6413263B2 (ja) * 2014-03-06 2018-10-31 株式会社デンソー 報知装置
JP6417748B2 (ja) * 2014-06-25 2018-11-07 カシオ計算機株式会社 携帯型情報処理装置及びプログラム
JP6666648B2 (ja) * 2014-08-20 2020-03-18 加賀デバイス株式会社 画像提供システム及び画像提供プログラム
US11205103B2 (en) 2016-12-09 2021-12-21 The Research Foundation for the State University Semisupervised autoencoder for sentiment analysis
US11526670B2 (en) * 2018-09-28 2022-12-13 The Mitre Corporation Machine learning of colloquial place names
US11551688B1 (en) * 2019-08-15 2023-01-10 Snap Inc. Wearable speech input-based vision to audio interpreter

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000235576A (ja) * 1999-02-15 2000-08-29 Tokyo Electric Power Co Inc:The データベース作成支援システム
JP2001285526A (ja) * 2000-03-31 2001-10-12 Nec Corp 双方向コミュニケーションシステム
JP2002073689A (ja) * 2000-08-31 2002-03-12 Kajima Corp 情報収集システム

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5787414A (en) * 1993-06-03 1998-07-28 Kabushiki Kaisha Toshiba Data retrieval system using secondary information of primary data to be retrieved as retrieval key
US5774860A (en) * 1994-06-27 1998-06-30 U S West Technologies, Inc. Adaptive knowledge base of complex information through interactive voice dialogue
US6732077B1 (en) * 1995-05-12 2004-05-04 Trimble Navigation Limited Speech recognizing GIS/GPS/AVL system
US6272457B1 (en) * 1996-09-16 2001-08-07 Datria Systems, Inc. Spatial asset management system that time-tags and combines captured speech data and captured location data using a predifed reference grammar with a semantic relationship structure
JP3067683B2 (ja) * 1997-04-01 2000-07-17 日本電気株式会社 パターン認識装置および方法、情報記憶媒体
US6693517B2 (en) * 2000-04-21 2004-02-17 Donnelly Corporation Vehicle mirror assembly communicating wirelessly with vehicle accessories and occupants
US6246672B1 (en) * 1998-04-28 2001-06-12 International Business Machines Corp. Singlecast interactive radio system
US6081780A (en) * 1998-04-28 2000-06-27 International Business Machines Corporation TTS and prosody based authoring system
US6151571A (en) * 1999-08-31 2000-11-21 Andersen Consulting System, method and article of manufacture for detecting emotion in voice signals through analysis of a plurality of voice signal parameters
US7203721B1 (en) * 1999-10-08 2007-04-10 At Road, Inc. Portable browser device with voice recognition and feedback capability
DE10008782A1 (de) * 2000-02-18 2001-08-30 Deutsche Telekom Ag Verfahren zur Werbung in sprachgestützten Telekommunikationsverbindungen
US6728708B1 (en) * 2000-06-26 2004-04-27 Datria Systems, Inc. Relational and spatial database management system and method for applications having speech controlled data input displayable in a form and a map having spatial and non-spatial data
US6490521B2 (en) * 2000-12-28 2002-12-03 Intel Corporation Voice-controlled navigation device utilizing wireless data transmission for obtaining maps and real-time overlay information

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000235576A (ja) * 1999-02-15 2000-08-29 Tokyo Electric Power Co Inc:The データベース作成支援システム
JP2001285526A (ja) * 2000-03-31 2001-10-12 Nec Corp 双方向コミュニケーションシステム
JP2002073689A (ja) * 2000-08-31 2002-03-12 Kajima Corp 情報収集システム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
RYUICHI OKA: "Onsei.gazo.text no media togo shori", THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS GIJUTSU KENKYU HOKOKU (PRMU99-260), vol. 99, no. 709, 16 March 2000 (2000-03-16), pages 105 - 112, XP002971052 *
See also references of EP1513078A4 *

Also Published As

Publication number Publication date
US20050228645A1 (en) 2005-10-13
EP1513078A1 (en) 2005-03-09
JP2004054915A (ja) 2004-02-19
EP1513078A4 (en) 2008-01-23

Similar Documents

Publication Publication Date Title
CN111696535B (zh) 基于语音交互的信息核实方法、装置、设备和计算机存储介质
KR102081925B1 (ko) 디스플레이 디바이스 및 스피치 검색 방법
US8918320B2 (en) Methods, apparatuses and computer program products for joint use of speech and text-based features for sentiment detection
CN102782751B (zh) 社会网络中的数字媒体语音标签
US8219406B2 (en) Speech-centric multimodal user interface design in mobile technology
JP3997459B2 (ja) 音声入力システムおよび音声ポータルサーバおよび音声入力端末
US6055536A (en) Information processing apparatus and information processing method
KR101881985B1 (ko) 컨텍스트에 기초한 음성 인식 문법 선택
JP4591353B2 (ja) 文字認識装置、移動通信システム、移動端末装置、固定局装置、文字認識方法および文字認識プログラム
US20140111418A1 (en) Method for recognizing user context using multimodal sensors
WO2003102816A1 (fr) Systeme fournisseur de donnees
JP2006018551A (ja) 情報処理装置および方法、並びにプログラム
KR100949353B1 (ko) 언어 장애인용 대화 보조 장치
WO2013035670A1 (ja) 物体検索システムおよび物体検索方法
JP4978810B2 (ja) 端末装置、情報配信装置、情報配信システムおよびプログラム
JP2003302996A (ja) 情報処理システム
Feng et al. Commute booster: a mobile application for first/last mile and middle mile navigation support for people with blindness and low vision
JP2000076040A (ja) 音声入力ネットワーク端末装置
WO1997009683A1 (fr) Systeme de mediatisation d&#39;informations multimedia contenant des informations audio
JP4808763B2 (ja) 音声情報収集装置、その方法およびそのプログラム
JP2005004782A (ja) 情報処理システム、情報処理装置および情報処理方法、並びに携帯型情報端末装置
JP2001075968A (ja) 情報検索方法及びそれを記録した記録媒体
EP4131057A1 (en) Information processing device and information processing method
US11307045B2 (en) Method and system to determine navigation actions based on instructions from a directional dialogue
CN115243062B (zh) 场景展示方法、装置、屏显设备、电子设备和存储介质

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): CN KR US

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IT LU MC NL PT RO SE SI SK TR

121 Ep: the epo has been informed by wipo that ep was designated in this application
DFPE Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed before 20040101)
WWE Wipo information: entry into national phase

Ref document number: 2003733193

Country of ref document: EP

WWP Wipo information: published in national office

Ref document number: 2003733193

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 10516259

Country of ref document: US