WO2007049569A1 - 情報検索システム及びサーバ装置 - Google Patents

情報検索システム及びサーバ装置 Download PDF

Info

Publication number
WO2007049569A1
WO2007049569A1 PCT/JP2006/321085 JP2006321085W WO2007049569A1 WO 2007049569 A1 WO2007049569 A1 WO 2007049569A1 JP 2006321085 W JP2006321085 W JP 2006321085W WO 2007049569 A1 WO2007049569 A1 WO 2007049569A1
Authority
WO
WIPO (PCT)
Prior art keywords
result list
search result
information
content
search
Prior art date
Application number
PCT/JP2006/321085
Other languages
English (en)
French (fr)
Inventor
Toshihiro Shiren
Original Assignee
Advanced Media, Inc.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Advanced Media, Inc. filed Critical Advanced Media, Inc.
Publication of WO2007049569A1 publication Critical patent/WO2007049569A1/ja

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/72445User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality for supporting Internet browser applications

Definitions

  • the present invention relates to an information search system and a server device, and more particularly to an information search system and a server device suitable for searching information with a mobile terminal device such as a mobile phone.
  • a system which realizes a speech recognition function as a user interface with practical accuracy and cost (for example, in particular, 10-177469, FIGS. 25 and 26).
  • the voice control host device executes a search process based on the selected search keyword, and the search result HTML sentence data is transferred to the mobile terminal.
  • the user of the mobile terminal can access any resource on the Internet by selecting the hypertext on the search result H TML sentence.
  • the search result HTML sentence data is returned to the mobile terminal, and the search result HTML sentence data includes the sentence including the selected search keyword. Be For this reason, information that is not directly related to the information needed by the user of the mobile terminal may be included. When such information is displayed, there is a problem that it becomes difficult to display information that is really necessary in a mobile terminal whose display screen size is limited.
  • the user can also access by directly inputting the URL using the operation button.
  • a mobile terminal such as a mobile phone is not equipped with 12 operation buttons and each operation button is not provided. Since a plurality of alphabets and the like are assigned to tongues, there is a problem that the input work becomes complicated.
  • the user utters a word or the like and determines the URL to be accessed using speech recognition.
  • the owner of the URL selects a word or the like uttered by the user when accessing the URL, and performs speech recognition on the selected word or the like.
  • the target of speech recognition is limited to the selected word. For this reason, even if it is the URL of a well-known company, there is a problem that it can not be accessed when the word etc. is not selected.
  • An object of the present invention is to provide an information search system and a server device capable of searching for desired information of a user quickly and appropriately while reducing an operation load by the user.
  • the information search system of the present invention uses a mobile terminal device that receives a search target keyword by voice, and a database in which a URL of content on the Internet and a voice recognition notation associated with the URL of content are registered.
  • voice data corresponding to the retrieval target keyword received by the mobile terminal device is transmitted to the server device, and the server device performs voice recognition on the voice data.
  • the voice recognition notation is acquired, and a search result list consisting of a URL copy of the content associated with the voice recognition notation is transmitted to the mobile terminal device, and the search result list is displayed on the mobile terminal device.
  • the server device of the present invention is connected to a terminal device that receives a search target keyword by voice via a communication network, and a URL of content on the Internet and a voice recognition notation associated with the URL of content are registered.
  • a server device for performing information search using the selected database receiving means for receiving voice data according to a search target key card received by the terminal device, and performing voice recognition on the voice data to obtain voice recognition notation Speech recognition means and speech obtained by speech recognition means
  • Search result list generation means for generating a search result list including URL power of contents associated with the recognition notation; and transmission means for transmitting the search result list to the mobile terminal device.
  • FIG. 1 is a diagram showing a schematic configuration of a communication system to which an information search system according to an embodiment of the present invention is applied.
  • FIG. 2 is a functional block diagram of a mobile phone according to the above embodiment.
  • FIG. 3 is a functional block diagram of a server according to the above embodiment.
  • FIG. 4 is a view for explaining an example of data registered in a DB of the server according to the above embodiment.
  • FIG. 5 is a diagram for describing a case where data registered in a DB of the server according to the above embodiment is systematically captured according to an instruction category and the like.
  • FIG. 6 is a diagram for explaining the contents of a search result list displayed on the mobile phone according to the above embodiment.
  • FIG. 7 is a sequence diagram for describing an outline of an operation in the case where information search is performed in the information search system according to the above embodiment.
  • FIG. 8 is a flowchart for explaining the operation of a mobile phone when information search is performed by the information search system according to the above embodiment.
  • FIG. 9 is a flow chart for explaining the operation of the server in the case where information search is performed by the information search system according to the above embodiment.
  • FIG. 10 is a view for explaining an example of data selected as a speech recognition result in the information search system according to the above embodiment.
  • FIG. 11 is a view for explaining an example of a search result list displayed on a mobile phone of the information search system according to the above embodiment.
  • FIG. 12 is a view for explaining an example of data selected as a speech recognition result in the information search system according to the above embodiment.
  • FIG. 13 is a view for explaining an example of a search result list displayed on a mobile phone of the information search system according to the above embodiment.
  • FIG. 14 is a view for explaining an example of a search result list displayed on a mobile phone of the information search system according to the above embodiment.
  • FIG. 15 is a diagram for describing an example of data selected as a speech recognition result in the information search system according to the above embodiment.
  • FIG. 16 is a view for explaining an example of a search result list displayed on a mobile phone of the information search system according to the above embodiment.
  • FIG. 17 is a view for explaining an example of data registered in the DB of the server according to the modification of the embodiment.
  • FIG. 18 is a diagram for describing an example of data registered in a DB of a server according to a variation of the above embodiment.
  • FIG. 19 is a sequence diagram for describing an outline of an operation in the case where information search is performed in the information search system according to the modification of the embodiment.
  • FIG. 20 is a flow diagram for describing an operation of a mobile phone in a case where information search is performed by the information search system according to the modification of the embodiment of the invention.
  • FIG. 1 is a diagram showing a schematic configuration of a communication system to which an information search system according to an embodiment of the present invention is applied.
  • a user uses a mobile telephone apparatus (hereinafter simply referred to as “mobile phone” or “U”) 1 as a mobile terminal apparatus to set up a carrier network 2 (eg, for mobile communication).
  • Sano can communicate with voice recognition and search server devices (hereinafter simply referred to as “servers”) 4 through communication networks such as the PDC (Personal Digital Cellular-Packet) network and the Internet 3 etc. It is configured to be able to use the provided information search service. Then, according to the search result by the information search service, the user can use the mobile phone 1 to communicate with the WWW server 5 via the communication network so that the home page containing the desired information can be accessed. It is configured.
  • servers Voice recognition and search server devices
  • FIG. 1 the case where Sano is present on the Internet 3 is shown.
  • the place where the Sano is present is not limited to this, and may be present on the telecommunications carrier network 2.
  • the function of the WWW server 5 is provided in the server 4 shown in the case where the WWW server 5 is provided independently of the Sano, and the WWW server 5 is omitted. Also good.
  • FIG. 2 is a functional block diagram of the mobile phone according to the present embodiment.
  • the functional blocks shown in FIG. 2 are simplified for the purpose of explaining the present invention, and are provided with functions necessary for a call function and a web browser function installed in a normal mobile phone. To.
  • the mobile phone 1 has a control unit 11 for controlling the entire terminal, a voice input unit 12 for receiving voice input from the user, and search target keywords by voice input with user power. And a communication control unit 14 for controlling communication with a communication network such as the communication carrier network 2 and an operation input unit for receiving an operation input by a user. 15 includes a display control unit 16 that controls display used in the mobile phone 1, a display 17 that displays characters, images, and images whose display is controlled, and an antenna 18.
  • the voice input unit 12 receives, for example, a search target key word related to information that the user wants to search.
  • a search target key word related to information that the user wants to search.
  • the speech input unit 12 receives a keyword such as a proper noun or a general noun as a search target keyword, it is shown, but the keyword is extracted from the contents of the conversation input from the user and the search target It may be accepted as a key command.
  • the feature parameter extraction unit 13 analyzes analog speech delivered from the speech input unit 12 and performs coding, noise processing, correction, and the like. After that, only feature portions are extracted from the encoded voice within a range that does not degrade the speech recognition rate, and feature parameters are generated. For example, the feature parameter extraction unit 13 can compress the feature parameter to 3.75% of the data volume (1.2 kBZSEC) of normal voice data (32 kBZ SEC: 16 KHZ, 16 bit)
  • the communication control unit 14 generates the feature parameters generated by the feature parameter extraction unit 13 via the antenna 18. Control is performed to transmit the parameter to the server 4 and to receive the search result list returned from the server 4 in response. Further, the communication control unit 14 performs communication control when accessing a home page including desired information from the search result list.
  • the operation input unit 15 receives an operation input associated with the activation of the voice recognition 'information search application (hereinafter simply referred to as a' voice search application ') required when the user uses the information search service.
  • a' voice search application ' An operation input for selecting an access target when accessing a home page including desired information from the search result list, and an operation input for ending browsing of the home page are received in a row.
  • the display control unit 16 includes, for example, screen information associated with normal operation of the present mobile phone 1, screen information displayed by the voice search application, and a search result list received via the communication control unit 14. Control display of screen information. Various display information is displayed on the display 17 under the control of the display control unit 16.
  • FIG. 3 is a functional block diagram of a server according to the present embodiment.
  • the server 4 includes a control unit 41 that controls the entire device, and a personal computer operated by the mobile phone 1 or a content provider described later via a communication network such as the Internet 3
  • DB Database
  • connection form of the force DB 45 shown in the case where the server 4 includes the DB 45 as its component is not limited to this and the connection form of the DB 45 is to be externally connected to the server 4. It is good.
  • the server 4 is provided with the storage unit 44 storing the information to which the speech recognition unit 43 refers as its component, the server 4 is described as follows. You may connect to server 4 externally.
  • the communication unit 42 receives, for example, the feature parameter as voice data transmitted from the mobile phone 1, and also receives the search result list received from the search result list generation unit 46. Send to mobile phone 1.
  • the communication unit 42 performs a member registration procedure for receiving the provision of the information search service with a content provider who wishes to provide the information search service using the information search system, and a special process to be described later. Perform information communication necessary for registration procedure of speech recognition keywords.
  • the speech recognition unit 43 performs speech recognition of speech data transferred from the communication unit 42 by acoustic probability calculation and linguistic probability calculation with reference to a dictionary stored in advance in the storage unit 44.
  • the rule grammar acoustic model stored in the storage unit 44 is used for acoustic probability calculation
  • the rule grammar language model stored in the storage unit 44 is used for linguistic probability calculation.
  • the storage unit 44 stores a dictionary, a rule grammar acoustic model, and a rule grammar language model, which are referred to by the speech recognition unit 43 as described above.
  • FIG. 4 is a diagram for explaining an example of data registered in Sano's DB 45 according to the present embodiment.
  • a phonetic symbol string can be obtained in the process of speech recognition, but it is not necessary to obtain this phonetic symbol string in the process of speech recognition.
  • the speech recognition process may use any method.
  • the data shown in FIG. 4 is an example of the data, and the contents can be changed as appropriate. For example, on the assumption that the speech recognition notation and the URL shown in FIG. 4 are included, any other format may be adopted for the other data configuration!
  • the speech recognition notation obtained as a result of the speech recognition in the information search service, and the registration registered by the service provider of the information search service in accordance with the speech recognition notation are registered in the DB45.
  • the phonetic symbol string, the type of voice recognition notation (hereinafter referred to as “type of notation”), the URL of the content (home page) on Internet 3 and the character string corresponding to the content of content, and linked to the URL of the content The instruction string and the category according to the content of the content are shown, and the instruction category associated with the instruction string included in the category is registered.
  • phonetic symbols are represented by letters, symbols, etc. It corresponds to the one shown.
  • the instruction character string and the instruction category are displayed on a search result list described later.
  • the instruction string is configured to be accessible to the URL linked to the instruction string by the user selecting on the search result list.
  • the instruction category is configured to be display-switchable to an instruction character string associated with the instruction category when the user selects it on the search result list.
  • the contents of the instruction string and instruction category are specified by the service provider. However, it is good to decide these according to the specification by the content provider.
  • the speech recognition notation is obtained as a speech recognition result, and is designated by a service provider or content provider.
  • the speech recognition notation includes general speech recognition notation for displaying an indication category on a search result list to be described later, and special speech recognition notation for displaying an indication character string on a search result list.
  • the notation type the type of the general speech recognition notation or the special speech recognition notation is described.
  • the general speech recognition notation and the special speech recognition notation differ in their meaning of existence.
  • General speech recognition notation is intended to ensure the convenience of the user in this information search service.
  • Special speech recognition notation on the other hand, aims to realize business with content providers who wish to improve access to content.
  • the general speech recognition notation is registered to secure access to the content of a prominent company or the like. Therefore, the general speech recognition notation is registered by the service provider regardless of the content provider's registration request. For example, in the contents of the general voice recognition notation, the company name of the content provider is specified. As described later in detail, when a speech recognition result corresponding to such a general speech recognition notation is obtained, the user is presented with an instruction category corresponding to the general speech recognition notation.
  • the special voice recognition notation is registered in order to improve the access to the content owned by each content provider. Therefore, special speech recognition notations are, in principle, registered in response to content provider registration requests.
  • the content of the special voice recognition notation can be arbitrarily specified by the content provider, and for example, the common name or short name of the content provider's company name, as well as the name of the main product or unique brand, etc. are designated. . Also, the number of registrations can be arbitrarily specified by the content provider. As will be described later in detail, when a speech recognition result corresponding to such special speech recognition notation is obtained, the user is presented with a designated character string corresponding to the special speech recognition notation.
  • DB 45 shown in FIG. 4 shows the case where data is registered on the premise of performing information retrieval in Japanese. For this reason, in the phonetic symbol string, the case where the pronunciation content in Japanese corresponding to the speech recognition notation is registered is shown.
  • data that can be searched for information in various languages including English, Chinese, Korean, etc., which are not limited to this may be registered. good.
  • the pronunciation content in various languages corresponding to the speech recognition notation is registered in the phonetic symbol string.
  • two speech recognition notations “BBB” are registered as special speech recognition notations, and both phonetic symbol strings “ ⁇ ” are associated with each other.
  • different URLs, designated character strings, and designated categories are associated with these speech recognition notations “ ⁇ ”.
  • the instruction string “BBB Children's Book Sales” and the instruction category “Children's Book Sales” are associated with one, and the other with UR L “http : Z / www. Bbbreiorm. Co. Jp. Ntml
  • the finger string “BBB information 1 and the instruction category“ reform ” are associated.
  • the speech recognition notation “BBB car” is registered as a general speech recognition notation, and a phonetic symbol string “BIIBnBIlJIDOUSHA” is associated.
  • the voice recognition notation “BBB car” is associated with the URL "http: ZZwww. Bbb. Co. Jp. Html", the instruction string "BBB car” and the instruction category "car maker”. .
  • This means that the service provider has registered the general voice recognition notation "BBB car” in consideration of the convenience of the user.
  • the speech recognition notation “car” is registered as a general speech recognition notation, and a pronunciation symbol string “JIDOUSHA” is associated.
  • the URL and the instruction character string are not registered in the voice recognition notation "car”, and only the instruction category "car” is registered. This means that the service provider has registered the general voice recognition notation "car” in consideration of the convenience of the user.
  • the instruction string is displayed on the search result list according to the type of speech recognition notation (whether it is general speech recognition notation or special speech recognition notation or not). Difference in whether to display the instruction category.
  • special voice recognition notation is registered upon payment of money by the content provider, while general speech recognition notation is registered independently of the content payment of the content provider.
  • general speech recognition notation is treated as special speech recognition notation.
  • the voice recognition notation “AAA automobile” or the like corresponds to this case, and the general speech recognition notation is treated as the special speech recognition notation according to the registration of another special speech recognition notation (for example, ⁇ ). Therefore, when the voice recognition notation "AAA automobile” is obtained as the speech recognition result, the instruction character string "AAA automobile” is displayed in the search result list in the corresponding instruction category "automaker". It becomes.
  • FIG. 5 is a diagram for describing a case where data registered in DB 45 of the server according to the present embodiment is systematically captured according to an instruction category and an instruction character string.
  • the data contents shown in FIG. 5 are shown for the convenience of explanation and do not actually indicate the data contents in the DB 45.
  • the indication category is divided into a major division ("instruction category (large)” shown in the figure) and a subdivision ("instruction category (small)” shown in the figure). In case of an accident, please show me!
  • the instruction string “AAA automobile” shown in FIG. 5 belongs to the instruction category “vehicle maker”, and the instruction category “vehicle maker” further belongs to the instruction category “vehicle”.
  • “AAA automobile” is registered as a general speech recognition notation in this instruction character string "AAA automobile”, and "A AA” as a first special speech recognition notation ("special speech recognition notation 1" in the figure). Is registered, and it can be seen that “high-class car” is registered as the second special speech recognition notation (“special speech recognition notation 2” in the figure). That is, when the voice recognition notation "AAA car", “AAA” and "luxury car” are obtained as the speech recognition result, it is indicated that the instruction string "AAA car” is displayed in the search result list. It is.
  • the instruction string "BBB automobile” belongs to the instruction category "vehicle maker”, and the instruction category “vehicle maker” belongs to the instruction category "vehicle”.
  • “BBB car” is registered as the general speech recognition notation in the instruction character string “BBB car”, it is understood that the special speech recognition notation is not registered. That is, when the speech recognition notation "BBB car” is obtained as the speech recognition result, it is indicated that the instruction category "car maker” is displayed in the search result list. In this case, it is optional whether to select "automaker” or “automobile” as the instruction category. In this information search service, a subdivision "automaker” is selected.
  • the search result list generation unit 46 generates a search result list based on the speech recognition result by the speech recognition unit 43. At this time, the search result list generation unit 46 selects an instruction character string or an instruction category registered corresponding to the speech recognition notation obtained as the speech recognition result.
  • FIG. 6 is a diagram for explaining the contents of the search result list displayed on the mobile phone 1.
  • the search result list is provided with two areas divided up and down to display the search results.
  • a character string display area 52 in which the instruction character string 51 is displayed is provided on the upper side of the display 17, and a category in which the instruction category 53 corresponding to the instruction character string 51 is displayed on the lower side.
  • a display area 54 is provided.
  • the display is switched to the instruction string 51 according to the data content as shown in FIG. For example, when the instruction category "car maker” is selected, the display will be switched to the instruction strings “AAA car", “car” and "CCC car”.
  • FIG. 7 is a sequence diagram for explaining the outline of the operation when information search is performed in the information search system according to one embodiment of the present invention, and in particular, special phonetic symbol strings are registered in this information search service. The operation when accessing the content of the content provider is shown.
  • the user of the mobile phone 1 When using the information search service using the present information search system, first, the user of the mobile phone 1 operates the operation input unit 15 to use the voice search application required to use the information search service. Launch By activating the voice search application, the voice input unit 12 of the mobile phone 1 can receive a search target keyword from the user.
  • step Abbreviated as "ST" 701 When the user issues a search target keyword from the user while the voice search application is activated on the mobile phone 1, the voice input unit 12 accepts this (step (hereinafter referred to as “step Abbreviated as "ST") 701).
  • the search target keyword accepted by the voice input unit 12 is passed to the feature parameter extraction unit 13 via the control unit 11.
  • the feature parameter extraction unit 13 extracts (generates) feature parameters from the search target keyword (ST 702).
  • the extracted feature parameters are passed to the communication control unit 14 via the control unit 11.
  • the communication control unit 14 transmits the feature parameter to the server 4 via the communication network (ST 703).
  • the feature parameter is passed to the voice recognition module 43 via the control module 41.
  • the speech recognition unit 43 performs speech recognition with reference to the dictionary stored in the storage unit 44, the rule grammar acoustic model, and the rule grammar language model (ST 704).
  • the speech recognition result by the speech recognition unit 43 is passed to the search result list generation unit 46 via the control unit 41.
  • the search result list generation unit 46 generates a search result list according to the speech recognition result (ST 705).
  • the generated search result list is passed to the communication unit 42 through the control unit 11.
  • Communication unit 42 transmits the search result list to mobile phone 1 via the communication network (ST 706).
  • the search result list is passed to the display control unit 16 via the control unit 11.
  • the display control unit 16 displays the search result list on the display 17 (ST 707).
  • an operation input for selecting a designated character string from the search result list is accepted.
  • the control unit 11 starts the web browser according to the operation input (ST 709). Then, UR L corresponding to the selected instruction character string is accessed (ST 710).
  • control unit 11 stops the web browser and ends the process. . In this manner, a series of operations in the case of performing information search in the present information search system are completed.
  • FIG. 8 is a flowchart for explaining the operation of the mobile phone in the case where information search is performed by the information search system according to the embodiment of the present invention
  • FIG. 9 is a diagram for explaining the operation of the present invention.
  • Information retrieval system It is a flowchart for demonstrating the operation
  • the control unit 11 of the mobile phone 1 operates the voice input unit 12 with the user in a state where the voice search application is activated. It receives or monitors the search target keyword from (ST801). The monitoring operation is continued until the search target keyword is received. When the monitoring operation is continued for a predetermined time, even if the search target keyword is not received, the voice search application may be terminated.
  • the control unit 11 extracts feature parameters by the feature parameter extraction unit 13 (ST 802). Then, the communication control unit 14 transmits the extracted feature parameters to the server 4 via the communication network (ST 803).
  • the control unit 11 monitors whether the search result list based on the feature parameters is received from the server 4 by the communication control unit 14 (ST 804). The monitoring operation is continued until the search result list is received. Even when the monitoring operation is continued for a certain period of time, if the search result list is not received, the feature parameter may be transmitted to the server 4 again.
  • the control unit 11 causes the display control unit 16 to display the search result list on the display 17 (ST 805). Thereafter, it is monitored whether the selection of the designated character string on the search result list by the operation input unit 15 is accepted or the selection of the designated category on the search result list is accepted (ST 806 and ST 807). The monitoring operation continues until one of the selections is accepted. Even if the monitoring operation is continued for a certain period of time, the above-mentioned voice search application may be ended if any selection is not accepted.
  • control unit 11 activates the web browser (ST 808) and accesses the corresponding UR L associated with the selected instruction string. (ST 809). Thereafter, when an instruction to end browsing the home page screen displayed on the display 17 is received from the operation input unit 15 by accessing the URL, the control unit 11 stops the web browser and ends the process.
  • control unit 11 selects The display is switched to the instruction character string corresponding to the instruction category for which the selection has been accepted (ST 810). Then, it receives or monitors selection of an instruction character string after display switching (ST 811). The monitoring operation continues until the selection of the designated character string is received. Note that even if the monitoring operation is continued for a certain period of time, the selection of the instruction character string may not be accepted, and in the case where the selection is not received, the search result list may be displayed again.
  • control unit 11 activates the web browser (ST 808) as described above, and is associated with the selected instruction string, The corresponding URL is accessed (ST 809). Thereafter, when an instruction to end browsing the home page screen displayed on the display 17 is received from the operation input unit 15 by accessing the URL, the control unit 11 stops the web browser and ends the process. In this way, a series of operations of the mobile phone 1 in the case of performing information search in the present information search system are completed.
  • the control unit 41 of the server 4 receives the characteristic parameters from the mobile phone 1 via the communication unit 42. It is monitoring whether it is received (ST901). The monitoring operation is always continued until the feature parameter is received.
  • control unit 41 refers to the dictionary stored in the storage unit 44 by the speech recognition unit 43, the rule grammar acoustic model, and the rule grammar language model, and the feature parameter is received. Voice recognition is performed (ST 902).
  • control unit 41 selects a predetermined number of data according to the speech recognition result. Specifically, in speech recognition based on the feature parameters received in ST 901, a predetermined number (for example, 10) of data having high similarity is selected (ST 903).
  • the control unit 41 determines from the data at the top of the similarity that the speech recognition notation included in the data is a general speech recognition notation. (ST 904). At this time, the control unit 41 makes a determination in accordance with whether or not "general" is designated as the notation type.
  • the voice recognition notation of the data is a general voice recognition notation
  • the instruction category registered in the data is selected (ST 905), and the search result list generation unit 46 is notified as a voice recognition result. Do.
  • the notified instruction category is a search result It is temporarily held by the fruit list generator 46.
  • the voice recognition notation of the data is not a general voice recognition notation, that is, if it is a special voice recognition notation, a designated character string registered in the data is selected (ST906 ), And notifies the search result list generation unit 46 as a speech recognition result.
  • the notified instruction string is temporarily held by the search result list generation unit 46.
  • control unit 41 determines the force that has processed all the data selected in ST 903 (ST 907). Here, if the process has not been performed for all the selected data, the selected data is updated (ST 908), and the processes of ST 904 to ST 907 are repeated.
  • control unit 41 If it is determined that processing has been performed on all the data selected in ST 907 while repeating the processing of ST 904 to ST 907, control unit 41 generates a search result list by search result list generation unit 47 (ST 909). . As a result, a search result list including the instruction category or instruction string held is generated.
  • control unit 41 causes the communication unit 42 to transmit the search parameter list to the mobile phone 1 that has transmitted the feature parameter (ST 910). After that, the control unit 41 returns the process to ST 901 to prepare for reception of feature parameters again. In this way, a series of operations of the server 4 in the case of performing information retrieval in the present information retrieval system are completed.
  • FIG. 10, FIG. 12 and FIG. 15 are diagrams for explaining an example of data selected as a speech recognition result in the present information search system.
  • FIG. 11, FIG. 13, FIG. 14 and FIG. 16 are diagrams for explaining an example of the search result list displayed on the mobile phone of the information search system.
  • FIGS. 10, 12 and 15 the order of data selected as the speech recognition result is adopted for the convenience of description, and the actual speech recognition is performed. Not based on knowledge results.
  • FIG. 10 shows an example of data selected as a speech recognition result when “AAA automobile” is input as a search target keyword
  • FIG. 11 shows the contents of the search result list in this case.
  • FIG. 12 shows an example of data selected as a speech recognition result when “BBB car” is input as a search target keyword
  • FIG. 13 shows the contents of the search result list in this case.
  • FIG. 14 shows the contents that are displayed when the indication category 53 of “car maker” is selected from the search result list shown in FIG.
  • FIG. 15 shows an example of data selected as a speech recognition result when “automobile” is input as a search target keyword
  • FIG. 16 shows the contents of the search result list in this case.
  • an instruction category or an instruction character string is selected from the selected data.
  • the instruction strings “AAA automobile”, “AAA home”, “ AAA car “and” AAA home "are selected.
  • the instruction categories “machine maker”, “child's book sales", “car” and The “Children's Book” is selected.
  • a search result list is generated according to the indication character string and the indication category thus selected, and is transmitted to mobile phone 1.
  • the search result list as shown in FIG. 11, the instruction string 51 of “AAA automobile” and “AA AA home” are displayed in the character string display area 52, and “machine maker” is displayed in the category display area 54.
  • “Children's Book Sales", “Cars” and “Children's Books” indication categories 53 are displayed.
  • an instruction category or an instruction character string is selected from the selected data.
  • the instruction character strings “BBB Children's Books Sales”, “BBB Reform”, “BBB Children's Books Sales” “BBB Children's Book Sales” and “BBB Reform” are selected.
  • the instruction categories "car maker”, “machine maker”, “car” and “child book” Is selected.
  • a search result list is generated according to the indication character string and the indication category thus selected, and is transmitted to mobile phone 1.
  • instruction strings 51 of “BBB reform” and “BBB children's book sales” are displayed in the character string display area 52, and “cars” is displayed in the category display area 54.
  • the instruction categories 53 of "Mer”, “Machine maker”, “Car” and “Children's book” are displayed.
  • the display order of the indication character string 51 in the character string display area 52 of the search result list is the content provider who pays a large amount for the information search service (special pronunciation It is displayed in correspondence with the number of registered symbol strings! And content providers. That is, as shown in FIG. 5, only one special speech recognition notation is registered in the data corresponding to the designated character string "BBB children's book sales", while it corresponds to the designated character string "BBB reform". Two special speech recognition notations are registered in the data. For this reason, in the present information retrieval system, as shown in FIG. 13, "BBB reform" is displayed above the instruction character string "BB B children's book sales".
  • the display order of the instruction string 51 is prioritized according to the payment to the information search service and the amount of money as described above, but the input search If a speech recognition expression substantially corresponding to the target keyword is registered as a special speech recognition expression, the designated character string 51 of the data is displayed at the highest position. This will Although the indication character string 51 corresponding to the speech recognition notation substantially corresponding to the search target keyword is present, it is avoided to be displayed at a position lower than the other indication character strings 51, and the convenience of the user is improved. I am improving.
  • a user who desires to search for “BBB car” has no instruction string 51 corresponding to the character string display area 52 in the search result list shown in FIG. It is necessary to predict and select the instruction category 53 that includes “category 35” and “car”.
  • the display is switched to a list of instruction character strings 51 associated with the instruction category 53, as shown in FIG. Specifically, the instruction strings 51 of “AAA automobile” and “BBB automobile” associated with the instruction category 53 of “automaker” are displayed.
  • the display order of the instruction character string 51 is displayed corresponding to the content provider in the same way as in the above case, in which the payment amount to the information search service is large. Therefore, as shown in FIG. 14, in the character string display area 52, the indication character strings 51 are arranged in the order of “AAA car” and “BBB car” (see FIG. 5).
  • an instruction category or an instruction character string is selected from the selected data. Specifically, in the data corresponding to the voice recognition notation "AAA automobile” and “BBB children's book sales”, the instruction character strings “AAA automobile” and “BBB children's book sales” are selected. On the other hand, in the data corresponding to the voice recognition notation "car”, “children's book”, “BBB car”, “AAA automatic loom”, “BBB automatic loom” and “AAA children's book sales”, the instruction category "vehicle” , “Children's Book”, “Car Maker”, “Machine Maker”, “Machine Maker” and “Child Book Sales” are selected.
  • the instruction character string and instruction thus selected A search result list is generated according to the category and sent to the mobile phone 1.
  • instruction strings 51 of “AAA automobile” and “BB children's book sales” are displayed in the character string display area 52, and “category display area 54” is displayed.
  • the instruction categories 53 of “Car”, “Children's Book”, “Car Maker”, “Machinery Maker” and “Children's Book Sales” are displayed.
  • the search result list according to the search target keyword by voice received from mobile phone 1 is returned from server 4 and displayed on mobile phone 1. Ru. Therefore, the user can receive the search result according to the search target keyword only by inputting the search target keyword by voice to the mobile phone 1.
  • the search result list is limited to only the instruction character string and the instruction category, the search result is displayed on the mobile phone 1 having a restriction on the size of the display screen. Even in the case, it is possible to display necessary information. As a result, it is possible to retrieve the user's desired information quickly and properly while reducing the user's operation load.
  • the search result list returned from the server 4 is displayed in the indication character string linked to the URL of the corresponding content and the related indication character string. Since the instruction category configured to be switchable is displayed, it is possible to easily access the corresponding content according to the selection operation of the instruction string by the user, and according to the selection operation of the instruction category. It is possible to display the related instruction string.
  • mobile phone 1 transmits to server 4 as voice data feature parameters that are extracted from the search target keyword to such an extent that the recognition rate of speech recognition is not degraded.
  • the server 4 performs voice recognition based on the feature parameters.
  • the time and cost required for communication can be reduced.
  • the time and cost required for the search can be reduced, and the user's desired information can be searched quickly.
  • general voice recognition notation for displaying an indication category in a search result list and an indication character string are displayed in speech recognition notation of DB 45.
  • the content provider can specify the registration content or the number of registrations of the special voice recognition notation.
  • the instruction in the search result list is made according to the registered content or the number of registrations of the special voice recognition notation designated by the content provider. It is possible to change the appearance rate of the character string.
  • the amount charged to the content provider is increased or decreased according to the number of registrations of the special voice recognition notation. As a result, it is possible for the content provider to collect a fee commensurate with the appearance rate of the instruction string 51 corresponding to the content of the content provider in the search result list.
  • the display order of the indication character string 51 displayed in the search result list is given priority. This makes it possible to rank the display order of the indication string 51 displayed in the search result list according to some predetermined condition.
  • the display order of instruction character strings 51 displayed in the search result list is determined according to the charge amount for the content provider.
  • the content provider searches for the amount of money paid for the information search service using the information search system. It becomes possible to rank the display order of the instruction string 5 1 displayed in the result list.
  • the display order of the indication character string 51 corresponding to the special speech recognition notation that matches the speech recognition result by the speech recognition unit 43 is set to the top. ing.
  • the instruction character string 51 corresponding to the special speech recognition notation that matches the speech recognition result by the speech recognition unit 43 is displayed at the top, so that the user can It is possible to provide an information retrieval system with excellent usability.
  • the present invention is not limited to the above embodiment, and can be implemented with various modifications.
  • the size, shape, and the like shown in the attached drawings are not limited to the above, and can be appropriately changed within the range in which the effects of the present invention are exhibited.
  • DB 45 of server 4 the case where speech recognition notation, phonetic symbol string, notation type, URL, instruction character string and instruction category are registered in DB 45 of server 4 is shown.
  • the contents registered in DB 45 can be appropriately changed on the premise that the indication category and the indication character string are displayed on the search result list according to the speech recognition notation as in the above embodiment. It is. For example, determination of the type of voice recognition notation according to the presence or absence of registration of the instruction category may be omitted even if the notation type is omitted.
  • the contents displayed on the search result list will be described. Is not limited to this, and can be changed as appropriate.
  • only the instruction string may be displayed on the search result list.
  • only the designated character string is displayed on the search result list, it is not necessary to necessarily display the designated character string.
  • the corresponding URL may be displayed as it is.
  • the URL of the content is searched is described in detail, but as a specific usage method, a mobile phone is used. It can be considered to be related to the download of the application executed on the telephone 1.
  • the URL of a home page from which a specific application can be downloaded is registered in the DB 45 of the server 4, and the application name is registered in the corresponding special voice recognition notation (which may be a general speech recognition notation).
  • the application name is received from the user as a search target keyword, the application is selected as a downloadable home page by selecting the instruction string 51 displayed on the search result list correspondingly. It can be easily accessed.
  • the application management device already downloaded (installed) on the mobile phone 1 It is also conceivable to associate user input of voice data with the activation of an application on the mobile phone 1 by adding a function. For example, in the case where the target application has already been downloaded to the mobile phone 1, if the application name is received from the user as a search target keyword in the same manner as described above, the feature parameter is Instead of extracting and transmitting to the server 4, the application may be started. In this case, it is possible to activate the application simply by issuing an application name desired to be activated to the mobile phone 1.
  • the company name of the content provider is registered as an instruction character string to be registered in DB 45, and when the selection of the instruction character string is received from the user, the content provision is provided. It shows how to use the mobile phone 1 to browse the home page of the person.
  • the method of using the information search system according to the present invention can be modified as appropriate without being limited thereto.
  • information such as the name of a specific person may be registered as an instruction character string registered in the DB 45, and voice data relating to the person may be used as content corresponding to a URL corresponding to the instruction character string.
  • the voice data and the image data may be associated with each other, and upon receiving the selection of the designated character string from the user, the voice or the like of the person may be listened to by the mobile phone 1.
  • FIG. 17 is a diagram for explaining an example of data registered in the DB of the server according to the variation of the above embodiment.
  • the name of a specific person is registered as an instruction character string registered in the DB 45
  • the URL corresponding to the instruction character string is voice data related to the person. It is assumed that contents of voice data are associated with each other based on the voice of the person. Note that FIG. 17 shows the case where these data are added as an example of the data shown in FIG.
  • the name of a specific person registered in the instruction string it is conceivable to register, for example, the name of a politician.
  • FIG. It shows the case where the name of a politician is registered as the name of a specific person registered in the instruction string.
  • the URL corresponding to the instruction string is associated with the content of voice data according to the speech content based on the voice of the politician.
  • the speech recognition notation “Taro Yamada” is registered as a special speech recognition notation, and a phonetic symbol string “YAMADATAROU” is associated.
  • the URLs “h ttp: // www. Yamadataro. Co. Jp. Html”, the instruction character string “Yamada Taro”, and the instruction force “Election district A” are associated.
  • the speech recognition notation “Satoichiro” is registered as a special speech recognition notation, and the phonetic symbol string "SATOUICHIROU” is associated.
  • the user when the information search system according to the present embodiment is used, the user simply inputs the name of a politician by voice to the mobile phone 1 to It is possible to receive a search result list consisting of the instruction string power according to the name. Then, by selecting an instruction string according to the name of the politician, it becomes possible to listen to voice data according to the content of the speech based on the voice of the politician.
  • the name of a politician is registered as an instruction string, and when this instruction string is selected, voice data corresponding to the content of speech based on the voice of the politician is distributed to the mobile phone 1
  • the contents to be registered according to the name of a person to be registered in the instruction string and the contents to be distributed according to the selection of the instruction string can be changed appropriately without being limited to this.
  • the names of prominent singers and the like may be registered in the instruction string, and audio data corresponding to the music and interview contents of the singer may be distributed according to the selection of the instruction string.
  • voice data related to the person is described. It is possible to change it as needed without being limited to this.
  • voice data may be used. That is, not only voice data based on the person's own voice registered in the instruction character string, but it is possible to change the person to any voice data related to the person, such as recommendation and introduction.
  • the voice data related to the person may be voice data such as a profile of the singer or a sales schedule of music.
  • the URL is registered as connection information corresponding to the instruction character string, and the instruction character string displayed in the search result list is selected. Shows the case where the URL corresponding to the instruction string is accessed.
  • the connection information registered in the DB 45 can be changed as appropriate without being limited to this. For example, it is possible to register a telephone number instead of a URL, and when an instruction character string displayed in the search result list is selected, the telephone number corresponding to the instruction character string may be called.
  • FIG. 18 shows one example of data registered in the DB of the server according to the variation of the above embodiment. It is a figure for demonstrating an example.
  • the data described in FIG. 4 are used except for the “telephone number” registered instead of “UR Lj”. The description of the same data shown in FIG. 4 is omitted.
  • the contents of the data shown in FIG. 18 will be extracted and described.
  • the telephone number "03-XXXl-YYY2" is used instead of the URL "http: ZZwww. B bbpub. Co. Jp. Html". It is associated.
  • a telephone number "03-XXXl-YYY3" is associated with the other of the voice recognition notation ": BBB” instead of the URL "http: ZZwww. Bbbrefor m. Co. Jp. Html”.
  • the telephone number "03 -XXXI-YYY4" is associated with the voice recognition notation ": BBB car” instead of the URL Thttp: / / www. Bbb. Co. Jp. Htmlj!
  • FIG. 19 is a sequence diagram for describing an outline of an operation in the case where information search is performed in the information search system according to the modification of the above embodiment.
  • FIG. 20 is a flow chart for explaining the operation of the mobile phone in the case where information search is performed by the information search system according to the modification of the embodiment of the invention.
  • FIG. 19 the same processes as in FIG. 7 will be assigned the same reference numerals and descriptions thereof will be omitted.
  • FIG. 20 the same processing as that of FIG. 8 is denoted by the same reference numeral, and the description thereof is omitted.
  • the process from the information search system according to the above embodiment is different from that in the mobile phone 1.
  • the control section 11 calls the telephone number corresponding to the designated character string (ST 2001). Thereafter, when an instruction to end the calling operation is received from the operation input unit 15, the control unit 11 ends the processing.
  • a search result list including the designated character string “BBB car” is displayed on the display 17 of the mobile phone 1 (ST 805), and an operation input for selecting the designated character string “BBB car” is received from the user.
  • the mobile phone 1 is called to call the telephone number "03-XXXI-YYY4" associated with the designated character string "BB BB car” (ST2001).
  • the user when the information search system according to the present embodiment is modified, the user simply inputs the search target keyword by voice to the mobile phone 1 according to the search target keyword. It becomes possible to receive a search result list consisting of the instruction string power. Then, by selecting the instruction string on the search result list, it is possible to make a call to the telephone number of the information provider.
  • the present invention is based on Japanese Patent Application No. 2005-308206 filed on Oct. 24, 2005. All this content is included here.
  • the information search system and the server device transmit voice data corresponding to the search target keyword received by the mobile terminal device to the server device, and the server device transmits voice data to the voice data.
  • the voice recognition is performed to acquire the voice recognition notation, and the search result list formed by the URL terminal of the content associated with the voice recognition notation is transmitted to the mobile terminal device, whereby the search result list in the mobile terminal device is obtained.
  • the present invention can be used to quickly and accurately retrieve information desired by the user while reducing the operation burden on the user displaying the information, and has industrial applicability.

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Telephonic Communication Services (AREA)

Abstract

 ユーザによる操作負担を軽減させつつ、迅速且つ適確にユーザの所望の情報を検索することができる情報検索システム及びサーバ装置。音声による検索対象キーワードを受け付ける携帯電話(1)と、インターネット(3)上のコンテンツのURL及びコンテンツのURLに対応付けられた音声認識表記が登録されたデータベースを用いて情報検索を行うサーバ(4)とを具備する情報検索システムにおいて、携帯電話(1)で受け付けた検索対象キーワードに応じた音声データをサーバ(4)に送信し、サーバ(4)で音声データに対する音声認識を行って音声認識表記を取得し、当該音声認識表記に対応付けられたコンテンツのURLから成る検索結果リストを携帯電話(1)に送信し、携帯電話(1)で当該検索結果リストを表示する。

Description

明 細 書
情報検索システム及びサーバ装置
技術分野
[0001] 本発明は、情報検索システム及びサーバ装置に関し、特に、携帯電話などの移動 体端末装置にて情報を検索する際に好適な情報検索システム及びサーバ装置に関 する。
背景技術
[0002] 従来、 PHSなどの移動端末を用いた通信環境にぉ 、て、ユーザインタフェースとし ての音声認識機能を実用的な精度及びコストで実現するシステムが提案されて!、る ( 例えば、特開平 10— 177469号公報、図 25及び図 26)。かかるシステムにおいては 、移動端末から選択された検索キーワード (選択検索キーワード)を受信すると、音声 制御ホスト装置でこの選択検索キーワードに基づ 、て検索処理を実行し、検索結果 HTML文章データを移動端末に返送する。移動端末のユーザは、この検索結果 H TML文章上のハイパーテキストを選択することで、インターネット上の任意のリソース にアクセスすることを可能として 、る。
[0003] し力しながら、上述したような従来のシステムにおいては、移動端末に対して検索結 果 HTML文章データが返送され、この検索結果 HTML文章データには、選択検索 キーワードを含む文章が含まれる。このため、移動端末のユーザが必要とする情報と 直接関係ない情報が含まれる可能性がある。このような情報が表示された場合には、 表示画面の大きさに制限のある移動端末において本当に必要な情報を表示すること が困難となると 、う問題がある。
[0004] 一方、検索した!/、情報が表示されて 、るホームページの URLが予め分かって!/、る 場合においても、上述したような従来のシステムにおいては、同様の事情により迅速 に当該 URLにアクセスすることが困難となる場合がある。
[0005] なお、予め URLが分力つているような場合、ユーザは、操作ボタンを用いて当該 U RLを直接入力することでアクセスすることも可能である。しかし、一般に、携帯電話な どの移動端末においては、 12個の操作ボタンし力備えておらず、それぞれの操作ボ タンに複数のアルファベット等が割り当てられていることから、その入力作業が煩雑に なるという問題がある。
[0006] この問題の解決のため、ユーザは単語等を発声し、音声認識を用いてアクセスする URLを決定することが考えられる。この場合、当該 URLにアクセスする際にユーザが 発声する単語等を当該 URLの所有者が選択し、選択された単語等を対象として音 声認識を行うことが考えられる。しかし、この場合には、音声認識の対象が選択され た単語に限定される。このため、たとえ著名な企業の URLであっても、単語等が選択 されていない場合にはアクセスできないという問題がある。また、ユーザは、自分がァ クセスしょうと欲する URLの所有者が単語等を選択しているカゝ否か、すなわち、音声 認識を用いて当該 URLにアクセスできる力否かが不明であるという問題がある。 発明の開示
[0007] 本発明の目的は、ユーザによる操作負担を軽減させつつ、迅速且つ適確にユーザ の所望の情報を検索することができる情報検索システム及びサーバ装置を提供する ことである。
[0008] 本発明の情報検索システムは、音声による検索対象キーワードを受け付ける移動 体端末装置と、インターネット上のコンテンツの URL及びコンテンツの URLに対応付 けられた音声認識表記が登録されたデータベースを用いて情報検索を行うサーバ装 置と、を具備する情報検索システムにおいて、移動体端末装置で受け付けた検索対 象キーワードに応じた音声データをサーバ装置に送信し、サーバ装置で音声データ に対する音声認識を行って音声認識表記を取得し、当該音声認識表記に対応付け られたコンテンツの URLカゝら成る検索結果リストを移動体端末装置に送信し、移動体 端末装置で検索結果リストを表示する。
[0009] また、本発明のサーバ装置は、音声による検索対象キーワードを受け付ける端末 装置と通信ネットワークを介して接続され、インターネット上のコンテンツの URL及び コンテンツの URLに対応付けられた音声認識表記が登録されたデータベースを用 いて情報検索を行うサーバ装置において、端末装置で受け付けた検索対象キーヮ ードに応じた音声データを受信する受信手段と、音声データに対する音声認識を行 つて音声認識表記を取得する音声認識手段と、音声認識手段により取得される音声 認識表記に対応付けられたコンテンツの URL力 成る検索結果リストを生成する検 索結果リスト生成手段と、検索結果リストを移動体端末装置に送信する送信手段と、 を具備する。
図面の簡単な説明
[図 1]本発明の一実施の形態に係る情報検索システムが適用される通信システムの 概略構成を示す図である。
[図 2]上記実施の形態に係る携帯電話の機能ブロック図である。
[図 3]上記実施の形態に係るサーバの機能ブロック図である。
[図 4]上記実施の形態に係るサーバの DB内に登録されるデータの一例について説 明するための図である。
[図 5]上記実施の形態に係るサーバの DB内に登録されるデータを指示カテゴリ等に 応じて体系的に捉えた場合について説明するための図である。
[図 6]上記実施の形態に係る携帯電話で表示される検索結果リストの内容を説明する ための図である。
[図 7]上記実施の形態に係る情報検索システムにおいて情報検索を行う場合の動作 の概要について説明するためのシーケンス図である。
[図 8]上記実施の形態に係る情報検索システムで情報検索を行う場合における携帯 電話の動作を説明するためのフロー図である。
[図 9]上記実施の形態に係る情報検索システムで情報検索を行う場合におけるサー バの動作を説明するためのフロー図である。
[図 10]上記実施の形態に係る情報検索システムにおいて、音声認識結果として選出 されるデータの一例について説明するための図である。
[図 11]上記実施の形態に係る情報検索システムの携帯電話に表示される検索結果リ ストの一例について説明するための図である。
[図 12]上記実施の形態に係る情報検索システムにおいて、音声認識結果として選出 されるデータの一例について説明するための図である。
[図 13]上記実施の形態に係る情報検索システムの携帯電話に表示される検索結果リ ストの一例について説明するための図である。 [図 14]上記実施の形態に係る情報検索システムの携帯電話に表示される検索結果リ ストの一例について説明するための図である。
[図 15]上記実施の形態に係る情報検索システムにおいて、音声認識結果として選出 されるデータの一例について説明するための図である。
[図 16]上記実施の形態に係る情報検索システムの携帯電話に表示される検索結果リ ストの一例について説明するための図である。
[図 17]上記実施の形態の変形例に係るサーバの DB内に登録されるデータの一例に ついて説明するための図である。
[図 18]上記実施の形態の変形例に係るサーバの DB内に登録されるデータの一例に ついて説明するための図である。
[図 19]上記実施の形態の変形例に係る情報検索システムにおいて情報検索を行う 場合の動作の概要について説明するためのシーケンス図である。
[図 20]上記発明の実施の形態の変形例に係る情報検索システムで情報検索を行う 場合における携帯電話の動作を説明するためのフロー図である。
発明を実施するための最良の形態
[0011] 以下、本発明の一実施の形態に係る情報検索システムの詳細を図面の記載に基 づいて説明する。
[0012] 図 1は、本発明の一実施の形態に係る情報検索システムが適用される通信システ ムの概略構成を示す図である。
[0013] 図 1に示す通信システムにおいては、ユーザが移動体端末装置としての携帯電話 装置 (以下、単に「携帯電話」 、う) 1を用いて、通信事業者網 2 (例えば、移動通信 用の PDC— P (Personal Digital Cellular- Packet)網)及びインターネット 3等の通信ネ ットワークを介して音声認識 ·検索サーバ装置 (以下、単に「サーバ」 、う) 4と通信を 行うことにより、サーノ が提供する情報検索サービスを利用できるように構成されて いる。そして、この情報検索サービスによる検索結果に応じて、ユーザが携帯電話 1 を用いて、上記通信ネットワークを介して WWWサーバ 5と通信を行うことにより、所望 の情報が含まれるホームページにアクセスできるように構成されて 、る。
[0014] なお、図 1においては、サーノ を、インターネット 3上に存在させる場合について示 しているが、サーノ が存在する場所としてはこれに限定されるものではなぐ通信事 業者網 2上に存在させるようにしても良い。また、図 1においては、サーノ とは別個 独立して WWWサーバ 5が配設された場合について示している力 WWWサーバ 5 が有する機能をサーバ 4に搭載し、 WWWサーバ 5を省略するようにしても良い。
[0015] 図 2は、本実施の形態に係る携帯電話の機能ブロック図である。なお、図 2に示す 機能ブロックは、本発明を説明するために簡略ィ匕したものであり、通常の携帯電話に 搭載される通話機能や、ウェブブラウザ機能に必要となる機能は備えているものとす る。
[0016] 図 2に示すように、携帯電話 1は、端末全体の制御を行う制御部 11と、ユーザから の音声入力を受け付ける音声入力部 12と、ユーザ力も入力された音声による検索対 象キーワードから後述する特徴パラメータを抽出する特徴パラメータ抽出部 13と、通 信事業者網 2などの通信ネットワークとの間の通信を制御する通信制御部 14と、ユー ザ力もの操作入力を受け付ける操作入力部 15と、携帯電話 1において使用される表 示を制御する表示制御部 16と、表示制御された文字、画像、映像を表示するデイス プレイ 17と、アンテナ 18とを含んでいる。
[0017] 音声入力部 12は、例えば、ユーザが検索したい情報に関連する検索対象キーヮ ードを受け付ける。以下においては、音声入力部 12が固有名詞や一般名詞などの キーワードを検索対象キーワードとして受け付ける場合にっ 、て示すが、ユーザから 入力された会話の内容からキーワードを抽出し、当該キーワードを検索対象キーヮー ドとして受け付けるようにしても良い。この場合には、例えば、会話の内容に所定回数 以上、出現するキーワードを抽出して検索対象キーワードとすることが考えられる。
[0018] 特徴パラメータ抽出部 13は、音声入力部 12から受け渡されるアナログ音声を分析 し、符号化、ノイズ処理及び補正等を行う。その後、符号化した音声から音声認識率 を劣化させない範囲で特徴部分のみを抜き出して特徴パラメータを生成する。例え ば、特徴パラメータ抽出部 13により、特徴パラメータは、通常の音声データ(32kBZ SEC : 16KHZ、 16bit)の 3. 75%のデータ量(1. 2kBZSEC)まで圧縮可能である
[0019] 通信制御部 14は、アンテナ 18を介して、特徴パラメータ抽出部 13で生成された特 徴パラメータをサーバ 4に送信すると共に、これに応じてサーバ 4から返送される検索 結果リストを受信する制御を行う。また、通信制御部 14は、上記検索結果リストから所 望の情報が含まれるホームページにアクセスする際の通信制御を行う。
[0020] 操作入力部 15は、例えば、ユーザから本情報検索サービスを利用する際に必要と なる音声認識 '情報検索アプリケーション (以下、単に「音声検索アプリケーション」と いう)の起動に伴う操作入力や、上記検索結果リストから所望の情報が含まれるホー ムページにアクセスする場合におけるアクセス対象を選択する際の操作入力、並び に、当該ホームページの閲覧を終了する際の操作入力などを受け付ける。
[0021] 表示制御部 16は、例えば、本携帯電話 1における通常動作に伴う画面情報、上記 音声検索アプリケーションで表示される画面情報、並びに、通信制御部 14を介して 受信した検索結果リストを含む画面情報の表示制御を行う。ディスプレイ 17には、表 示制御部 16の制御の下、各種の画面情報が表示される。
[0022] 図 3は、本実施の形態に係るサーバの機能ブロック図である。
[0023] 図 3に示すように、サーバ 4は、装置全体の制御を行う制御部 41と、インターネット 3 などの通信ネットワークを介して携帯電話 1又は後述するコンテンツ提供者が操作す るパーソナルコンピュータ (PC)と通信を行う通信部 42と、携帯電話 1から到来する音 声データの音声認識を行う音声認識部 43と、音声認識部 43が参照する各種情報が 記憶された記憶部 44と、音声認識部 43による音声認識結果に対応する各種情報が 登録されるデータベース (DB) 45と、音声データを送信してきた携帯電話 1に返送さ れる検索結果を含む検索結果リストを生成する検索結果リスト生成部 46と、を含んで いる。
[0024] なお、図 3においては、サーバ 4が、その構成要素として DB45を備える場合につい て示している力 DB45の接続形態としてはこれに限定されるものではなぐサーバ 4 に外部接続するようにしても良い。同様に、サーバ 4が、その構成要素として音声認 識部 43が参照する情報を記憶した記憶部 44を備える場合にっ 、て示して 、るが、こ の記憶部 44につ 、ても、サーバ 4に外部接続するようにしても良 、。
[0025] 通信部 42は、例えば、携帯電話 1から送信される音声データとして特徴パラメータ を受信すると共に、検索結果リスト生成部 46から受け渡される検索結果リストを当該 携帯電話 1に送信する。また、通信部 42は、本情報検索システムを利用した情報検 索サービスの提供を希望するコンテンツ提供者との間で、本情報検索サービスの提 供を受けるための会員登録手続や、後述する特別音声認識キーワードの登録手続 に必要な情報通信を行う。
[0026] 音声認識部 43は、記憶部 44に予め記憶された辞書を参照しながら、音響的確率 計算及び言語的確率計算により、通信部 42から受け渡される音声データの音声認 識を行う。ここで、音響的確率計算には記憶部 44に記憶されたルールグラマ用音響 モデルが用いられ、言語的確率計算には記憶部 44に記憶されたルールグラマ用言 語モデルが用いられる。記憶部 44には、このように音声認識部 43により参照される、 辞書、ルールグラマ用音響モデル及びルールグラマ用言語モデルが記憶されて 、る
[0027] DB45には、例えば、図 4に示すデータが登録される。図 4は、本実施の形態に係 るサーノ の DB45に登録されるデータ例を説明するための図である。なお、図 4に 示すデータにおいては、説明の便宜上、音声認識の過程で発音記号列が得られる ものとして説明するが、必ずしも音声認識の過程でこの発音記号列を得る必要はな い。最終的に、音声認識結果として音声認識表記を得ることができれば、音声認識 の過程はいかなる手法を用いても良い。また、図 4に示すデータは、その一例を示し たものであり、その内容については、適宜変更することが可能である。例えば、図 4に 示す音声認識表記と URLとを含むことを前提として、その他のデータ構成につ!、て はどのような形式を採用しても良い。
[0028] ここで、 DB45に登録されるデータの内容について説明する。図 4に示すように、 D B45には、本情報検索サービスにおける音声認識による結果として得られる音声認 識表記、この音声認識表記に応じて本情報検索サービスのサービス提供者により予 め登録される発音記号列、音声認識表記の種別(以下、「表記種別」という)、インタ 一ネット 3上のコンテンツ(ホームページ)の URL、コンテンツの内容に応じた文字列 であって当該コンテンツの URLにリンクさせた指示文字列、並びに、コンテンツの内 容に応じたカテゴリを示し当該カテゴリに含まれる指示文字列に関連付けられた指示 カテゴリが登録されている。なお、音声認識表記は、発音記号列を文字や記号等で 表したものに相当する。
[0029] このうち、指示文字列及び指示カテゴリは、後述する検索結果リスト上に表示される ものである。指示文字列は、検索結果リスト上においてユーザが選択することで当該 指示文字列にリンクさせた URLにアクセス可能に構成されている。一方、指示カテゴ リは、検索結果リスト上においてユーザが選択することで当該指示カテゴリに関連付 けられた指示文字列に表示切替え可能に構成されている。なお、指示文字列及び 指示カテゴリの内容は、原則として、サービス提供者により指定される。しかし、コンテ ンッ提供者による指定に応じてこれらを決定するようにしても良 ヽ。
[0030] 音声認識表記は、音声認識結果として得られるものであり、サービス提供者又はコ ンテンッ提供者により指定されるものである。音声認識表記には、後述する検索結果 リスト上に指示カテゴリを表示させるための一般音声認識表記と、検索結果リスト上に 指示文字列を表示させるための特別音声認識表記とが存在する。表記種別には、こ れらの一般音声認識表記又は特別音声認識表記の種別が記述される。
[0031] 一般音声認識表記と特別音声認識表記とは、その存在意義において相違する。一 般音声認識表記は、本情報検索サービスにおける利用者の利便性の確保を目的と したものである。一方、特別音声認識表記は、コンテンツへのアクセスの向上を希望 するコンテンツ提供者とのビジネスの実現を目的とするものである。
[0032] すなわち、一般音声認識表記は、著名な会社等のコンテンツへのアクセスを確保 すべく登録されるものである。それ故、一般音声認識表記は、コンテンツ提供者の登 録要求の有無に関わらず、サービス提供者により登録される。例えば、一般音声認 識表記の内容には、コンテンツ提供者の会社名などが指定される。詳細について後 述するように、このような一般音声認識表記に対応する音声認識結果が得られると、 利用者には当該一般音声認識表記に対応する指示カテゴリが提示されることとなる。
[0033] 一方、特別音声認識表記は、各コンテンツ提供者が保有するコンテンツへのァクセ スの向上を図るべく登録されるものである。それ故、特別音声認識表記は、原則とし て、コンテンツ提供者の登録要求に応じて登録される。特別音声認識表記の内容は 、コンテンツ提供者が任意に指定可能となっており、例えば、コンテンツ提供者の会 社名の通称や短縮名称、並びに、主力商品や独自ブランドの名称などが指定される 。また、その登録数もコンテンツ提供者により任意に指定可能となっている。詳細に ついて後述するように、このような特別音声認識表記に対応する音声認識結果が得 られると、利用者には当該特別音声認識表記に対応する指示文字列が提示されるこ ととなる。
[0034] このように一般音声認識表記のみではなく、特別音声認識表記を登録した場合に は、簡単にコンテンツへのアクセスが可能な指示文字列が提示されることから、当該 コンテンツへのアクセスの向上が望める。本情報検索サービスにおいては、このよう な特別音声認識表記の登録により得られる利益の代償としてコンテンツ提供者に課 金を行うことで、コンテンツ提供者とのビジネスを実現する。そして、利用者がより簡単 に様々なコンテンツへアクセス可能となるように、コンテンツ提供者による特別音声認 識表記の登録を推進するものである。
[0035] ここで、図 4に示すデータの内容について抜粋して説明する。なお、図 4に示す DB 45においては、日本語で情報検索を行うことを前提としたデータが登録された場合 について示している。このため、発音記号列には、音声認識表記に対応する日本語 による発音内容が登録された場合について示している。しかし、 DB45に登録される データの内容については、これに限定されるものではなぐ英語、中国語や韓国語な どを含む各種言語で情報検索を行うことができるデータを登録するようにしても良い。 この場合、発音記号列には、音声認識表記に対応する各種言語による発音内容が 登録されることとなる。
[0036] 図 4に示すように、音声認識表記「BBB」は、特別音声認識表記として 2つ登録され ており、共に発音記号列「ΒΠΒΠΒΠ」が対応付けられている。そして、これらの音声 認識表記「ΒΒΒ」には、異なる URL、指示文字列及び指示カテゴリが対応付けられ ている。一方には、 URL「http : /Zwww. bbbpub. co. jp. html」、指示文字列「 BBB児童書販売」及び指示カテゴリ「児童書販売」が対応付けられ、他方には、 UR L「http: Z / www. bbbreiorm. co. jp. ntml」、指 文子列「BBBリフォ1 及 び指示カテゴリ「リフォーム」が対応付けられている。これは、これらのデータに対応す るコンテンツ提供者が、保有するコンテンツへのアクセスの向上を目的として、特別音 声認識表記「BBB」を登録したことを意味して 、る。 [0037] 音声認識表記「BBB自動車」は、一般音声認識表記として登録されており、発音記 号列「BIIBnBIlJIDOUSHA」が対応付けられている。また、音声認識表記「BBB自 動車」〖こは、 URL「http : ZZwww. bbb. co. jp. html」、指示文字列「BBB自動 車」及び指示カテゴリ「自動車メーカー」が対応付けられている。これは、利用者の利 便性を考慮してサービス提供者が一般音声認識表記「BBB自動車」を登録したこと を意味している。
[0038] さらに、音声認識表記「自動車」は、一般音声認識表記として登録されており、発音 記号列「JIDOUSHA」が対応付けられている。なお、音声認識表記「自動車」には、 URL及び指示文字列は登録されておらず、指示カテゴリ「自動車」のみが登録され ている。これは、利用者の利便性を考慮してサービス提供者が一般音声認識表記「 自動車」を登録したことを意味して 、る。
[0039] 本情報検索サービスにお!/、ては、音声認識表記の種別(一般音声認識表記である 力 特別音声認識表記であるか)に応じて、検索結果リスト上に指示文字列を表示す るか、指示カテゴリを表示するかの差異を設けている。上述のように、特別音声認識 表記は、コンテンツ提供者による金銭の支払いに応じて登録される一方、一般音声 認識表記は、コンテンツ提供者の金銭の支払いとは無関係に登録される。このような 背景の下、本情報検索サービスにおいては、あるコンテンツ提供者が特別音声認識 表記を登録した場合には、一般音声認識表記を特別音声認識表記として取り扱うよ うにしている。音声認識表記「AAA自動車」等は、この場合に該当するものであり、 他の特別音声認識表記 (例えば、 ΓΑΑΑ] )の登録に応じて一般音声認識表記が特 別音声認識表記として取り扱われる。従って、音声認識表記「AAA自動車」が音声 認識結果として得られた場合には、これに対応する指示カテゴリ「自動車メーカー」で はなぐ指示文字列「AAA自動車」が検索結果リストに表示されることとなる。
[0040] 図 5は、本実施の形態に係るサーバの DB45内に登録されるデータを指示カテゴリ 及び指示文字列に応じて体系的に捉えた場合について説明するための図である。 なお、図 5に示すデータ内容は、説明の便宜を図って示すものであり、実際に DB45 内のデータ内容を示すものではない。また、図 5においては、指示カテゴリを大区分( 同図に示す「指示カテゴリ(大)」)と小区分(同図に示す「指示カテゴリ(小)」)とに分 けた場合にっ 、て示して!/、る。
[0041] 以下、図 5に示すデータ内容について図 4に示すデータの一部を抜粋して説明す る。
図 5に示す指示文字列「AAA自動車」は、指示カテゴリ「自動車メーカー」に属し、 この指示カテゴリ「自動車メーカー」は、更に指示カテゴリ「自動車」に属している。ま た、この指示文字列「AAA自動車」には、一般音声認識表記として「AAA自動車」 が登録され、第 1特別音声認識表記(同図における「特別音声認識表記 1」)として「A AA」が登録され、第 2特別音声認識表記(同図における「特別音声認識表記 2」 )とし て「高級車」が登録されていることが分かる。すなわち、音声認識結果として、音声認 識表記「AAA自動車」、「AAA」及び「高級車」が得られた場合には、検索結果リスト に指示文字列「AAA自動車」が表示されることを示して 、る。
[0042] 同様に、指示文字列「BBB自動車」は、指示カテゴリ「自動車メーカー」に属し、この 指示カテゴリ「自動車メーカー」は、指示カテゴリ「自動車」に属して 、る。また、指示 文字列「BBB自動車」には、一般音声認識表記として「BBB自動車」が登録されるが 、特別音声認識表記の登録がされていないことが分かる。すなわち、音声認識結果と して、音声認識表記「BBB自動車」が得られた場合には、検索結果リストに指示カテ ゴリ「自動車メーカー」が表示されることを示している。なお、この場合において、指示 カテゴリとして「自動車メーカー」を選択するか、「自動車」を選択するかは任意である 。本情報検索サービスにおいては、小区分である「自動車メーカー」を選択するように している。
[0043] 図 3に戻り、サーバ 4の説明を続ける。検索結果リスト生成部 46は、音声認識部 43 による音声認識結果に基づいて検索結果リストを生成する。この際、検索結果リスト 生成部 46は、音声認識結果として得た音声認識表記に対応して登録された指示文 字列又は指示カテゴリを選出する。
[0044] 検索結果リスト生成部 46により生成された検索結果リストは、通信部 42を介して情 報検索を依頼してきた携帯電話 1に返送される。そして、携帯電話 1のディスプレイ 1 7上に表示される。以下、携帯電話 1のディスプレイ 17上に表示される検索結果リスト の内容について説明する。 [0045] 図 6は、携帯電話 1で表示される検索結果リストの内容を説明するための図である。 図 6に示すように、検索結果リストには、検索結果を表示するために上下に分割され た 2つの領域が設けられている。ここでは、ディスプレイ 17の上方側に、指示文字列 5 1が表示される文字列表示領域 52が設けられ、下方側に、指示文字列 51に対応付 けられた指示カテゴリ 53が表示されるカテゴリ表示領域 54が設けられている。
[0046] このような検索結果リストがディスプレイ 17上に表示される場合において、文字列表 示領域 52にアクセス対象となる指示文字列 51が表示されている場合、ユーザは、こ れを選択することで直接的に当該 URLに対応するコンテンッ (ホームページ)にァク セスすることが可能である。一方、文字列表示領域 52にアクセス対象となる指示文字 列 51が表示されておらず、カテゴリ表示領域 54に指示カテゴリ 53が表示されている 場合、ユーザは、当該指示カテゴリ 53から、更にアクセス対象となる指示文字列 51を 探すこととなる。
[0047] なお、カテゴリ表示領域 54に表示された指示カテゴリ 53が選択された場合には、 図 5に示すようなデータ内容に応じて指示文字列 51に表示が切り替えられる。例え ば、指示カテゴリ「自動車メーカー」が選択された場合、指示文字列「AAA自動車」、 ΓΒΒΒ自動車」及び「CCC自動車」に表示が切り替えられることとなる。
[0048] 次に、上記構成を有する本情報検索システムにお 、て情報検索を行う場合の動作 の概要について説明する。図 7は、本発明の一実施の形態に係る情報検索システム において情報検索を行う場合の動作の概要について説明するためのシーケンス図 であり、特に、本情報検索サービスにおいて特別発音記号列を登録したコンテンツ 提供者のコンテンツにアクセスする場合の動作にっ 、て示して 、る。
[0049] 本情報検索システムを用いた情報検索サービスを利用する場合、まず、携帯電話 1 のユーザが操作入力部 15を操作して、本情報検索サービスを利用する際に必要と なる音声検索アプリケーションを起動する。この音声検索アプリケーションを起動する ことにより、携帯電話 1の音声入力部 12がユーザからの検索対象キーワードを受付 け可能とされる。
[0050] 携帯電話 1で上記音声検索アプリケーションが起動された状態で、ユーザから検索 対象キーワードが発せられると、音声入力部 12でこれを受け付ける (ステップ (以下、 「ST」と略す) 701)。音声入力部 12が受け付けた検索対象キーワードは、制御部 11 を介して特徴パラメータ抽出部 13に渡される。特徴パラメータ抽出部 13は、当該検 索対象キーワードから特徴パラメータを抽出(生成)する(ST702)。抽出された特徴 パラメータは、制御部 11を介して通信制御部 14に渡される。通信制御部 14は、当該 特徴パラメータを、通信ネットワークを介してサーバ 4に送信する(ST703)。
[0051] 携帯電話 1から到来する特徴パラメータをサーバ 4の通信部 42で受信すると、当該 特徴パラメータは、制御部 41を介して音声認識部 43に渡される。音声認識部 43は、 記憶部 44に記憶された辞書、ルールグラマ用音響モデル及びルールグラマ用言語 モデルを参照しながら、その音声認識を行う(ST704)。音声認識部 43による音声認 識結果は、制御部 41を介して検索結果リスト生成部 46に渡される。検索結果リスト生 成部 46は、当該音声認識結果に応じて検索結果リストを生成する(ST705)。生成さ れた検索結果リストは、制御部 11を介して通信部 42に渡される。通信部 42は、当該 検索結果リストを、通信ネットワークを介して携帯電話 1に送信する(ST706)。
[0052] サーバ 4から到来する検索結果リストを携帯電話 1の通信制御部 14で受信すると、 当該検索結果リストは、制御部 11を介して表示制御部 16に渡される。表示制御部 1 6は、当該検索結果リストをディスプレイ 17に表示する(ST707)。ここでは、検索結 果リストから指示文字列を選択する操作入力を受け付けるものとする。指示文字列を 選択する操作入力を受け付けると (ST708)、制御部 11は、当該操作入力に応じて ウェブブラウザを起動する(ST709)。そして、選択された指示文字列に対応する UR Lにアクセスする(ST710)。
[0053] その後、当該 URLにアクセスすることでディスプレイ 17に表示されたホームページ 画面の閲覧の終了指示を操作入力部 15から受け付けると、制御部 11は、ウェブブラ ゥザを停止し処理を終了する。このようにして、本情報検索システムにおいて情報検 索を行う場合の一連の動作が終了する。
[0054] 次に、本発明の一実施の形態に係る情報検索システムで情報検索を行う場合にお ける携帯電話及びサーバの動作について説明する。図 8は、本発明の一実施の形 態に係る情報検索システムで情報検索を行う場合における携帯電話の動作を説明 するためのフロー図であり、図 9は、本発明の一実施の形態に係る情報検索システム で情報検索を行う場合におけるサーバの動作を説明するためのフロー図である。
[0055] 本実施の形態に係る情報検索システムで情報検索を行う場合、図 8に示すように、 携帯電話 1の制御部 11は、音声検索アプリケーションを起動した状態で、音声入力 部 12によりユーザからの検索対象キーワードを受け付けるか監視している(ST801) 。検索対象キーワードを受け付けるまでは、当該監視動作を継続する。なお、当該監 視動作を一定時間継続した場合にお!、ても、検索対象キーワードを受け付けな 、場 合には、上記音声検索アプリケーションを終了するようにしても良 、。
[0056] 検索対象キーワードを検出した場合には、制御部 11は、特徴パラメータ抽出部 13 により特徴パラメータを抽出する(ST802)。そして、抽出した特徴パラメータを、通信 制御部 14により通信ネットワークを介してサーバ 4に送信する(ST803)。
[0057] 特徴パラメータをサーバ 4に送信した後、制御部 11は、通信制御部 14によりサー バ 4から、上記特徴パラメータに基づく検索結果リストを受信するか監視する(ST804 )。検索結果リストを受信するまでは、当該監視動作を継続する。なお、当該監視動 作を一定時間継続した場合においても、検索結果リストを受信しない場合には、再び 上記特徴パラメータをサーバ 4に送信するようにしても良 、。
[0058] 検索結果リストを受信した場合、制御部 11は、表示制御部 16により当該検索結果 リストをディスプレイ 17に表示する(ST805)。その後、操作入力部 15による当該検 索結果リスト上の指示文字列の選択を受け付けるか、或いは、検索結果リスト上の指 示カテゴリの選択を受け付けるか監視する(ST806、 ST807)。いずれかの選択を 受け付けるまで当該監視動作を継続する。なお、当該監視動作を一定時間継続した 場合においても、いずれの選択も受け付けない場合には、上記音声検索アプリケー シヨンを終了するようにしても良 、。
[0059] 検索結果リスト上の指示文字列の選択を受け付けた場合、制御部 11は、ウェブブ ラウザを起動し (ST808)、選択された指示文字列に関連付けられた、対応する UR Lにアクセスする(ST809)。その後、当該 URLにアクセスすることでディスプレイ 17 に表示されたホームページ画面の閲覧の終了指示を操作入力部 15から受け付ける と、制御部 11は、ウェブブラウザを停止し処理を終了する。
[0060] 一方、検索結果リスト上の指示カテゴリの選択を受け付けた場合、制御部 11は、選 択を受け付けた指示カテゴリに対応する指示文字列に表示を切り替える(ST810)。 そして、表示切替え後の指示文字列の選択を受け付けるか監視する(ST811)。指 示文字列の選択を受け付けるまで当該監視動作を継続する。なお、当該監視動作を 一定時間継続した場合にぉ 、ても、指示文字列の選択を受け付けな 、場合には、 再度、上記検索結果リストを表示するようにしても良い。
[0061] そして、表示切替え後の指示文字列の選択を受け付けた場合、制御部 11は、上記 と同様に、ウェブブラウザを起動し (ST808)、選択された指示文字列に関連付けら れた、対応する URLにアクセスする(ST809)。その後、当該 URLにアクセスするこ とでディスプレイ 17に表示されたホームページ画面の閲覧の終了指示を操作入力部 15から受け付けると、制御部 11は、ウェブブラウザを停止し処理を終了する。このよう にして、本情報検索システムにおいて情報検索を行う場合における携帯電話 1の一 連の動作が終了する。
[0062] 一方、本実施の形態に係る情報検索システムで情報検索を行う場合、図 9に示すよ うに、サーバ 4の制御部 41は、通信部 42を介して携帯電話 1から特徴パラメータを受 信するか監視している(ST901)。特徴パラメータを受信するまでは、常時、当該監 視動作を継続する。
[0063] 特徴パラメータを受信した場合には、制御部 41は、音声認識部 43により記憶部 44 に記憶された辞書、ルールグラマ用音響モデル及びルールグラマ用言語モデルを 参照しながら、当該特徴パラメータの音声認識を行う(ST902)。
[0064] 音声認識を行った後、制御部 41は、音声認識結果に応じた所定数のデータを選 出する。具体的には、 ST901で受信した特徴パラメータに基づく音声認識において 、類似度が高い所定数 (例えば、 10個)のデータを選出する(ST903)。
[0065] 類似度が高い所定数のデータを選出した後、制御部 41は、例えば、類似度の上位 のデータから、当該データに含まれる音声認識表記が一般音声認識表記である力判 定する(ST904)。この際、制御部 41は、表記種別に「一般」が指定されている力否 かに応じて判定する。ここで、当該データの音声認識表記が一般音声認識表記であ る場合には、そのデータに登録された指示カテゴリを選択し (ST905)、音声認識結 果として、検索結果リスト生成部 46に通知する。通知された指示カテゴリは、検索結 果リスト生成部 46で一時的に保持される。
[0066] 一方、当該データの音声認識表記が一般音声認識表記でな!、場合、すなわち、特 別音声認識表記である場合には、そのデータに登録された指示文字列を選択し (S T906)、音声認識結果として、検索結果リスト生成部 46に通知する。指示カテゴリの 場合と同様に、通知された指示文字列は、検索結果リスト生成部 46で一時的に保持 される。
[0067] ST905で指示カテゴリを通知した後、或いは、 ST906で指示文字列を通知した後 、制御部 41は、 ST903で選出した全てのデータについて処理を行った力判定する( ST907)。ここで、選出した全てのデータについて処理を行っていない場合には、選 出したデータを更新して(ST908)、 ST904〜ST907の処理を繰り返す。
[0068] ST904〜ST907の処理を繰り返す中で、 ST907において選出した全てのデータ について処理を行ったと判定すると、制御部 41は、検索結果リスト生成部 47により検 索結果リストを生成する(ST909)。これにより、保持しておいた指示カテゴリ又は指 示文字列を含む検索結果リストが生成される。
[0069] 検索結果リストが生成されたならば、制御部 41は、当該検索結果リストを通信部 42 により、上記特徴パラメータを送信してきた携帯電話 1に送信する(ST910)。その後 、制御部 41は、処理を ST901に戻し、再び、特徴パラメータの受信に備える。このよ うにして、本情報検索システムにおいて情報検索を行う場合におけるサーバ 4の一連 の動作が終了する。
[0070] 次に、本情報検索システムにおいて、情報検索を行った場合に携帯電話 1に表示 される検索結果リストの具体例について図 10〜図 16を用いて説明する。なお、以下 においては、サーノ の DB45に、図 4に示す内容のデータのみが登録されているも のとする。
[0071] 図 10、図 12及び図 15は、本情報検索システムにおいて、音声認識結果として選 出されるデータの一例について説明するための図である。図 11、図 13、図 14及び 図 16は、本情報検索システムの携帯電話に表示される検索結果リストの一例につい て説明するための図である。なお、図 10、図 12及び図 15において、音声認識結果と して選出されたデータの順位は、説明の便宜上、採用したものであり、実際の音声認 識結果に基づくものではな 、。
[0072] 図 10は、検索対象キーワードとして「AAA自動車」が入力された場合に音声認識 結果として選出されるデータの一例について示し、図 11は、この場合における検索 結果リストの内容について示している。図 12は、検索対象キーワードとして「BBB自 動車」が入力された場合に音声認識結果として選出されるデータの一例について示 し、図 13は、この場合における検索結果リストの内容について示している。図 14は、 図 13に示す検索結果リストから「自動車メーカー」の指示カテゴリ 53が選択された場 合に表示される内容について示している。図 15は、検索対象キーワードとして「自動 車」が入力された場合に音声認識結果として選出されるデータの一例について示し、 図 16は、この場合における検索結果リストの内容について示している。
[0073] まず、検索対象キーワードとして「AAA自動車」が入力された場合について説明す る。検索対象キーワードとして「AAA自動車」が入力されると、サーバ 4における ST9 02及び ST903の処理により図 10に示すデータが選出される。具体的には、音声認 識表記「AAA自動車」、「AAA自動織機」、「AAA児童書販売」、「AAAホーム」、 「 ΑΑΑ」、「ΑΑΑ」 · · ·「自動車」及び「児童書」に対応するデータが選出される。
[0074] そして、 ST904〜ST907の処理により、選出されたデータのうち、指示カテゴリ又 は指示文字列が選択される。具体的には、音声認識表記「AAA自動車」、「AAAホ ーム」、 「AAA」及び「AAA」に対応するデータにお 、て、指示文字列「AAA自動車 」、 「AAAホーム」、 「AAA自動車」及び「AAAホーム」が選択される。一方、音声認 識表記「AAA自動織機」、「AAA児童書販売」、「自動車」及び「児童書」に対応する データにおいて、指示カテゴリ「機械メーカー」、「児童書販売」、「自動車」及び「児童 書」が選択される。
[0075] そして、 ST909及び ST910において、このように選択された指示文字列及び指示 カテゴリに応じて検索結果リストが生成され、携帯電話 1に送信される。この場合、検 索結果リストには、図 11に示すように、文字列表示領域 52に「AAA自動車」及び「A AAホーム」の指示文字列 51が表示され、カテゴリ表示領域 54に「機械メーカー」、「 児童書販売」、「自動車」及び「児童書」の指示カテゴリ 53が表示される。
[0076] 次に、検索対象キーワードとして「BBB自動車」が入力された場合について説明す る。検索対象キーワードとして「BBB自動車」が入力されると、サーバ 4における ST9 02及び ST903の処理により図 12に示すデータが選出される。具体的には、音声認 識表記「BBB自動車」、「BBB自動織機」、「BBB児童書販売」、「BBB」、「BBB」、「 BBBリフォーム」、 · · ·「§動車」及び「児童書」に対応するデータが選出される。
[0077] そして、 ST904〜ST907の処理により、選出されたデータのうち、指示カテゴリ又 は指示文字列が選択される。具体的には、音声認識表記「BBB児童書販売」、 ΓΒΒ B」、「BBB」及び「BBBリフォーム」に対応するデータにおいて、指示文字列「BBB児 童書販売」、「BBBリフォーム」、「BBB児童書販売」及び「BBBリフォーム」が選択さ れる。一方、音声認識表記「BBB自動車」、「BBB自動織機」、「自動車」及び「児童 書」に対応するデータにおいて、指示カテゴリ「自動車メーカー」、「機械メーカー」、「 自動車」及び「児童書」が選択される。
[0078] そして、 ST909及び ST910において、このように選択された指示文字列及び指示 カテゴリに応じて検索結果リストが生成され、携帯電話 1に送信される。この場合、検 索結果リストには、図 13に示すように、文字列表示領域 52に「BBBリフォーム」及び「 BBB児童書販売」の指示文字列 51が表示され、カテゴリ表示領域 54に「自動車メー カー」、「機械メーカー」、「自動車」及び「児童書」の指示カテゴリ 53が表示される。
[0079] なお、本情報検索システムにおいては、検索結果リストの文字列表示領域 52にお いて、指示文字列 51の表示順序を、本情報検索サービスへの支払い金額が大きい コンテンツ提供者 (特別発音記号列の登録数が多!、コンテンツ提供者)に対応させ て表示させている。すなわち、図 5に示すように、指示文字列「BBB児童書販売」に 対応するデータには特別音声認識表記が 1つだけ登録されているのに対し、指示文 字列「BBBリフォーム」に対応するデータには特別音声認識表記が 2つ登録されてい る。このため、本情報検索システムにおいては、図 13に示すように、指示文字列「BB B児童書販売」よりも「BBBリフォーム」を上位に表示させて 、る。
[0080] なお、本情報検索システムにお!/、ては、このように本情報検索サービスへの支払 ヽ 金額に応じて指示文字列 51の表示順序に優先順位を設けるが、入力された検索対 象キーワードと略一致する音声認識表記が特別音声認識表記として登録されている 場合には、当該データの指示文字列 51を最上位位置に表示させる。これにより、検 索対象キーワードと略一致する音声認識表記に応じた指示文字列 51が存在するに も関わらず、他の指示文字列 51よりも下位位置に表示されるのを回避し、利用者の 利便性を向上させている。
[0081] なお、「BBB自動車」の検索を希望するユーザは、図 13に示す検索結果リストの文 字列表示領域 52に、対応する指示文字列 51がないため、カテゴリ表示領域 54の指 示カテゴリ 53から、 ΓΒΒΒ自動車」が含まれる指示カテゴリ 53を予想して選択する必 要がある。ここで、 ΓΒΒΒ自動車」が含まれる指示カテゴリ「自動車メーカー」が選択さ れると、図 14に示すように、当該指示カテゴリ 53に対応付けられた指示文字列 51の 一覧に表示が切り替えられる。具体的には、「自動車メーカー」の指示カテゴリ 53に 対応付けられた「AAA自動車」及び「BBB自動車」の指示文字列 51が表示される。
[0082] なお、切替え後の表示において、指示文字列 51の表示順は、上述の場合と同様 に、本情報検索サービスへの支払金額が大き 、コンテンツ提供者に対応させて表示 される。このため、図 14に示すように、文字列表示領域 52においては、「AAA自動 車」及び「BBB自動車」の順番に指示文字列 51が並べられることとなる(図 5参照)。
[0083] 最後に、検索対象キーワードとして「自動車」が入力された場合にっ 、て説明する。
検索対象キーワードとして「自動車」が入力されると、サーバ 4における ST902及び S T903の処理により図 15に示すデータが選出される。具体的には、音声認識表記「 自動車」、「児童書」…「AAA自動車」、「BBB自動車」、「AAA自動織機」、「BBB 自動織機」、「AAA児童書販売」及び「BBB児童書販売」に対応するデータが選出さ れる。
[0084] そして、 ST904〜ST907の処理により、選出されたデータのうち、指示カテゴリ又 は指示文字列が選択される。具体的には、音声認識表記「AAA自動車」及び「BBB 児童書販売」に対応するデータにおいて、指示文字列「AAA自動車」及び「BBB児 童書販売」が選択される。一方、音声認識表記「自動車」、「児童書」、「BBB自動車」 、「AAA自動織機」、「BBB自動織機」及び「AAA児童書販売」に対応するデータに おいて、指示カテゴリ「自動車」、「児童書」、「自動車メーカー」、「機械メーカー」、「 機械メーカー」及び「児童書販売」が選択される。
[0085] そして、 ST909及び ST910において、このように選択された指示文字列及び指示 カテゴリに応じて検索結果リストが生成され、携帯電話 1に送信される。この場合、検 索結果リストには、図 16に示すように、文字列表示領域 52に「AAA自動車」及び「B BB児童書販売」の指示文字列 51が表示され、カテゴリ表示領域 54に「自動車」、「 児童書」、「自動車メーカー」、「機械メーカー」及び「児童書販売」の指示カテゴリ 53 が表示される。
[0086] このように本実施の形態に係る情報検索システムによれば、携帯電話 1から受け付 けた音声による検索対象キーワードに応じた検索結果リストがサーバ 4から返送され 、携帯電話 1で表示される。このため、ユーザは、携帯電話 1に対して音声による検索 対象キーワードを入力するだけで、当該検索対象キーワードに応じた検索結果を受 け取ることが可能となる。
[0087] このとき、上記検索結果リストに表示される情報は、指示文字列及び指示カテゴリの みに限定されているため、表示画面の大きさに制限がある携帯電話 1で検索結果を 表示する場合であっても、必要な情報を表示することが可能となる。この結果、ユー ザによる操作負担を軽減させつつ、迅速且つ適確にユーザの所望の情報を検索す ることが可能となる。
[0088] また、本実施の形態に係る情報検索システムにおいて、サーバ 4から返送される検 索結果リストには、対応するコンテンッの URLにリンクさせた指示文字列及び関連す る指示文字列に表示切替え可能に構成された指示カテゴリが表示されるので、ユー ザによる指示文字列の選択操作に応じて、簡単に対応するコンテンツへアクセスさせ ることが可能となると共に、指示カテゴリの選択操作に応じて関連する指示文字列を 表示させることが可能となる。
[0089] 特に、本実施の形態に係る情報検索システムにおいて、携帯電話 1は、検索対象 キーワードから音声認識の認識率を劣化させない程度に抽出される特徴パラメータ を音声データとしてサーバ 4に送信し、サーバ 4で当該特徴パラメータに基づいて音 声認識を行う。これにより、音声認識の認識率を劣化させない程度に抽出される特徴 ノ メータのみが携帯電話 1からサーバ 4に送信されるため、通信に要する時間及び コストを低減することができ、引いては情報検索に要する時間及びコストを低減するこ とができ、迅速にユーザの所望の情報を検索することが可能となる。 [0090] また、本実施の形態に係る情報検索システムにお 、ては、 DB45の音声認識表記 に、検索結果リストに指示カテゴリを表示させるための一般音声認識表記と、指示文 字列を表示させるための特別音声認識表記とを登録している。これにより、検索対象 キーワードに基づく音声認識結果に応じて検索結果リスト上に表示される情報を切り 替えることが可能となる。
[0091] 特に、本実施の形態に係る情報検索システムにお 、ては、特別音声認識表記の登 録内容又は登録数を、コンテンツ提供者により指定できるようにしている。このように 特別音声認識表記の登録内容等をコンテンツ提供者が指定可能とすることにより、コ ンテンッ提供者により指定された特別音声認識表記の登録内容又は登録数に応じ て、検索結果リストにおける指示文字列の出現率を変動させることが可能となる。
[0092] また、本実施の形態に係る情報検索システムにお 、ては、特別音声認識表記の登 録数に応じて、コンテンツ提供者に対する課金額を増減させるようにしている。これに より、検索結果リストにおけるコンテンツ提供者のコンテンツに対応する指示文字列 5 1の出現率に見合った料金をコンテンツ提供者力 徴収することが可能となる。
[0093] さらに、本実施の形態に係る情報検索システムにおいては、検索結果リストに表示 される指示文字列 51の表示順序に優先順位を設けるようにしている。これにより、予 め定めた何らかの条件に応じて検索結果リストに表示される指示文字列 51の表示順 序を順位付けることが可能となる。
[0094] 例えば、本実施の形態に係る情報検索システムにお 、ては、コンテンツ提供者に 対する課金額に応じて検索結果リストに表示される指示文字列 51の表示順序を決 定する。このようにコンテンツ提供者に対する課金額に応じて指示文字列 51の表示 順序を決定することで、コンテンツ提供者が当該情報検索システムを用いた情報検 索サービスに対して支払った金額に応じて検索結果リストに表示される指示文字列 5 1の表示順序を順位付けることが可能となる。
[0095] 但し、本実施の形態に係る情報検索システムにお 、ては、音声認識部 43による音 声認識結果と一致する特別音声認識表記に対応する指示文字列 51の表示順序を 最上位にしている。これにより、音声認識部 43による音声認識結果と一致する特別 音声認識表記に対応する指示文字列 51が最上位に表示されるので、ユーザにおけ る利用性に優れた情報検索システムを提供することが可能となる。
[0096] なお、本発明は上記実施の形態に限定されず、種々変更して実施することが可能 である。上記実施の形態において、添付図面に図示されている大きさや形状などに ついては、これに限定されず、本発明の効果を発揮する範囲内で適宜変更すること が可能である。その他、本発明の目的の範囲を逸脱しない限りにおいて適宜変更し て実施することが可能である。
[0097] 上記実施の形態においては、サーバ 4の DB45に、音声認識表記、発音記号列、 表記種別、 URL、指示文字列及び指示カテゴリが登録された場合について示してい る。しかし、上記実施の形態のように、音声認識表記に応じて検索結果リスト上に指 示カテゴリと指示文字列とを表示することを前提として、 DB45に登録される内容につ いて適宜変更が可能である。例えば、指示カテゴリの登録の有無に応じて音声認識 表記の種別を判定することとして、表記種別を省略するようにしても良 ヽ。
[0098] また、上記実施の形態にお!、ては、検索結果リスト上に、指示文字列及び指示カテ ゴリを表示する場合について説明しているが、検索結リスト上に表示される内容として は、これに限定されず、適宜変更が可能である。例えば、検索結果リスト上に指示文 字列のみを表示するようにしても良い。さらに、検索結果リスト上に指示文字列のみを 表示する場合を含めて、必ずしも指示文字列を表示する必要はなぐこれに対応す る URLをそのまま表示するようにしても良い。
[0099] 上記実施の形態においては、インターネット 3上のコンテンツにアクセスする際に当 該コンテンッの URLを検索する場合にっ ヽて説明して 、るが、その具体的な利用方 法として、携帯電話 1で実行されるアプリケーションのダウンロードと関連させることが 考えられる。例えば、サーバ 4の DB45に特定のアプリケーションがダウンロード可能 なホームページの URLを登録すると共に、対応する特別音声認識表記 (一般音声 認識表記でも良い)にアプリケーション名称を登録しておく。そして、ユーザから検索 対象キーワードとして当該アプリケーション名称を受け付けた場合には、これに対応 して検索結果リスト上に表示される指示文字列 51を選択することで、当該アプリケー シヨンをダウンロード可能なホームページに容易にアクセスすることが可能となる。
[0100] また、携帯電話 1に、ダウンロード (インストール)済みのアプリケーションの管理機 能を付加させて、利用者力もの音声データの入力を携帯電話 1におけるアプリケーシ ヨンの起動と関連させることも考えられる。例えば、対象となるアプリケーションが既に 携帯電話 1にダウンロード済みである場合において、上記と同様の要領で、ユーザか ら検索対象キーワードとして当該アプリケーション名称を受け付けた場合には、携帯 電話 1において特徴パラメータを抽出しサーバ 4に送信する代わりに、当該アプリケ ーシヨンを起動するようにしても良い。この場合には、携帯電話 1に対して起動を希望 するアプリケーション名称を発するだけで、当該アプリケーションを起動することが可 能となる。
[0101] さらに、上記実施の形態においては、 DB45に登録する指示文字列として、例えば 、コンテンツ提供者の社名等を登録しておき、ユーザから当該指示文字列の選択を 受け付けると、当該コンテンツ提供者のホームページを携帯電話 1で閲覧可能とする 利用方法について示している。しかし、本発明に係る情報検索システムの利用方法と しては、これに限定されるものではなぐ適宜変更が可能である。例えば、 DB45に登 録する指示文字列として、例えば、特定の人物の名前等の情報を登録すると共に、 当該指示文字列に応じた URLに対応するコンテンツとして、当該人物に関連する音 声データ (又は音声データ及び画像データ)を対応付けておき、ユーザから当該指 示文字列の選択を受け付けると、当該人物の肉声等を携帯電話 1で聴取可能とする ようにしても良い。
[0102] 図 17は、上記実施の形態の変形例に係るサーバの DB内に登録されるデータの一 例について説明するための図である。図 17においては、上述のように、 DB45に登 録する指示文字列として、特定の人物の名前が登録されると共に、当該指示文字列 に応じた URLには、当該人物に関連する音声データとして、当該人物の肉声に基づ く音声データのコンテンツが対応付けられるものとする。なお、図 17においては、図 4 に示すデータの一例に、これらのデータを追カ卩した場合について示している。
[0103] 例えば、指示文字列に登録される特定の人物の名前としては、例えば、政治家の 名前を登録することが考えられる。この場合、当該指示文字列に対応する URLには 、例えば、当該政治家の肉声に基づく演説内容に応じた音声データのコンテンツを 対応付けておくことが考えられる。図 17においては、この場合について示しており、 指示文字列に登録される特定の人物の名前に、政治家の名前が登録された場合に ついて示している。また、当該指示文字列に対応する URLには、当該政治家の肉声 に基づく演説内容に応じた音声データのコンテンツが対応付けられているものとする
[0104] 図 17に示すように、音声認識表記「山田太郎」は、特別音声認識表記として登録さ れており、発音記号列「YAMADATAROU」が対応付けられている。また、 URL「h ttp : //www. yamadataro. co. jp. html」、指示文字列「山田太郎」及び指示力 テゴリ「選挙区 A」が対応付けられている。同様に、音声認識表記「佐藤一郎」は、特 別音声認識表記として登録されており、発音記号列「SATOUICHIROU」が対応付 けられている。また、 URL「http: ZZwww. satoichiro. co. jp. html」、指示文字 列「佐藤一郎」及び指示カテゴリ「選挙区 B」が対応付けられている。さらに、音声認 識表記「加藤ニ郎」は、特別音声認識表記として登録されており、発音記号列「KAT OUJIROU」が対応付けられている。また、 URL「http : ZZwww. katojiro. co. jp . html」、指示文字列「加藤ニ郎」及び指示カテゴリ「選挙区 C」が対応付けられてい る。なお、指示カテゴリに登録されている「選挙区 A」、「選挙区 B」及び「選挙区 C」が 選択されると、当該選挙区に対応付けられた政治家の名前に応じた指示文字列に表 示が切り替えられる。
[0105] 例えば、図 9で説明した要領に従って、サーバ 4において生成された検索結果リスト の指示文字列に「山田太郎」が含まれて 、るものとする。このような検索結果リストが 携帯電話 1のディスプレイ 17上に表示された場合において、図 8で説明した要領に 従って、ユーザ力 Sこの指示文字列「山田太郎」を選択すると (ST811)、ブラウザが起 動された後、対応する URL「http : //www. yamadataro. co. jp. html」へのァ クセスが行われる(ST808、 ST809)。これにより、 WWWサーバ 5から携帯電話 1に 対して当該 URLに対応付けられた音声データ (演説内容に対応する音声データ)が 配信されるので、ユーザは、携帯電話 1でこの演説内容を聴取することが可能となる
[0106] このように、本実施の形態に係る情報検索システムを利用した場合には、ユーザは 、携帯電話 1に対して、音声により政治家の名前を入力するだけで、当該政治家の 名前に応じた指示文字列力 成る検索結果リストを受け取ることが可能となる。そして 、当該政治家の名前に応じた指示文字列を選択することで、当該政治家の肉声に基 づく演説内容に応じた音声データを聴取することが可能となる。
[0107] なお、ここでは、指示文字列として政治家の名前を登録し、この指示文字列が選択 されると、当該政治家の肉声に基づく演説内容に対応する音声データが携帯電話 1 に配信される場合について示している。しかし、指示文字列に登録されるに人物の名 前や、指示文字列の選択に応じて配信されるコンテンツとしては、これに限定される ものではなぐ適宜変更が可能である。例えば、指示文字列に著名な歌手等の名前 を登録し、当該指示文字列の選択に応じて当該歌手の楽曲やインタビュー内容に応 じた音声データを配信するようにしても良い。
[0108] また、ここでは、指示文字列に登録された人物に関連する音声データとして、当該 人物の肉声に基づく音声データを配信する場合について説明しているが、当該人物 に関連する音声データとしては、これに限定されるものではなぐ適宜変更が可能で ある。例えば、上述のように、指示文字列に政治家の名前が登録される場合には、当 該政治家を推薦する著名人 (例えば、当該政治家が所属する政党の党首等)による メッセージに対応する音声データであっても良い。すなわち、指示文字列に登録され た人物本人の肉声に基づく音声データに限らず、当該人物を推薦、紹介など、当該 人物に関連するあらゆる音声データに変更することが可能である。また、上述のよう に、指示文字列に歌手の名前が登録される場合、当該人物に関連する音声データ は、当該歌手のプロフィールや、楽曲の販売予定などの音声データであっても良い。
[0109] さらに、上記実施の形態においては、図 4に示すように、 DB45において、指示文 字列に対応する接続情報として URLが登録され、検索結果リストに表示される指示 文字列が選択されると、当該指示文字列に対応する URLにアクセスする場合につい て示している。しかし、 DB45に登録される接続情報としては、これに限定されるもの ではなぐ適宜変更することが可能である。例えば、 URLの代わりに電話番号を登録 し、検索結果リストに表示される指示文字列が選択されると、当該指示文字列に対応 する電話番号に発呼するようにしても良 ヽ。
[0110] 図 18は、上記実施の形態の変形例に係るサーバの DB内に登録されるデータの一 例について説明するための図である。なお、図 18においては、説明の便宜上、「UR Ljの代わりに登録された「電話番号」を除き、図 4で説明したデータを使用して ヽる。 図 4で示した同一のデータについては、その説明を省略するものとする。ここで、図 1 8に示すデータの内容について抜粋して説明する。
[0111] 図 18に示すように、音声認識表記「: BBB」の一方には、 URL「http : ZZwww. b bbpub. co. jp. html」の代わりに電話番号「03—XXXl—YYY2」が対応付けられ ている。また、音声認識表記「: BBB」の他方には、 URL「http : ZZwww. bbbrefor m. co. jp. html」の代わりに電話番号「03—XXXl—YYY3」が対応付けられてい る。さらに、音声認識表記「: BBB自動車」には、 URL Thttp : //www. bbb. co. jp . htmljの代わりに電話番号「03 -XXXI— YYY4」が対応付けられて!/、る。
[0112] 次に、このように変更した本情報検索システムにおいて情報検索を行う場合の動作 の概要について用いて説明する。図 19は、上記実施の形態の変形例に係る情報検 索システムにおいて情報検索を行う場合の動作の概要について説明するためのシ 一ケンス図である。図 20は、上記発明の実施の形態の変形例に係る情報検索システ ムで情報検索を行う場合における携帯電話の動作を説明するためのフロー図である 。なお、図 19において、図 7と同一の処理については同一の符号を付すものとし、そ の説明を省略する。また、図 20において、図 8と同一の処理については同一の符号 を付すものとし、その説明を省略する。
[0113] 図 19に示すように、本発明の実施の形態の変形例に係る情報検索システムにおい て情報検索を行う場合は、ユーザ力も指示文字列の選択を受け付けた後の処理に おいて、上記実施の形態に係る情報検索システムの処理と相違する。すなわち、図 7 においては、ユーザ力 指示文字列の選択を受け付けると、ブラウザを起動し、対応 する URLにアクセスする(ST709、 ST710)。これに対し、図 19においては、ユーザ から指示文字列の選択を受け付けると、当該指示文字列に対応する電話番号に発 呼する(ST1901)。
[0114] また、図 20に示すように、携帯電話 1においても、ユーザから指示文字列の選択を 受け付けた後の処理にお!、て、上記実施の形態に係る情報検索システムの処理と 相違する。すなわち、図 8においては、ユーザ力 指示文字列の選択を受け付けると 、ブラウザを起動し、対応する URLにアクセスする(ST808、 ST809)。これに対し、 図 20においては、ユーザ力も指示文字列の選択を受け付けた場合、制御部 11は、 当該指示文字列に対応する電話番号に発呼する(ST2001)。その後、当該発呼動 作の終了指示を操作入力部 15から受け付けると、制御部 11は、処理を終了する。
[0115] 例えば、指示文字列「BBB自動車」が含まれる検索結果リストが携帯電話 1のデイス プレイ 17に表示され (ST805)、ユーザから当該指示文字列「BBB自動車」を選択 する操作入力を受け付けた場合には (ST806)、携帯電話 1から当該指示文字列「B BB自動車」に対応付けられた電話番号「03— XXXI— YYY4」に発呼されることと なる(ST2001)。
[0116] このように、本実施の形態に係る情報検索システムを変形した場合には、ユーザは 、携帯電話 1に対して、音声による検索対象キーワードを入力するだけで、当該検索 対象キーワードに応じた指示文字列力 成る検索結果リストを受け取ることが可能と なる。そして、この検索結果リスト上の指示文字列を選択することで、情報提供元の電 話番号に発呼することが可能となる。
[0117] 本明糸田書 ίま、 2005年 10月 24曰出願の特願 2005— 308206に基づく。この内容 はすべてここに含めておく。
産業上の利用可能性
[0118] 以上説明したように、本発明に係る情報検索システム及びサーバ装置は、移動体 端末装置で受け付けた検索対象キーワードに応じた音声データをサーバ装置に送 信し、サーバ装置で音声データに対する音声認識を行って音声認識表記を取得し、 当該音声認識表記に対応付けられたコンテンツの URLカゝら成る検索結果リストを移 動体端末装置に送信することで、移動体端末装置で検索結果リストを表示するユー ザによる操作負担を軽減させつつ、迅速且つ適確にユーザの所望の情報を検索さ せるものであり、産業上の利用可能性を有する。

Claims

請求の範囲
[1] 音声による検索対象キーワードを受け付ける移動体端末装置と、インターネット上 のコンテンツの URL及び前記コンテンツの URLに対応付けられた音声認識表記が 登録されたデータベースを用いて情報検索を行うサーバ装置と、を具備する情報検 索システムであって、
前記移動体端末装置で受け付けた前記検索対象キーワードに応じた音声データ を前記サーバ装置に送信し、前記サーバ装置で前記音声データに対する音声認識 を行って前記音声認識表記を取得し、当該音声認識表記に対応付けられた前記コ ンテンッの URL力 成る検索結果リストを前記移動体端末装置に送信し、前記移動 体端末装置で前記検索結果リストを表示することを特徴とする情報検索システム。
[2] 前記データベースに、前記コンテンツの URLにリンクさせた指示文字列を更に登 録し、前記サーバ装置は、前記コンテンツの URLの代わりに前記指示文字列力 成 る前記検索結果リストを前記移動体端末装置に送信することを特徴とする請求項 1記 載の情報検索システム。
[3] 前記データベースに、前記コンテンツの内容に応じたカテゴリを示し前記検索結果 リスト上で関連する前記指示文字列に表示切替え可能に構成された指示カテゴリを 更に登録し、前記サーバ装置は、音声認識結果として得られる前記音声認識表記に 対応付けられた前記指示文字列及び指示カテゴリから成る前記検索結果リストを前 記移動体端末装置に送信することを特徴とする請求項 2記載の情報検索システム。
[4] 前記音声認識表記は、前記検索結果リストに前記指示カテゴリを表示させるための 一般音声認識表記と、前記検索結果リストに前記指示文字列を表示させるための特 別音声認識表記とを有することを特徴とする請求項 3記載の情報検索システム。
[5] 前記特別音声認識表記の登録内容を、コンテンツ提供者により指定可能としたこと を特徴とする請求項 4記載の情報検索システム。
[6] 前記特別音声認識表記の登録数を、前記コンテンツ提供者により指定可能としたこ とを特徴とする請求項 4又は請求項 5記載の情報検索システム。
[7] 前記特別音声認識表記の登録数に応じて、前記コンテンツ提供者に対する課金額 を増減させることを特徴とする請求項 6記載の情報検索システム。
[8] 前記検索結果リストに表示される前記指示文字列の表示順序に優先順位を設けた ことを特徴とする請求項 2から請求項 7のいずれかに記載の情報検索システム。
[9] 前記コンテンツ提供者に対する課金額に応じて、前記検索結果リストに表示される 前記指示文字列又は前記指示カテゴリから表示切替えされる前記指示文字列の表 示順序を決定することを特徴とする請求項 8記載の情報検索システム。
[10] 前記音声認識結果と一致する前記特別音声認識表記に対応する前記指示文字列 の表示順序を最上位にしたことを特徴とする請求項 8又は請求項 9記載の情報検索 システム。
[11] 前記一般音声認識表記又は特別音声認識表記に、前記移動体端末装置で実行 可能なアプリケーション名称を含むことを特徴とする請求項 1から請求項 10のいずれ 力 に記載の情報検索システム。
[12] 前記移動体端末装置で装置本体にインストール済みのアプリケーションを管理し、 前記音声認識結果として前記インストール済みのアプリケーション名称に対応する音 声認識表記が得られた場合には、当該アプリケーションを起動させることを特徴とす る請求項 11記載の情報検索システム。
[13] 前記移動体端末装置は、前記検索対象キーワードから抽出される特徴パラメータ を前記音声データとして前記サーバ装置に送信し、前記サーバ装置で前記特徴パラ メータに基づいて音声認識を行うことを特徴とする請求項 1から請求項 12のいずれか に記載の情報検索システム。
[14] 前記移動体端末装置は、前記検索結果リストにおける前記コンテンツの URL又は 指示文字列の選択操作に応じて当該コンテンツの URL又は指示文字列に対応付け られたコンテンツの提供を受けることを特徴とする請求項 1から請求項 13のいずれか に記載の情報検索システム。
[15] 前記移動体端末装置は、前記コンテンツの URL又は指示文字列に対応付けられ た画像データ力も成るコンテンツの提供を受けることを特徴とする請求項 14記載の 情報検索システム。
[16] 前記移動体端末装置は、前記コンテンツの URL又は指示文字列に対応付けられ た音声データ力も成るコンテンツの提供を受けることを特徴とする請求項 14又は請 求項 15記載の情報検索システム。
[17] 前記データベースに、特定の人物の情報を前記指示文字列として登録し、前記移 動体端末装置は、前記指示文字列に対応付けられた前記人物に関連する音声デー タカも成るコンテンツの提供を受けることを特徴とする請求項 16記載の情報検索シス テム。
[18] 前記移動体端末装置は、前記指示文字列に対応付けられた前記人物の肉声に基 づく音声データ力も成るコンテンツの提供を受けることを特徴とする請求項 17記載の 情報検索システム。
[19] 音声による検索対象キーワードを受け付ける移動体端末装置と、情報提供元の電 話番号及び前記情報提供元の電話番号に対応付けられた音声認識表記が登録さ れたデータベースを用いて情報検索を行うサーバ装置と、を具備する情報検索シス テムであって、
前記移動体端末装置で受け付けた前記検索対象キーワードに応じた音声データ を前記サーバ装置に送信し、前記サーバ装置で前記音声データに対する音声認識 を行って前記音声認識表記を取得し、当該音声認識表記に対応付けられた前記情 報提供元の電話番号から成る検索結果リストを前記移動体端末装置に送信し、前記 移動体端末装置で前記検索結果リストを表示することを特徴とする情報検索システム
[20] 前記データベースに、前記情報提供元の電話番号にリンクさせた指示文字列を更 に登録し、前記サーバ装置は、前記情報提供元の電話番号の代わりに前記指示文 字列から成る前記検索結果リストを前記移動体端末装置に送信することを特徴とする 請求項 19記載の情報検索システム。
[21] 前記移動体端末装置は、携帯電話装置であることを特徴とする請求項 1から請求 項 20の 、ずれかに記載の情報検索システム。
[22] 音声による検索対象キーワードを受け付ける端末装置と通信ネットワークを介して 接続され、インターネット上のコンテンツの URL及び前記コンテンツの URLに対応付 けられた音声認識表記が登録されたデータベースを用いて情報検索を行うサーバ装 置であって、 前記端末装置で受け付けた前記検索対象キーワードに応じた音声データを受信 する受信手段と、前記音声データに対する音声認識を行って前記音声認識表記を 取得する音声認識手段と、前記音声認識手段により取得される前記音声認識表記 に対応付けられた前記コンテンツの URL力 成る検索結果リストを生成する検索結 果リスト生成手段と、前記検索結果リストを前記端末装置に送信する送信手段と、を 具備することを特徴とするサーバ装置。
[23] 前記データベースに、前記コンテンツの URLにリンクさせた指示文字列を更に登 録し、前記検索結果リスト生成手段は、前記コンテンツの URLの代わりに前記指示 文字列から成る前記検索結果リストを生成することを特徴とする請求項 22記載のサ ーバ装置。
[24] 前記データベースに、前記コンテンツの内容に応じたカテゴリを示し前記検索結果 リスト上で関連する前記指示文字列に表示切替え可能に構成された指示カテゴリを 更に登録し、前記検索結果リスト生成手段は、前記音声認識手段による音声認識結 果として得られる前記音声認識表記に対応付けられた前記指示文字列及び指示力 テゴリから成る前記検索結果リストを生成することを特徴とする請求項 23記載のサー バ装置。
[25] 前記音声認識表記は、前記検索結果リストに前記指示カテゴリを表示させるための 一般音声認識表記と、前記検索結果リストに前記指示文字列を表示させるための特 別音声認識表記とを有することを特徴とする請求項 24記載のサーバ装置。
[26] 前記特別音声認識表記の登録内容を、コンテンツ提供者により指定可能としたこと を特徴とする請求項 25記載のサーバ装置。
[27] 前記特別音声認識表記の登録数を、前記コンテンツ提供者により指定可能としたこ とを特徴とする請求項 25又は請求項 26記載のサーバ装置。
[28] 前記特別音声認識表記の登録数に応じて、前記コンテンツ提供者に対する課金額 を増減させることを特徴とする請求項 27記載のサーバ装置。
[29] 前記検索結果リスト生成手段は、前記検索結果リストに表示される前記指示文字列 の表示順序に優先順位を設けたことを特徴とする請求項 23から請求項 28のいずれ かに記載のサーバ装置。
[30] 前記検索結果リスト生成手段は、前記コンテンツ提供者に対する課金額に応じて、 前記検索結果リストに表示される前記指示文字列又は前記指示カテゴリから表示切 替えされる前記指示文字列の表示順序を決定することを特徴とする請求項 29記載 のサーバ装置。
[31] 前記検索結果リスト生成手段は、前記音声認識結果と一致する前記特別音声認識 表記に対応する前記指示文字列の表示順序を最上位にしたことを特徴とする請求 項 29又は請求項 30記載のサーバ装置。
[32] 前記受信手段は、前記端末装置により前記検索対象キーワードから抽出される特 徴パラメータを前記音声データとして受信し、前記音声認識手段は、前記特徴パラメ ータに基づ 、て音声認識を行うことを特徴とする請求項 22から請求項 31の 、ずれか に記載のサーバ装置。
[33] 音声による検索対象キーワードを受け付ける端末装置と通信ネットワークを介して 接続され、情報提供元の電話番号及び前記情報提供元の電話番号に対応付けられ た音声認識表記が登録されたデータベースを用いて情報検索を行うサーバ装置で あって、
前記端末装置で受け付けた前記検索対象キーワードに応じた音声データを受信 する受信手段と、前記音声データに対する音声認識を行って前記音声認識表記を 取得する音声認識手段と、前記音声認識手段により取得される前記音声認識表記 に対応付けられた前記情報提供元の電話番号から成る検索結果リストを生成する検 索結果リスト生成手段と、前記検索結果リストを前記端末装置に送信する送信手段と 、を具備することを特徴とするサーバ装置。
[34] 前記データベースに、前記情報提供元の電話番号にリンクさせた指示文字列を更 に登録し、前記検索結果リスト生成手段は、前記情報提供元の電話番号の代わりに 前記指示文字列から成る前記検索結果リストを生成することを特徴とする請求項 33 記載のサーバ装置。
[35] 前記端末装置は、移動体端末装置であることを特徴とする請求項 22から請求項 34 の!、ずれかに記載のサーバ装置。
[36] 前記端末装置は、携帯電話装置であることを特徴とする請求項 22から請求項 35の ヽずれかに記載のサーバ装置。
PCT/JP2006/321085 2005-10-24 2006-10-23 情報検索システム及びサーバ装置 WO2007049569A1 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2005-308206 2005-10-24
JP2005308206A JP2009009170A (ja) 2005-10-24 2005-10-24 情報検索システム及びサーバ装置

Publications (1)

Publication Number Publication Date
WO2007049569A1 true WO2007049569A1 (ja) 2007-05-03

Family

ID=37967681

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2006/321085 WO2007049569A1 (ja) 2005-10-24 2006-10-23 情報検索システム及びサーバ装置

Country Status (2)

Country Link
JP (1) JP2009009170A (ja)
WO (1) WO2007049569A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014106927A1 (ja) * 2013-01-07 2014-07-10 日立マクセル株式会社 携帯端末装置及び情報処理システム

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5486947B2 (ja) * 2010-02-04 2014-05-07 アートサイド株式会社 情報提供方法及び情報表示方法
JP5463980B2 (ja) * 2010-03-15 2014-04-09 沖電気工業株式会社 連携サービス提供装置及びシステム
EP3125134B1 (en) * 2014-03-28 2018-08-15 Panasonic Intellectual Property Management Co., Ltd. Speech retrieval device, speech retrieval method, and display device
KR102472410B1 (ko) * 2016-01-21 2022-12-02 엔에이치엔클라우드 주식회사 셋톱박스의 어플리케이션 관리 방법 및 시스템
US11836165B2 (en) 2016-08-22 2023-12-05 Nec Corporation Information processing apparatus, control method, and program including display of prioritized information
US10229683B2 (en) * 2017-03-10 2019-03-12 Soundhound, Inc. Speech-enabled system with domain disambiguation
EP3673444A1 (en) * 2017-12-22 2020-07-01 Google LLC. Electronic list user interface

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001148814A (ja) * 1999-08-26 2001-05-29 Matsushita Electric Ind Co Ltd テレビジョン及びマルチメディアの検索及び要求に対して自然言語のモダリティーを可能にする汎用遠隔制御
JP2001222494A (ja) * 1999-12-01 2001-08-17 Asahi Kasei Corp 通信アドレス検索装置、システムおよびその方法
JP2002032384A (ja) * 2000-06-23 2002-01-31 Patrick Dolan Daniel 通信回線を用いた外国語情報発信システムおよび外国語情報発信方法
JP2002197120A (ja) * 2000-12-22 2002-07-12 Hypering Kk リンク関係決定方法およびサーバ装置
JP2003319085A (ja) * 2002-04-18 2003-11-07 Ntt Advanced Technology Corp 音声情報検索装置および音声情報検索方法
WO2004088540A1 (en) * 2003-04-03 2004-10-14 Nhn Corporation Method and system for generating a search result list based on local information
JP2004341971A (ja) * 2003-05-19 2004-12-02 Vodafone Kk 移動体通信端末、プログラム提供用サーバ及び移動体通信システム
JP2005025714A (ja) * 2003-07-01 2005-01-27 Yahoo Inc 少なくとも1つの検索リストに検索項目を配置するシステムおよび方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001148814A (ja) * 1999-08-26 2001-05-29 Matsushita Electric Ind Co Ltd テレビジョン及びマルチメディアの検索及び要求に対して自然言語のモダリティーを可能にする汎用遠隔制御
JP2001222494A (ja) * 1999-12-01 2001-08-17 Asahi Kasei Corp 通信アドレス検索装置、システムおよびその方法
JP2002032384A (ja) * 2000-06-23 2002-01-31 Patrick Dolan Daniel 通信回線を用いた外国語情報発信システムおよび外国語情報発信方法
JP2002197120A (ja) * 2000-12-22 2002-07-12 Hypering Kk リンク関係決定方法およびサーバ装置
JP2003319085A (ja) * 2002-04-18 2003-11-07 Ntt Advanced Technology Corp 音声情報検索装置および音声情報検索方法
WO2004088540A1 (en) * 2003-04-03 2004-10-14 Nhn Corporation Method and system for generating a search result list based on local information
JP2004341971A (ja) * 2003-05-19 2004-12-02 Vodafone Kk 移動体通信端末、プログラム提供用サーバ及び移動体通信システム
JP2005025714A (ja) * 2003-07-01 2005-01-27 Yahoo Inc 少なくとも1つの検索リストに検索項目を配置するシステムおよび方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014106927A1 (ja) * 2013-01-07 2014-07-10 日立マクセル株式会社 携帯端末装置及び情報処理システム
JP2014132396A (ja) * 2013-01-07 2014-07-17 Hitachi Consumer Electronics Co Ltd 携帯端末装置及び情報処理システム
US10303433B2 (en) 2013-01-07 2019-05-28 Maxell, Ltd. Portable terminal device and information processing system
US11487502B2 (en) 2013-01-07 2022-11-01 Maxell, Ltd. Portable terminal device and information processing system
US11861264B2 (en) 2013-01-07 2024-01-02 Maxell, Ltd. Portable terminal device and information processing system

Also Published As

Publication number Publication date
JP2009009170A (ja) 2009-01-15

Similar Documents

Publication Publication Date Title
US7519397B2 (en) System for downloading multimedia content and associated process
RU2355044C2 (ru) Последовательный мультимодальный ввод
WO2007049569A1 (ja) 情報検索システム及びサーバ装置
US8255154B2 (en) System, method, and computer program product for social networking utilizing a vehicular assembly
US20070079383A1 (en) System and Method for Providing Digital Content on Mobile Devices
US7143148B1 (en) Method and apparatus for accessing a wide area network
US8073590B1 (en) System, method, and computer program product for utilizing a communication channel of a mobile device by a vehicular assembly
CN100578614C (zh) 用语音应用语言标记执行的语义对象同步理解
JP3968277B2 (ja) メールサーバ、そのメールサーバを実現するためのプログラム及び携帯端末
CN100409700C (zh) 利用语音转文本辅助的多媒体和文本消息传送
US8131458B1 (en) System, method, and computer program product for instant messaging utilizing a vehicular assembly
CN101567186B (zh) 语音合成装置、方法、系统以及便携式信息终端
CN1617559B (zh) 顺序多模输入
US20090326953A1 (en) Method of accessing cultural resources or digital contents, such as text, video, audio and web pages by voice recognition with any type of programmable device without the use of the hands or any physical apparatus.
US20080221889A1 (en) Mobile content search environment speech processing facility
US20080221898A1 (en) Mobile navigation environment speech processing facility
JPH09321894A (ja) 情報処理装置
CN102096667A (zh) 一种信息检索方法及系统
US6732078B1 (en) Audio control method and audio controlled device
CN101945178A (zh) 一种新闻信息的查看方法、系统及移动终端
Pargellis et al. An automatic dialogue generation platform for personalized dialogue applications
JP3714159B2 (ja) ブラウザ搭載装置
US20090163188A1 (en) Method and system of providing an audio phone card
JP2002091473A (ja) 情報処理装置
JPH10322478A (ja) 音声によるハイパーテキストアクセス装置

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application
DPE1 Request for preliminary examination filed after expiration of 19th month from priority date (pct application filed from 20040101)
DPE1 Request for preliminary examination filed after expiration of 19th month from priority date (pct application filed from 20040101)
NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 06812145

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: JP

DPE1 Request for preliminary examination filed after expiration of 19th month from priority date (pct application filed from 20040101)