JP2003044756A - On-line shopping method, shopping site, voice recognizing device and voice recognition supporting device - Google Patents

On-line shopping method, shopping site, voice recognizing device and voice recognition supporting device

Info

Publication number
JP2003044756A
JP2003044756A JP2001226070A JP2001226070A JP2003044756A JP 2003044756 A JP2003044756 A JP 2003044756A JP 2001226070 A JP2001226070 A JP 2001226070A JP 2001226070 A JP2001226070 A JP 2001226070A JP 2003044756 A JP2003044756 A JP 2003044756A
Authority
JP
Japan
Prior art keywords
product
user
database
voice recognition
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001226070A
Other languages
Japanese (ja)
Inventor
Kenichi Omae
研一 大前
Akihiro Nakano
暁弘 中野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to JP2001226070A priority Critical patent/JP2003044756A/en
Publication of JP2003044756A publication Critical patent/JP2003044756A/en
Pending legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To provide an on-line shopping method capable of performing on-line shopping with verbal communication similar to over-the-counter sales by performing connection processing between a consumer browser terminal and an electronic commercial site server for providing merchandise. SOLUTION: A procedure word subjected to voice recognition by a user terminal is received via a communication network with respect to contents spoken by the user, a merchandise database is retrieved on the basis of the procedure word, merchandise retrieval results coinciding with this retrieval are referred to with the user terminal, merchandise subjected to voice recognition by the user terminal and designated among the merchandise retrieval results by the user is stored in a cart, and selling and buying are established on the basis of purchase intention display of the merchandise stored in the cart spoken by the user.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は、音声認識を利用し
たインターネット上のオンラインショッピングに用いて
好適なオンラインショッピング方法に関する。また本発
明は、音声認識を利用したショッピングサイトに関し、
特にユーザの立場から利用しやすいショッピングサイト
に関する。さらに、本発明は、音声認識を利用したショ
ッピングサイトに接続するユーザ端末や、ユーザからの
音声を音声情報のまま受信するショッピングサイトに用
いて好適な音声認識装置に関する。また本発明は、音声
認識を利用したショッピングサイトに用いて好適な音声
認識サポート装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an online shopping method suitable for online shopping on the Internet using voice recognition. The present invention also relates to a shopping site using voice recognition,
Particularly, it relates to a shopping site that is easy to use from the viewpoint of the user. Furthermore, the present invention relates to a voice recognition device suitable for use in a user terminal that connects to a shopping site that uses voice recognition and a shopping site that receives voice from the user as voice information. The present invention also relates to a voice recognition support device suitable for use in a shopping site using voice recognition.

【0002】[0002]

【従来の技術】従来、インターネットを利用してオンラ
インショッピングを行う場合、まず一般消費者宅からブ
ラウザ機能を有するパーソナルコンピュータを用いて、
電子商取引サイトにアクセスしてもらう。次に、電子商
取引サイトのウェブ(Web)ページ上の商品表示をマ
ウスにてクリックしてもらうと、商品表示のハイパーリ
ンク機能により商品購入申込み画面や商品検索画面に遷
移して、商品の選択や購入に必要とされる作業を行うこ
とが可能となる。この場合に、商品構成のカテゴリ分類
構造上の制限から、オンラインショッピングにて目的の
目的の商品に到達するには複数回のクリックを行う必要
があった。この事情は、商品配置の分からない新規の店
舗に消費者が来店して、目的とする商品の陳列棚に行く
のに消費者が右往左往するのと似ている。
2. Description of the Related Art Conventionally, when carrying out online shopping using the Internet, first, from a general consumer's house, a personal computer having a browser function is used.
Get access to an e-commerce site. Next, when the product display on the web (Web) page of the e-commerce site is clicked with the mouse, the product display hyperlink function causes a transition to the product purchase application screen or the product search screen for selecting products or It becomes possible to perform the work required for purchase. In this case, due to the restriction of the category classification structure of the product structure, it is necessary to perform a plurality of clicks in order to reach the desired product in the online shopping. This situation is similar to that when a consumer visits a new store whose product layout is unknown and goes to the display shelf of the desired product, the consumer goes around.

【0003】さらに留意すべき社会事情として、マウス
の操作はパソコンの操作に慣れている若年層には受容れ
やすいが、年配者には抵抗感が大きいということがあ
る。特に日本の場合は、欧米のようにタイプライタを使
う習慣が年配層になかったため、この傾向が大きい。他
方、日用品の販売において、年配層の購買力は若年層と
比較して格段に大きく、年配層に従来の対面販売に加え
て電子商取引に親しみを感じてもらうことが、電子商取
引の普及にとって不可欠である。
Further, as a social circumstance to be noted, the operation of a mouse is easily accepted by young people who are accustomed to the operation of a personal computer, but the elderly people feel a great deal of resistance. Especially in Japan, this tendency is large because the elderly people did not have the custom of using typewriters as in the West. On the other hand, in the sale of daily necessities, the purchasing power of the elderly is much larger than that of the younger generation, and it is indispensable for the spread of electronic commerce to make the elderly feel familiar with e-commerce in addition to the conventional face-to-face sales. is there.

【0004】そこで、消費者の使用するブラウザ端末に
音声認識のプログラムをインストールすれば、消費者は
マウスのクリックの代わりに音声を用いることができ、
年配者にとっても電子商取引に親しみを感じてもらえる
と電子商取引サイトの運営者は考えた。
Therefore, if a voice recognition program is installed in the browser terminal used by the consumer, the consumer can use the voice instead of clicking the mouse.
The e-commerce site operator thought that the elderly could feel familiar with e-commerce.

【0005】[0005]

【発明が解決しようとする課題】しかし、ブラウザに搭
載できる音声認識プログラムの機能は限られており、オ
ンラインショッピングのように多数の商品や日替わりの
商品に対して音声認識を行う必要のある用途では、消費
者の希望に添うレスポンスをブラウザ側で発揮する為に
は、ブラウザ側の辞書機能を随時更新する必要があり、
そのため辞書更新用の通信負荷が著しく増大するという
課題があった。即ち、音声だけでオンラインショッピン
グを完結させるためには、ブラウザ端末と電子商取引サ
イトサーバ側で扱う手続きワードを等値にしておく必要
があり、この等値化作業の負荷が大きいという課題があ
った。
However, the functions of the voice recognition program that can be installed in the browser are limited, and in applications such as online shopping that require voice recognition for a large number of products or daily products. , In order to show the response on the browser side according to the consumer's request, it is necessary to update the dictionary function on the browser side at any time,
Therefore, there is a problem that the communication load for updating the dictionary is significantly increased. That is, in order to complete online shopping with only voice, it is necessary to make the procedure words handled by the browser terminal and the electronic commerce site server side equal, which poses a problem that this equalization work is heavy. .

【0006】そこで、音声認識プログラムを電子商取引
サイトサーバ側に設定し、ブラウザ端末では消費者の発
語をデジタル化して、電子商取引サイトサーバ側で音声
認識を行うことが考えられる。しかし、この場合には、
ブラウザ端末と電子商取引サイトサーバ間で、大量のデ
ータの交換が必要となり、通信容量と通信速度の制限か
らレスポンスが悪くなるという課題があった。例えば、
静止衛星通信では通話遅れ時間が0.2秒であるが、こ
のような短時間でも通話者は遅いと感じる。また、通信
コストを低減させるために、VOIP(Voice Over Inte
rnet Protocol)を用いることも考えられるが、通信回線
が混雑していると、遅延時間が数秒となって、会話が成
立しなくなるという課題があった。
Therefore, it is conceivable that a voice recognition program is set on the electronic commerce site server side, the utterance of the consumer is digitized on the browser terminal, and the electronic commerce site server side performs voice recognition. But in this case,
There is a problem that a large amount of data needs to be exchanged between the browser terminal and the electronic commerce site server, and the response becomes poor due to the limitation of the communication capacity and the communication speed. For example,
In geostationary satellite communication, the call delay time is 0.2 seconds, but the caller feels slow even in such a short time. In addition, in order to reduce communication costs, VOIP (Voice Over Inte
Although it is possible to use the rnet Protocol), if the communication line is congested, the delay time becomes several seconds, and there is a problem that the conversation cannot be established.

【0007】本発明は上記の課題を解決するもので、第
1の目的は消費者のブラウザ端末と商品を提供する電子
商取引サイトサーバとの間で連携処理を行い、店頭販売
と同様な口頭でのやり取りでオンラインショッピングが
行えるオンラインショッピング方法及びショッピングサ
イトを提供することである。第2の目的は、消費者の発
語に対してブラウザ端末での音声認識が旨く行かない場
合に、消費者が音声認識の能力が著しく低いと感じるこ
となく、音声認識が正確に行われるのを担保する音声認
識装置を提供することである。第3の目的は、電子商取
引サイトサーバにおいて日々変更される商品構成に的確
に対応できるように音声認識の機能をグレードアップす
ることが容易に行える音声認識サポート装置を提供する
ことである。
The present invention solves the above problems, and a first object is to carry out a cooperative process between a consumer's browser terminal and an electronic commerce site server providing a product, and in the same oral manner as in the case of over-the-counter sales. It is to provide an online shopping method and a shopping site where online shopping can be performed by exchanging information. The second purpose is that when the voice recognition on the browser terminal does not work well for the utterance of the consumer, the voice recognition is accurately performed without the consumer feeling that the ability of the voice recognition is remarkably low. It is to provide a voice recognition device for ensuring the above. A third object is to provide a voice recognition support device in which the function of voice recognition can be easily upgraded so that the electronic commerce site server can appropriately cope with the product configuration that is changed daily.

【0008】[0008]

【課題を解決するための手段】第1の目的を達成する本
発明のオンラインショッピング方法は、図5に示すよう
に、ユーザにより発語された内容に対して、ユーザ端末
1により音声認識された手続きワードを通信網4経由で
受信し(S14)、前記手続きワードに基づいて商品デ
ータベースを検索して(S16)、当該検索に合致する
商品検索結果をユーザ端末1にて参照させ(S18)、
ユーザ端末1により音声認識された商品選択の意思表示
であって、商品検索結果の中から前記ユーザにより指定
された商品をカートに格納し(S20)、前記ユーザに
より発語された前記カートに収容された商品の購入意思
表示に基づいて売買を成立させる(S24)ことを特徴
とする。
In the online shopping method of the present invention for achieving the first object, as shown in FIG. 5, the content uttered by the user is recognized by the user terminal 1 by voice. The procedure word is received via the communication network 4 (S14), the product database is searched based on the procedure word (S16), and the product search result matching the search is referred to by the user terminal 1 (S18).
It is an intention to select a product that is voice-recognized by the user terminal 1, and the product specified by the user from the product search results is stored in the cart (S20) and stored in the cart uttered by the user. The sale is completed based on the displayed purchase intention display of the product (S24).

【0009】このような工程を有するオンラインショッ
ピング方法においては、ユーザの発語した内容は、ユー
ザ端末1により手続きワードとして音声認識され、ユー
ザ端末1によりショッピングサイト2へ送信される。シ
ョッピングサイト2では、手続きワードに従いデータベ
ースを検索して、当該検索に合致する商品検索結果をユ
ーザ端末1にて参照させる。次に、ユーザ端末1からカ
ートに格納されるべき商品が音声認識されてショッピン
グサイト2へ送信されるので、ショッピングサイト2で
は商品検索結果の中から前記ユーザにより指定された商
品をカートに格納する。そして、ユーザのカートに格納
された商品の購入意思表示がユーザ端末1からショッピ
ングサイト2へ送信されるので、ショッピングサイト2
では売買を成立させる。
In the online shopping method having such steps, the contents uttered by the user are recognized by the user terminal 1 as a procedure word and transmitted to the shopping site 2 by the user terminal 1. The shopping site 2 searches the database according to the procedure word and causes the user terminal 1 to refer to the product search result that matches the search. Next, since the product to be stored in the cart is voice-recognized from the user terminal 1 and transmitted to the shopping site 2, the shopping site 2 stores in the cart the product specified by the user from the product search results. . Then, since the purchase intention display of the product stored in the user's cart is transmitted from the user terminal 1 to the shopping site 2, the shopping site 2
Then the sale is completed.

【0010】第1の目的を達成する本発明のショッピン
グサイトは、図3に示すように、ユーザにより発語され
た内容に対して、ユーザ端末1により音声認識された手
続きワードを通信網4経由で受信する手続きワード受信
手段221と、前記手続きワードに基づいて商品データ
ベース23を検索する商品検索手段222と、当該検索
に合致する商品検索結果をユーザ端末1にて参照可能な
状態とする商品検索結果作成手段223と、前記商品検
索結果の中から前記ユーザにより発語して指定された商
品を、前記ユーザの指定に従いカートに格納するカート
格納手段224と、前記ユーザの商品の購入意思表示に
基づいて、前記カートに収容された商品の取引を履行さ
せる商品取引履行手段225とを備えるものである。
As shown in FIG. 3, the shopping site of the present invention that achieves the first object transmits the procedure word recognized by the user terminal 1 to the contents uttered by the user through the communication network 4. Received by the procedure word receiving means 221, a product search means 222 for searching the product database 23 based on the procedure word, and a product search for making the product search results matching the search available in the user terminal 1. The result creation unit 223, the cart storage unit 224 that stores the product designated by the user from the product search result in the cart according to the user's designation, and the user's intention to purchase the product. On the basis of the above, the commodity transaction execution means 225 for executing the transaction of the commodity accommodated in the cart is provided.

【0011】このように構成された装置においては、手
続きワード受信手段221により、ユーザにより発語さ
れた内容に対して、ユーザ端末1により音声認識された
手続きワードを通信網経由で受信する。次に、商品検索
手段222により手続きワード受信手段221にて受信
した手続きワードに基づいて商品データベース23を検
索し、商品検索結果作成手段223にて当該検索に合致
する商品検索結果をユーザ端末1にて参照可能な状態と
する。すると、ユーザにより商品検索結果の中からユー
ザの発語による商品の指定がなされるので、カート格納
手段224によりユーザの指定した商品をカートに格納
する。そして、ユーザによる購入したい商品の指定が一
段落すると、ユーザにより商品の購入意思表示がなされ
るので、商品取引履行手段225によりカートに収容さ
れた商品の取引を履行させる。
In the apparatus configured as described above, the procedure word receiving unit 221 receives the procedure word recognized by the user terminal 1 by voice with respect to the content uttered by the user via the communication network. Next, the product search unit 222 searches the product database 23 based on the procedure word received by the procedure word reception unit 221, and the product search result creation unit 223 sends the product search result matching the search to the user terminal 1. And refer to it. Then, the user specifies the product by the user's utterance from the product search results, and the cart storage unit 224 stores the product specified by the user in the cart. When the user finishes the specification of the product to be purchased, the user indicates the purchase intention of the product, and the product transaction execution means 225 executes the transaction of the product accommodated in the cart.

【0012】好ましくは、図2、図3、図4に示すよう
に、ユーザ端末1には音声認識用データベース18が備
えられており、ショッピングサイト2に設けられる商品
データベース23の更新情報を含む音声認識用共通デー
タベース33と、通信網4経由でショッピングサイト2
にアクセスしてきたユーザ端末1の音声認識用データベ
ース18の改定状態と、音声認識用共通データベース3
3の改定状態との差異を検出して、音声認識用共通デー
タベース33と同一の改定状態となるように音声認識用
データベース18の内容を更改する等値化手段322と
を備える構成とすると、ショッピングサイト2にて取扱
う商品に変更が生じたり、商品取引形態に変更が生じて
も、ユーザ端末1による音声認識機能は、音声サーバ3
の更新内容に即した最新のものとなる。
Preferably, as shown in FIG. 2, FIG. 3, and FIG. 4, the user terminal 1 is provided with a voice recognition database 18, and a voice containing update information of the product database 23 provided at the shopping site 2 is provided. Shopping site 2 via common database 33 for recognition and communication network 4
The revision state of the voice recognition database 18 of the user terminal 1 that has accessed the user terminal and the voice recognition common database 3
3 and the equalization means 322 which detects the difference from the revised state and updates the contents of the voice recognition database 18 so that the same state as the voice recognition common database 33 is obtained. Even if the product handled on the site 2 is changed or the product transaction form is changed, the voice recognition function of the user terminal 1 is not changed by the voice server 3
It will be the latest version according to the update contents of.

【0013】好ましくは、商品検索手段222は、前記
手続きワードが商品の普通名詞に代えてブランドである
場合に、前記ブランドの使用される商品の普通名詞とし
て商品データベース23を検索する構成とすると、ユー
ザが商品を購入する際の認知に対応した商品の検索が行
える。
Preferably, the product search means 222 is configured to search the product database 23 as a common noun of a product used by the brand when the procedure word is a brand instead of the common noun of the product. It is possible to search for a product corresponding to the recognition when the user purchases the product.

【0014】好ましくは、商品検索手段222は、前記
手続きワードで示される商品の普通名詞に対して、当該
商品に関連付けて使用される関連商品の普通名詞も含め
て商品データベース23を検索する構成とすると、ユー
ザが商品を購入する際に、商品に関連付けて使用される
関連商品も合せて商品検索結果に表示することで、ユー
ザの消費行動に適合した商品の検索が行える。
Preferably, the product search means 222 searches the product database 23 for the common noun of the product indicated by the procedure word, including the common noun of the related product used in association with the product. Then, when the user purchases the product, the related product used in association with the product is also displayed in the product search result, so that the product suitable for the consumption behavior of the user can be searched.

【0015】好ましくは、商品検索手段222は、前記
手続きワードが商品の有する属性を示す場合に、当該属
性を備える商品の普通名詞を中間検索ワードとして抽出
し、前記中間検索ワードにより商品データベース23を
検索する構成とすると、ユーザが商品の属性により商品
選択の基準としている場合の消費行動に適合する商品の
検索が行える。
Preferably, when the procedure word indicates an attribute of a product, the product search means 222 extracts a common noun of a product having the attribute as an intermediate search word, and uses the intermediate search word to search the product database 23. With the search configuration, it is possible to search for a product that matches the consumption behavior when the user uses the product attribute as a reference for product selection.

【0016】好ましくは、商品検索手段222は、前記
手続きワードが商品の有する複数の属性を示す属性用語
を含む手続き文である場合に、当該手続き文を構成する
属性用語を抽出し、前記抽出された複数の属性用語の属
性を備える商品の普通名詞を中間検索ワードとして抽出
し、前記中間検索ワード並びに前記抽出された複数の属
性用語により商品データベース23を検索する構成とす
ると、ユーザが商品を購入する際に、ユーザが店員に対
して話し掛けるような口調を用いて商品購入を行うこと
によって、購入したい商品の検索が行え、対面販売のよ
うな日常行われている商習慣に適合商品の検索が行え
る。
[0016] Preferably, when the procedure word is a procedural sentence including an attribute term indicating a plurality of attributes of a product, the merchandise retrieval unit 222 extracts the attribute term constituting the procedural sentence and extracts the attribute term. If a common noun of a product having attributes of a plurality of attribute terms is extracted as an intermediate search word and the intermediate product search word and the plurality of extracted attribute terms are used to search the product database 23, the user purchases the product. When you do so, you can search for the product you want to buy by purchasing the product using the tone that the user speaks to the clerk, and you can search for products that match the daily business practice such as face-to-face sales. You can do it.

【0017】好ましくは、商品検索結果作成手段223
では、商品検索手段222により検索された前記商品に
ついて、ブランド名毎に区分して前記商品検索結果に含
ませる構成とすると、ユーザがブランド名を商品選択の
基準としている場合の消費行動に適合する商品検索結果
が作成される
Preferably, the product search result creating means 223
If the products searched by the product search unit 222 are classified according to brand name and included in the product search result, the user's consumption behavior is appropriate when the brand name is used as a criterion for product selection. Product search results are created

【0018】好ましくは、商品取引履行手段225は、
前記カートに収容された商品の購入意思表示がユーザ端
末の音声認識により行われた履歴を残す構成とすると、
ユーザとショッピングサイト2との間で商取引の齟齬が
あった場合の事後的な解決が円滑に行える。
[0018] Preferably, the commodity transaction fulfilling means 225 is
If the purchase intention display of the products accommodated in the cart is recorded by the voice recognition of the user terminal,
If there is a discrepancy in the commercial transaction between the user and the shopping site 2, it is possible to smoothly carry out the subsequent solution.

【0019】第2の目的を達成する本発明の音声認識装
置は、図2に示すように、ショッピングサイト2にアク
セスして、ユーザにより発語された内容に対して音声認
識された手続きワードを送信して、商品の購入を進める
ショッピングサイト用のユーザ端末1に用いられる音声
認識装置において、ユーザの発語した音声を音声認識す
るために、予め登録された前記ユーザの音響モデルデー
タベース17と、前記ユーザの発語した音声を入力し、
音響モデルデータベース17を参照して前記ユーザの発
語した音声の認識一致率を算定する音声認識一致率算定
手段151と、前記算定された音声の認識一致率が予め
定められた閾値よりも低いときは、前記ユーザに対して
再度の発語を促す聞返し手段152とを備える構成とし
ている。
As shown in FIG. 2, the voice recognition device of the present invention which achieves the second object accesses the shopping site 2 and outputs the procedure word recognized by voice to the contents uttered by the user. In the voice recognition device used in the user terminal 1 for the shopping site that transmits and advances the purchase of products, in order to recognize the voice uttered by the user, the acoustic model database 17 of the user registered in advance, Input the voice spoken by the user,
When the voice recognition matching rate calculating means 151 for calculating the recognition matching rate of the voice uttered by the user with reference to the acoustic model database 17, and the calculated recognition matching rate of the voice is lower than a predetermined threshold value. Includes a reply means 152 for prompting the user to speak again.

【0020】好ましくは、図2に示すように、音声認識
一致率算定手段により算定された音声の認識一致率が予
め定められた閾値よりも低いときは、前記算定された音
声の認識一致率が相対的に高く音声認識された手続きワ
ードを複数候補として提示する複数候補呈示部153を
備える構成とすると、ユーザに対して再度の発語をする
場合の指標となる手続きワードがユーザ端末1に表示さ
れ、ユーザの発語内容を適切に案内できる。
Preferably, as shown in FIG. 2, when the voice recognition matching rate calculated by the voice recognition matching rate calculating means is lower than a predetermined threshold value, the calculated voice recognition matching rate is When the configuration is provided with the multiple candidate presenting unit 153 that presents the relatively high speech-recognized procedure words as a plurality of candidates, the procedure word that serves as an index when the user speaks again is displayed on the user terminal 1. The user's utterance content can be appropriately guided.

【0021】第3の目的を達成する本発明の音声認識サ
ポート装置は、ユーザ端末1により音声認識された手続
きワードを通信網4経由で受信し、前記手続きワードに
基づいて商品データベースを検索して当該検索に合致す
る商品検索結果を作成し、前記ユーザの商品の購入意思
表示に基づいて、前記商品検索結果に含まれる商品の取
引を履行させるショッピングサイト2に対して、ユーザ
端末1による音声認識をサポートする音声認識サポート
装置であって、ショッピングサイト2毎に設けられる音
声認識用共通データベース33を管理する手段を備える
構成としている。
The voice recognition support device of the present invention which achieves the third object receives the procedure word recognized by the user terminal 1 through the communication network 4 and searches the product database based on the procedure word. Voice recognition by the user terminal 1 to the shopping site 2 that creates a product search result that matches the search, and executes the transaction of the product included in the product search result based on the user's intention to purchase the product. Is a voice recognition support device, which is configured to include means for managing the voice recognition common database 33 provided for each shopping site 2.

【0022】本発明の音声認識サポート装置を用いるこ
とにより、ショッピングサイト2の運営者は、新商品の
追加や死に筋商品の削除を音声認識用共通データベース
33にて行い、請求項3に記載の等値化手段によりユー
ザ端末1の音声認識用共通データベース18を音声認識
用共通データベース33の最新内容に更改することがで
きる。そこで、各ショッピングサイト2では新商品の追
加や死に筋商品の削除をいちいちユーザに通知すること
なく、音声認識用共通データベース18を更新すること
が可能となるだけでなく、手続きワードを複数の商品に
連結させることによりクロスセリングにもつなげること
も可能となる。
By using the voice recognition support device of the present invention, the operator of the shopping site 2 adds a new product or deletes a dead product in the voice recognition common database 33. The equalizing means can update the voice recognition common database 18 of the user terminal 1 to the latest contents of the voice recognition common database 33. Therefore, in each shopping site 2, it is possible not only to update the common database 18 for voice recognition without notifying the user of addition of new products or deletion of muscle products, but also to add a procedure word to a plurality of products. It is also possible to connect to cross-selling by connecting to.

【0023】[0023]

【発明の実施の形態】以下、本発明の実施の形態につい
て、図面を参照して説明する。なお、各図において互い
に同一あるいは相当する部材には同一符号または類似符
号を付し、重複した説明は省略する。図1は、本発明の
一実施の形態を示す構成ブロック図である。図におい
て、ユーザ端末1、ショッピングサイトサーバ2、並び
に音声サーバ3はインターネット4を介して接続され
る。ユーザ端末1はブラウザ機能と音声認識機能を有す
るもので、例えばパソコンや情報携帯端末、インターネ
ット接続機能を有する携帯電話機等が用いられる。ショ
ッピングサイトサーバ2や音声サーバ3には、例えばミ
ニコン、オフコン、サーバーのような高速情報処理能力
のあるコンピュータが用いられる。
BEST MODE FOR CARRYING OUT THE INVENTION Embodiments of the present invention will be described below with reference to the drawings. In each drawing, the same or corresponding members are designated by the same reference numerals or similar reference numerals, and redundant description will be omitted. FIG. 1 is a configuration block diagram showing an embodiment of the present invention. In the figure, a user terminal 1, a shopping site server 2, and a voice server 3 are connected via the Internet 4. The user terminal 1 has a browser function and a voice recognition function, and for example, a personal computer, a portable information terminal, a mobile phone having an Internet connection function, or the like is used. For the shopping site server 2 and the voice server 3, computers having high-speed information processing capability such as minicomputers, office computers, and servers are used.

【0024】通信網としてのインターネット4は通信プ
ロトコルとしてHTTP(Hyper Text Transfer Protoco
l)やWAP(Wireless Application Protocol)を用い、
通信情報がHTML(Hyper Text Markup Language)、X
ML(eXtensible Markup Language)、WML(Wireless
Markup Language)のような言語で記載されたウェブペー
ジ情報を伝送するもので、通信回線としては光ファイバ
通信回線、銅線を用いた有線回線、移動体通信用の無線
回線などがある。また、通信情報が動画コンテンツのフ
ァイルの場合は、例えばMPEG(Moving Picture Expe
rt Group)方式で圧縮されている。移動体通信用のイン
ターネット用の通信には、IMT(International Mobil
e Telecommunication)2000、CDMA(Code Division M
ultipleAccess)等のディジタル通信用の規格に準拠する
送受信機能をユーザ端末1に設ける。
The Internet 4 as a communication network uses HTTP (Hyper Text Transfer Protocol) as a communication protocol.
l) and WAP (Wireless Application Protocol)
Communication information is HTML (Hyper Text Markup Language), X
ML (eXtensible Markup Language), WML (Wireless
Markup Language) for transmitting web page information described in a language such as an optical fiber communication line, a wired line using copper wire, and a wireless line for mobile communication. When the communication information is a moving image content file, for example, MPEG (Moving Picture Expe
rt Group) method. IMT (International Mobil) is used for internet communication for mobile communication.
e Telecommunication) 2000, CDMA (Code Division M
The user terminal 1 is provided with a transmission / reception function conforming to the standard for digital communication such as ultimate access).

【0025】図2は、ユーザ端末の構成ブロック図であ
る。ユーザ端末1は音声入力部11、音響分析部12、
表示部13、ネットワークカード部14、認識デコーダ
部15、ブラウザ制御部16、音響モデルデータベース
17、並びに音声認識用データベース18を備えてい
る。音声入力部11は、マイク等を利用してユーザの声
を音響分析部12へ引き渡す機器である。音響分析部1
2は、人の発語した音声(アナログ音声)の符号化、ノ
イズ処理、補正等を行い、その特徴パラメータを抽出す
るものである。表示部13は、ショッピングサイトサー
バ2からのWebデータを表示するもので、例えばCR
Tや液晶ディスプレイが用いられる。ネットワークカー
ド部14は、インターネット4等を通じてデータを送受
信するための通信インターフェース機器である。
FIG. 2 is a block diagram showing the configuration of the user terminal. The user terminal 1 includes a voice input unit 11, an acoustic analysis unit 12,
The display unit 13, the network card unit 14, the recognition decoder unit 15, the browser control unit 16, the acoustic model database 17, and the voice recognition database 18 are provided. The voice input unit 11 is a device that delivers a user's voice to the acoustic analysis unit 12 using a microphone or the like. Acoustic analysis unit 1
Reference numeral 2 is for extracting a characteristic parameter by performing coding, noise processing, correction, etc. of a voice (analog voice) spoken by a person. The display unit 13 displays Web data from the shopping site server 2, for example, CR
A T or liquid crystal display is used. The network card unit 14 is a communication interface device for transmitting / receiving data via the Internet 4 or the like.

【0026】認識デコーダ部15は、音響分析部12に
より抽出された特徴パラメータから発語された単語列を
認識するもので、音声認識一致率算定手段151、聞返
し手段152並びに複数候補呈示部153を有してい
る。音声認識一致率算定手段151は、ユーザの発語し
た音声を入力し、音響モデルデータベース17を参照し
てユーザの発語した音声の認識一致率を算定する。聞返
し手段152は、算定された音声の認識一致率が予め定
められた閾値よりも低いときは、ユーザに対して再度の
発語を促すもので、促す表示はユーザ端末1の音響機能
による音声表示でもよく、またユーザ端末1の表示機能
を用いた文字図形表示でも良い。複数候補呈示部153
は、音声認識一致率算定手段151にて、ユーザの発語
した音声の認識一致率が予め定められた閾値よりも低い
が、音声の認識一致率が高い音声認識されたときの手続
きワードと近似している場合は、手続きワードを複数の
候補として提示する。なお、認識デコーダ部15では、
単語列認識の際には、音響モデルデータベース17や音
声認識用データベース18等を使用して認識率を高める
構成とするとよい。
The recognition decoder unit 15 recognizes a word string uttered from the characteristic parameters extracted by the acoustic analysis unit 12, and has a speech recognition matching rate calculation unit 151, a listening unit 152, and a plurality of candidate presentation units 153. have. The voice recognition coincidence rate calculating unit 151 inputs the voice uttered by the user and refers to the acoustic model database 17 to calculate the recognition coincidence rate of the voice uttered by the user. When the calculated voice recognition concordance rate is lower than a predetermined threshold, the listening unit 152 prompts the user to speak again, and the prompt is displayed by the audio function of the user terminal 1. It may be displayed, or may be a character graphic display using the display function of the user terminal 1. Multiple candidate presentation unit 153
Is similar to the procedure word at the time of speech recognition in which the speech recognition coincidence rate calculation unit 151 has a speech recognition coincidence rate of a user's speech lower than a predetermined threshold, but a speech recognition coincidence rate is high. If so, present the procedure word as a plurality of candidates. In the recognition decoder unit 15,
When recognizing a word string, the acoustic model database 17 and the voice recognition database 18 may be used to increase the recognition rate.

【0027】ブラウザ制御部16は、認識デコーダ部1
5にて音声認識された単語に準拠して、ショッピングサ
イトサーバ2の商品を検索、ショッピングカート25へ
の追加や購入決定するためのプログラムを起動するため
の手段である。音響モデルデータベース17は、入力さ
れた特徴パラメータがどの音素であるかの確率を計算す
るためのモデルを記憶するデータベースで、ユーザの音
声言語特性を反映してある。音声認識用データベース1
8は、辞書データベース182並びにグラマデータベー
ス184を備えているもので、音声サーバ3の音声認識
用共通データベース33の内容をマスタファイルとする
ものである。辞書データベース182は、単語を記憶す
るデータベースで、ここではショッピングサイトサーバ
2で取り扱う商品の名称並びに検索に便利な用語が充実
している。グラマデータベース184は、入力された特
徴パラメータがどの単語であるかの確率を計算するため
のモデルを記憶するデータベースで、認識率を高めてい
る。
The browser control unit 16 includes the recognition decoder unit 1
5, a means for activating a program for searching for a product in the shopping site server 2, adding it to the shopping cart 25, and making a purchase decision according to the word recognized by voice. The acoustic model database 17 is a database that stores a model for calculating the probability of which phoneme the input characteristic parameter is, and reflects the speech language characteristics of the user. Speech recognition database 1
Reference numeral 8 is provided with a dictionary database 182 and a grammar database 184, and uses the contents of the voice recognition common database 33 of the voice server 3 as a master file. The dictionary database 182 is a database that stores words. Here, the names of products handled by the shopping site server 2 and terms that are convenient for searching are enriched. The grammar database 184 is a database that stores a model for calculating the probability of which word the input characteristic parameter is, and has a high recognition rate.

【0028】図3は、ショッピングサイトサーバの構成
ブロック図である。ショッピングサイトサーバ2は、ネ
ットワークカード部21、ウェブ制御部22、商品デー
タベース23、注文データベース24、ショッピングカ
ート25並びにログファイル26を備えている。ネット
ワークカード部21は、インターネット4等を通じてデ
ータを送受信するための通信インターフェース機器であ
る。ウェブ制御部22は、ユーザ端末1から要求された
商品の検索、ショッピングカート25への追加や購入決
定のプログラムを実行する手段で、手続きワード受信手
段221、商品検索手段222、商品検索結果作成手段
223、カート格納手段224並びに商品取引履行手段
225を有している。
FIG. 3 is a block diagram of the shopping site server. The shopping site server 2 includes a network card unit 21, a web control unit 22, a product database 23, an order database 24, a shopping cart 25, and a log file 26. The network card unit 21 is a communication interface device for transmitting / receiving data via the Internet 4 or the like. The web control unit 22 is a means for executing a program for searching for a product requested from the user terminal 1, adding it to the shopping cart 25, and making a purchase decision, and is a procedure word receiving unit 221, a product search unit 222, and a product search result creating unit. 223, a cart storage means 224, and a commodity transaction fulfillment means 225.

【0029】手続きワード受信手段221は、ユーザに
より発語された内容に対して、ユーザ端末1により音声
認識された手続きワードを通信網4経由で受信する。商
品検索手段222は、手続きワードに基づいて商品デー
タベース23を検索する。商品検索結果作成手段223
は、商品検索手段222での検索に合致する商品検索結
果をユーザ端末1にて参照可能な状態とする。カート格
納手段224は、商品検索結果の中からユーザにより発
語して指定された商品を、ユーザの指定に従いショッピ
ングカート25に格納する。商品取引履行手段225
は、ユーザの商品の購入意思表示に基づいて、ショッピ
ングカート25に収容された商品の取引を履行させる。
商品データベース23は、商品の情報を記憶しておくデ
ータベースである。注文データベース24は、購入する
商品を一時的に保持するためと、購入決定後の商品デー
タを記憶するデータベースである。
The procedure word receiving unit 221 receives, via the communication network 4, the procedure word recognized by the user terminal 1 by voice with respect to the content uttered by the user. The product search unit 222 searches the product database 23 based on the procedure word. Product search result creation means 223
Makes the product search results that match the search by the product search means 222 available for reference on the user terminal 1. The cart storage unit 224 stores the product designated by the user from the product search result in the shopping cart 25 according to the user's designation. Commodity transaction fulfillment means 225
Executes the transaction of the product accommodated in the shopping cart 25 based on the user's intention to purchase the product.
The product database 23 is a database that stores product information. The order database 24 is a database for temporarily holding the product to be purchased and storing the product data after the purchase decision.

【0030】ショッピングカート25は、ユーザがショ
ッピングサイトサーバ2にて購入する商品を一時記憶す
るファイルで、購入契約が成立して運送と対価の支払い
が終了するまで記憶される。ログファイル26は、商品
検索手段222での検索結果、カート格納手段224で
ショッピングカート25に格納された商品、並びに商品
取引履行手段225の商品取引履歴を保存するもので、
保存する内容は例えば辞書データベース332の更新に
必要な項目とするとよく、保存する期間は適宜の間、例
えば商品のライフサイクルや商取引の通常の決済に必要
とされる期間とするとよい。
The shopping cart 25 is a file for temporarily storing the product purchased by the user at the shopping site server 2, and is stored until the purchase contract is established and the transportation and payment of the price are completed. The log file 26 stores the search results of the product search unit 222, the products stored in the shopping cart 25 by the cart storage unit 224, and the product transaction history of the product transaction fulfillment unit 225.
The contents to be stored may be, for example, items necessary for updating the dictionary database 332, and the storage period may be an appropriate period, for example, a period required for a product life cycle or a normal settlement of commercial transactions.

【0031】図4は、音声サーバの構成ブロック図であ
る。音声サーバ3は、ネットワークカード部31、音声
システム管理部32、音声認識用共通データベース33
並びにサイト情報データベース34を備えている。ネッ
トワークカード部31は、インターネット4等を通じて
データを送受信するための通信インターフェース機器で
ある。音声システム管理部32は、等値化手段322と
しての機能を有するもので、ユーザ端末1に設定されて
いる辞書データベース182やグラマデータベース18
4の内容が最新であるかをチェックして、最新でない時
には辞書データベース182やグラマデータベース18
4の内容を最新データに等値化するために、ユーザ端末
1に音声認識用共通データベース33の最新データをダ
ウンロードするものである。
FIG. 4 is a block diagram of the configuration of the voice server. The voice server 3 includes a network card unit 31, a voice system management unit 32, and a voice recognition common database 33.
In addition, the site information database 34 is provided. The network card unit 31 is a communication interface device for transmitting / receiving data via the Internet 4 or the like. The voice system management unit 32 has a function as the equalization unit 322, and is a dictionary database 182 or a grammar database 18 set in the user terminal 1.
Check whether the contents of 4 are the latest, and if they are not the latest, dictionary database 182 or grammar database 18
In order to equalize the contents of 4 into the latest data, the latest data of the voice recognition common database 33 is downloaded to the user terminal 1.

【0032】音声認識用共通データベース33は、辞書
データベース332とグラマデータベース334とを有
している。辞書データベース332は、単語を記憶する
データベースで、各ユーザ端末1に設定されている辞書
データベース182のマスタとなる内容を記憶してい
る。グラマデータベース334は、入力された特徴パラ
メータがどの単語であるかの確率を計算するためのモデ
ルを記憶するデータベースで、各ユーザ端末1に設定さ
れているグラマデータベース184のマスタとなる内容
を記憶している。サイト情報データベース34は、ショ
ッピングサイトサーバ2と辞書データベース182、3
32やグラマデータベース184、334の内容及びバ
ージョンの関連付けを管理するデータベースである。
The common database 33 for voice recognition has a dictionary database 332 and a grammar database 334. The dictionary database 332 is a database that stores words, and stores the content that serves as the master of the dictionary database 182 set in each user terminal 1. The grammar database 334 is a database that stores a model for calculating the probability of which word the input characteristic parameter is, and stores the content that will be the master of the grammar database 184 set in each user terminal 1. ing. The site information database 34 includes the shopping site server 2 and the dictionary databases 182, 3
32 and a grammar database 184, 334 is a database that manages the association of contents and versions.

【0033】次に本実施形態の動作について説明する。
図5はユーザ端末によるショッピングサイトでの商品購
入を説明する流れ図である。まず、ショッピングサイト
サーバ2は、ユーザ端末1のログイン等の形式によりア
クセスを受ける(S10)。すると、ショッピングサイ
トサーバ2は、音声サーバ3の音声システム管理部32
により、ユーザ端末1の音声認識用データベース18の
内容を音声認識用共通データベース33の最新データと
等値化するように管理をしている(S12)。そして、
音声認識用データベース18の内容が古い発行日の音声
認識用共通データベース33の内容であれば、音声認識
用共通データベース33の最新データをダウンロードし
て音声認識用データベース18の内容を更新する。
Next, the operation of this embodiment will be described.
FIG. 5 is a flow chart for explaining the purchase of products on the shopping site by the user terminal. First, the shopping site server 2 receives access in the form of login of the user terminal 1 or the like (S10). Then, the shopping site server 2 receives the voice system management unit 32 of the voice server 3.
Thus, the contents of the voice recognition database 18 of the user terminal 1 are managed so as to be equalized with the latest data of the voice recognition common database 33 (S12). And
If the content of the voice recognition database 18 is the content of the voice recognition common database 33 of the old issue date, the latest data of the voice recognition common database 33 is downloaded and the content of the voice recognition database 18 is updated.

【0034】次に、ユーザはショッピングサイトサーバ
2からユーザ端末1に呈示される商品検索ページを視聴
して、手続きワードを発語する。すると、ユーザ端末1
の認識デコーダ部15により、発語された手続きワード
が音声認識される。ショッピングサイトサーバ2は、ユ
ーザ端末1から送信された手続きワードを通信網4経由
で受信し(S14)、受信した手続きワードに基づいて
商品データベース23を検索して(S16)、当該検索
に合致する商品検索結果をユーザ端末1にて参照させる
(S18)。すると、ユーザはユーザ端末1に表示され
た商品検索結果を視聴して、購入したい商品の指定を発
語する。この指定には、番号、商品の普通名称、産地
名、ブランド等がある。するとユーザ端末1により商品
選択の意思表示が音声認識され、ショッピングサイトサ
ーバ2に送信される。すると、ユーザ端末1から受信し
た商品選択の意思表示に従い、ショッピングサイトサー
バ2は、商品検索結果の中からユーザにより指定された
商品をショッピングカート25に格納する(S20)。
ユーザは購入したい商品がある場合は(S22)、引き
続いて手続きワードを発語するので、ショッピングサイ
トサーバ2はS14に戻って処理する。
Next, the user views the product search page presented on the user terminal 1 from the shopping site server 2 and utters a procedure word. Then, the user terminal 1
The uttered procedure word is recognized by the recognition decoder unit 15. The shopping site server 2 receives the procedure word transmitted from the user terminal 1 via the communication network 4 (S14), searches the product database 23 based on the received procedure word (S16), and matches the search. The product search result is referred to by the user terminal 1 (S18). Then, the user views the product search result displayed on the user terminal 1 and utters the designation of the product to be purchased. The designation includes a number, a common name of a product, a place of origin, a brand, and the like. Then, the user terminal 1 voice-recognizes the intention to select the product and transmits it to the shopping site server 2. Then, according to the product selection intention received from the user terminal 1, the shopping site server 2 stores the product specified by the user from the product search results in the shopping cart 25 (S20).
If the user has an item to purchase (S22), the user subsequently utters a procedure word, so the shopping site server 2 returns to S14 and processes it.

【0035】他方、ユーザが購入したい商品の全てをシ
ョッピングカート25に格納し終わると(S22)、シ
ョッピングサイトサーバ2ではショッピングカート25
に収容された商品に対して、ユーザの購入意思表示に基
づいて売買を成立させ、履行段階に移行する(S2
4)。売買の成立とは、例えば対価の受け渡し方法を定
めると共に、商品の配送に必要な情報をショッピングサ
イトサーバ2に連絡することである。対価の受け渡し方
法には、クレジットカードによる決済、デービッドカー
ドによる決済、宅急便(登録商標)や郵便局による代引
きサービス、銀行振込、郵便振替、郵便書留等がある。
商品の配送に必要な情報には、配送場所、配送日時、配
送形態等が含まれる。
On the other hand, when all the products that the user wants to purchase have been stored in the shopping cart 25 (S22), the shopping site server 2 uses the shopping cart 25.
Based on the user's intention to purchase, the sale and sale of the products accommodated in the store are completed, and the stage of fulfillment is entered (S2).
4). The establishment of a sale means, for example, determining a delivery method of the price and notifying the shopping site server 2 of information necessary for delivering the product. Payment methods include payment by credit card, payment by David card, cash on delivery service by TA-Q-BIN (registered trademark) and post office, bank transfer, postal transfer, and registered mail.
The information necessary for delivering the product includes a delivery place, delivery date and time, delivery form, and the like.

【0036】図6はユーザによる発語がユーザ端末によ
って有効に音声認識される状態に移行する為の、ユーザ
端末、ショッピングサイトサーバ、音声サーバ間の処理
を説明する流れ図である。ユーザはユーザ端末1から音
声によるオンラインショッピングに対応したショッピン
グサイトサーバ2へアクセスを行い、あるショッピング
サイトAのページAの表示要求をする(S100)。ユ
ーザ端末1からの接続要求を受けたショッピングサイト
サーバ2は、ショッピングサイトA用の音声認識用共通
データベース33に基づくページAをユーザ端末1に表
示させる(S101)。
FIG. 6 is a flow chart for explaining the process between the user terminal, the shopping site server, and the voice server for shifting the state in which the user's utterance is effectively voice-recognized by the user terminal. The user accesses the shopping site server 2 corresponding to online shopping by voice from the user terminal 1 and requests display of page A of a certain shopping site A (S100). Upon receiving the connection request from the user terminal 1, the shopping site server 2 causes the user terminal 1 to display page A based on the voice recognition common database 33 for the shopping site A (S101).

【0037】ページAには、ユーザ端末1の音声認識用
データベース18が最新であるかを確認して、音声サー
バ3に格納されているショッピングサイトA用の音声認
識用共通データベース33の最新内容と等値化させるの
に必要な機能が、例えばエージェント機能により実現さ
れている。そこで、音声認識用データベース18の構成
要素、例えばショッピングサイトA用の辞書データベー
ス182がユーザ端末に存在しているか確認し(S10
2)、存在していない場合は音声サーバ3に対する辞書
データベース332のダウンロード要求をする(S10
4)。ユーザ端末1のショッピングサイトA用の辞書デ
ータベース182が最新バージョンと一致していない場
合も(S103)、音声サーバ3に対する辞書データベ
ース332のダウンロード要求をする(S104)。こ
れに対して、音声サーバ3からユーザ端末1に対して最
新バージョンの辞書データベース332がダウンロード
される(S105)。そして、ユーザ端末1のショッピ
ングサイトA用の辞書データベース182が最新バージ
ョンと一致している状態となると、ユーザ端末1による
ユーザの音声認識が開始される(S106)。
On page A, it is confirmed whether the voice recognition database 18 of the user terminal 1 is the latest, and the latest contents of the voice recognition common database 33 for the shopping site A stored in the voice server 3 are stored. The function required for equalization is realized by, for example, an agent function. Therefore, it is confirmed whether a constituent element of the voice recognition database 18, for example, the dictionary database 182 for the shopping site A exists in the user terminal (S10).
2) If it does not exist, it requests the voice server 3 to download the dictionary database 332 (S10).
4). Even when the dictionary database 182 for the shopping site A of the user terminal 1 does not match the latest version (S103), a request for downloading the dictionary database 332 to the voice server 3 is made (S104). On the other hand, the latest version of the dictionary database 332 is downloaded from the voice server 3 to the user terminal 1 (S105). Then, when the dictionary database 182 for the shopping site A of the user terminal 1 is brought into a state of matching with the latest version, the voice recognition of the user by the user terminal 1 is started (S106).

【0038】もし、ユーザ端末1がショッピングサイト
AではなくショッピングサイトBにアクセスする場合に
も、S100〜S106と同様な手順S110〜S11
6によって、ユーザ端末1のショッピングサイトB用の
辞書データベース182が最新バージョンと一致してい
る状態とする。このようにショッピングサイトA、Bの
別によって異なる辞書データベース182、さらに必要
な場合にはグラマデータベース184を設けているの
は、店舗の種類によって手続きワードが大きく異なるた
めである。例えば、ショッピングサイトAが生鮮食料品
であれば肉、魚、野菜などに特有の用語や言回しがあ
り、ショッピングサイトBが酒店であれば日本酒、ビー
ル、ワイン等に応じた特有の用語や言回しがある為であ
る。
If the user terminal 1 accesses the shopping site B instead of the shopping site A, steps S110 to S11 similar to steps S100 to S106.
6, the dictionary database 182 for the shopping site B of the user terminal 1 is brought into a state of matching with the latest version. The dictionary database 182, which differs depending on the shopping sites A and B, and the grammar database 184, if necessary, are provided because the procedure words vary greatly depending on the type of store. For example, if the shopping site A is a perishable food, there are words and phrases specific to meat, fish, vegetables, etc. If the shopping site B is a liquor store, words and phrases specific to sake, beer, wine, etc. Because there is turning.

【0039】図7は手続きワードの種類を説明する図で
ある。手続きワードは、辞書データベース182、33
2に格納されるもので、商品検索用、ショッピングカー
トの操作用等の種類がある。商品検索用には商品の属性
を表すもの、例えば商品の属性には商品の特性、用途、
商品名、商品カテゴリ等がある。商品の特性には、食料
品の場合には甘い、塩味等があり、衣料品の場合には夏
物、冬物等がある。商品の用途には、贈答用や自家用の
区別があり、食料品であればアレルギー体質用、幼児
用、シニア用、ダイエット用、スポーツ選手用などがあ
る。商品名には、製造者、販売者、普通名称、ブランド
等の商品の品質や顧客訴求力に関する重要な情報が含ま
れる。ショッピングカートの操作用には、カート上のよ
うな表示操作や商品削除のような語句が含まれる。
FIG. 7 is a diagram for explaining the types of procedure words. The procedure word is the dictionary database 182, 33.
It is stored in No. 2, and there are types such as for product search and shopping cart operation. For product search, the attributes of the product are shown.
There are product names, product categories, and so on. The characteristics of the product include sweetness and saltiness in the case of food, and summer and winter in the case of clothing. There are distinctive uses for products such as gifts and personal use, and food products include allergies, infants, seniors, diets, and athletes. The product name includes important information about product quality and customer appeal such as manufacturer, seller, common name and brand. For the operation of the shopping cart, a display operation such as on the cart and a phrase such as product deletion are included.

【0040】図8はユーザが商品の検索を行う時の流れ
図である。ユーザはマイク等を通じて、目的とする具体
的な商品名、色、イメージするキーワード等の手続きワ
ードを発語する(S121)。すると、ユーザ端末1で
は、音響分析部12や認識デコーダ部15が有効に作用
して、ユーザの音声を認識する(S122)。そして、
ユーザ端末1にて音声認識された商品検索用の手続きワ
ードがショッピングサイトサーバ2に送信される(S1
23)。ショッピングサイトサーバ2では、手続きワー
ド並びに手続きワードに関連する中間検索ワードをもと
に商品データベース23を検索し(S124)、商品検
索結果をユーザ端末1へ返送する(S125)。する
と、ユーザ端末1では商品検索結果のリスト表示を行い
(S126)、ユーザの商品選択を容易にする。
FIG. 8 is a flow chart when the user searches for a product. The user utters a procedure word such as a specific product name, color, or keyword to be imaged through a microphone or the like (S121). Then, in the user terminal 1, the acoustic analysis unit 12 and the recognition decoder unit 15 effectively act to recognize the user's voice (S122). And
The procedure word for product search, which is voice-recognized by the user terminal 1, is transmitted to the shopping site server 2 (S1).
23). The shopping site server 2 searches the product database 23 based on the procedure word and the intermediate search word related to the procedure word (S124), and returns the product search result to the user terminal 1 (S125). Then, the user terminal 1 displays a list of product search results (S126) to facilitate the user's product selection.

【0041】図9はユーザが商品検索結果を用いて商品
選択を行う時の流れ図である。ユーザは、ユーザ端末1
に表示される商品検索結果のリスト表示をみて、購入し
たい商品を選択して、ショッピングカート25に格納さ
せて行く。この場合、接続しているショッピングサイト
2用の辞書データベース182に格納された手続きワー
ド(例えば表示されている商品の番号や個数)に従っ
て、ユーザが発語するとユーザ端末1とショッピングサ
イト2間でユーザの商品購入の意思表示が円滑に処理さ
れる。例として、ユーザが赤ワインを3本ショッピング
カート25に追加する場合を取り上げる。ユーザが「赤
ワインを3本」と発語すると(S131)、ユーザ端末
1では認識デコーダ部15によりユーザの発語した手続
きワードを認識する(S132)。そして、ユーザ端末
1にて音声認識された商品入力用の商品名がショッピン
グサイトサーバ2に送信される(S133)。ショッピ
ングサイトサーバ2では送信された商品名をショッピン
グカート25へ追加する(S134)。ショッピングカ
ート25の情報はショッピングサイトサーバ2でユーザ
毎に管理されている。
FIG. 9 is a flow chart when the user selects a product by using the product search result. The user is the user terminal 1
Looking at the list display of the product search results displayed in, the product to be purchased is selected and stored in the shopping cart 25. In this case, according to the procedure word stored in the dictionary database 182 for the connected shopping site 2 (for example, the number or the number of the displayed product), the user utters the message between the user terminal 1 and the shopping site 2. Indication of intention to purchase goods is processed smoothly. As an example, consider a case where a user adds three red wines to the shopping cart 25. When the user utters "3 bottles of red wine" (S131), the recognition decoder unit 15 of the user terminal 1 recognizes the procedure word uttered by the user (S132). Then, the product name for product input, which is voice-recognized by the user terminal 1, is transmitted to the shopping site server 2 (S133). The shopping site server 2 adds the transmitted product name to the shopping cart 25 (S134). The information on the shopping cart 25 is managed by the shopping site server 2 for each user.

【0042】図10はユーザが商品の購入を行う時の流
れ図である。購入を行う場合も辞書データベース182
に格納された手続きワードに従って発語すると、処理が
円滑に行われる。例えば、ユーザが「注文決定」と発語
すると(S141)、ユーザ端末1では、音響分析部1
2や認識デコーダ部15が有効に作用して、ユーザの音
声を認識する(S142)。そして、ユーザ端末1にて
音声認識された商品購入の意思表示が、ショッピングサ
イトサーバ2に送信される(S143)。ショッピング
サイトサーバ2では、商品購入の意思表示にそって注文
データを作成し(S144)、作成した注文データをユ
ーザ端末1に返信して、ユーザの確認を可能とする(S
145)。
FIG. 10 is a flow chart when the user purchases a product. Dictionary database 182 even when making a purchase
Speaking in accordance with the procedure word stored in, the processing is smoothly performed. For example, when the user utters "Order decision" (S141), the acoustic analysis unit 1 is used in the user terminal 1.
2 and the recognition decoder unit 15 effectively operate to recognize the user's voice (S142). Then, the intention to purchase the product, which is voice-recognized by the user terminal 1, is transmitted to the shopping site server 2 (S143). The shopping site server 2 creates order data in accordance with the intention to purchase the product (S144), and returns the created order data to the user terminal 1 to enable the user's confirmation (S).
145).

【0043】そして、再度ユーザが「注文決定」と発語
すると(S146)、ユーザ端末1ではユーザの音声を
認識して(S147)、購入確認の意思表示を認識す
る。購入確認の意思表示は、ユーザ端末1からショッピ
ングサイトサーバ2に送信される(S148)。ショッ
ピングサイトサーバ2では、受信した購入確認の意思表
示に基づいて、注文データとして注文データベース24
に蓄積する(S149)。なお図10では、ショッピン
グサイトサーバ2経由にて再確認を行う例を示したが、
ユーザ端末1側にて購入のための手続きワードが発語さ
れた時点で、再度購入確認を行っても良い。
When the user utters "Order decision" again (S146), the user terminal 1 recognizes the user's voice (S147) and recognizes the purchase confirmation intention. The purchase confirmation intention is transmitted from the user terminal 1 to the shopping site server 2 (S148). The shopping site server 2 stores the order database 24 as order data based on the received intention to confirm the purchase.
(S149). Although FIG. 10 shows an example in which reconfirmation is performed via the shopping site server 2,
The purchase confirmation may be performed again when the procedure word for purchase is uttered on the user terminal 1 side.

【0044】図11は音声認識処理を説明する流れ図で
ある。ユーザがマイク等を通して音声入力部11にて発
語する(S201)。すると、音響分析部12により、
ユーザが発語した音声の符号化、ノイズ処理、補正等が
行われ、その特徴パラメータが抽出される(S20
2)。抽出された特徴パラメータに対して、音響モデル
データベース17、辞書データベース182並びにグラ
マデータベース184を参酌して(S204)、認識デ
コーダ部15により発語された単語列が認識される(S
203)。このとき、例えば色、サイズ、産地等の複数
の手続きワードが辞書データベース182並びにグラマ
データベース184から抽出されるため、ユーザが発語
する順序を意識する必要がない。
FIG. 11 is a flow chart for explaining the voice recognition processing. The user speaks at the voice input unit 11 through a microphone or the like (S201). Then, by the acoustic analysis unit 12,
The speech uttered by the user is subjected to encoding, noise processing, correction, etc., and its characteristic parameters are extracted (S20).
2). The acoustic model database 17, the dictionary database 182, and the grammar database 184 are taken into consideration for the extracted characteristic parameters (S204), and the word string uttered by the recognition decoder unit 15 is recognized (S).
203). At this time, a plurality of procedural words such as color, size, and place of production are extracted from the dictionary database 182 and the grammar database 184, so that it is not necessary for the user to be aware of the order in which they speak.

【0045】認識デコーダ部15によるデコード結果が
正常である場合は(S205)、認識された単語列を用
いてイベントが起動される(S208)。他方、デコー
ド結果がNGの場合(S205)、辞書データベース1
82並びにグラマデータベース184から類推される単
語列を候補としてユーザに提示する(S206)。ユー
ザは単語列の候補の中から該当する単語列があるか判断
し、該当する単語列があればそれを選択すると(S20
7)、イベントが起動される(S208)。該当する単
語列がなければ(S207)、S201に戻ってもう一
度、音声入力を実施する。ここで、イベントの起動には
商品の検索、商品のカート格納、商品の購入等が含まれ
る。
When the decoding result by the recognition decoder unit 15 is normal (S205), the event is activated using the recognized word string (S208). On the other hand, when the decoding result is NG (S205), the dictionary database 1
82 and the word string inferred from the grammar database 184 are presented to the user as candidates (S206). The user determines whether there is a corresponding word string from the word string candidates, and if there is a corresponding word string, selects it (S20).
7) The event is activated (S208). If there is no corresponding word string (S207), the process returns to S201 to perform voice input again. Here, the activation of an event includes searching for products, storing products in a cart, purchasing products, and the like.

【0046】図12はユーザが音声ショッピングを行っ
たことの履歴を残すための流れ図である。音声ショッピ
ングには、商品の検索、入力(ショッピングカートへ追
加)、商品購入のプロセスが存在することは、既に図5
乃至図11を用いて説明した通りである。この場合、音
声ショッピングの各プロセスにおいてユーザのとった行
動を履歴として採取しておいて、ショッピングサイト2
をユーザのニーズに適合するように改良して行くことが
望ましく、例えば辞書データベース332のメンテナン
スを実施し、検索を効率の高いものに維持する。具体的
には、次のようになる。
FIG. 12 is a flow chart for leaving a history that the user has performed voice shopping. It has already been shown in FIG. 5 that voice shopping has processes of product search, input (add to shopping cart), and product purchase.
This is as described with reference to FIGS. In this case, the actions taken by the user in each process of voice shopping are collected as a history, and the shopping site 2
Should be improved to meet the needs of the user, for example, maintenance of the dictionary database 332 should be carried out to keep the search efficient. Specifically, it is as follows.

【0047】:商品の検索時には、ユーザが発語した
手続きワードをユーザ端末1にて認識し(S251、S
252)、ショッピングサイトサーバ2側に送信する
(S253)。ショッピングサイトサーバ2側では、送信
された手続きワードをログファイル26に記録して、商
品検索の履歴として残す(S254)。 :商品のカート格納時には、ユーザが発語した手続き
ワードをユーザ端末1にて認識し(S251、S25
2)、ショッピングサイトサーバ2側に送信する(S2
53)。ショッピングサイトサーバ2側では、送信され
た手続きワードをログファイル26に記録して、ショッ
ピングカート25に格納された商品名を履歴として残
す。 :商品の購入時には、ユーザが発語した手続きワード
をユーザ端末1にて認識し(S251、S252)、シ
ョッピングサイトサーバ2側に送信する(S253)。シ
ョッピングサイトサーバ2側では、送信された手続きワ
ードをログファイル26に記録して、商品購入に関する
ユーザの意思決定の履歴として残す。
At the time of searching for products, the procedure word uttered by the user is recognized by the user terminal 1 (S251, S
252), and sends it to the shopping site server 2 side
(S253). The shopping site server 2 side records the transmitted procedure word in the log file 26 and leaves it as a history of product search (S254). : When the product is stored in the cart, the procedure word spoken by the user is recognized by the user terminal 1 (S251, S25).
2), send to the shopping site server 2 side (S2
53). On the shopping site server 2 side, the transmitted procedure word is recorded in the log file 26, and the product name stored in the shopping cart 25 is left as a history. : When purchasing a product, the procedure word uttered by the user is recognized by the user terminal 1 (S251, S252) and transmitted to the shopping site server 2 side (S253). On the shopping site server 2 side, the transmitted procedure word is recorded in the log file 26 and left as a history of the user's decision-making regarding product purchase.

【0048】図13はショッピングサイトがユーザ端末
に表示するウェブページの一例を示す画面図である。シ
ョッピングサイト画面100は、サイトマップの概略表
示としてショッピング欄102、コミュニティ欄10
4、バンキング欄106並びにスケジュール欄108を
備えている。ショッピングサイト画面100は、さらに
注文方法選択欄110、注文内容確認欄120、会員登
録欄130、商品見本表示欄140、商品詳細説明欄1
50、商品在庫表示欄160、ショッピングカート欄1
70並びに音声入力案内表示部180を備えている。
FIG. 13 is a screen view showing an example of a web page displayed on the user terminal by the shopping site. The shopping site screen 100 includes a shopping field 102 and a community field 10 as a schematic display of a site map.
4. A banking column 106 and a schedule column 108 are provided. The shopping site screen 100 further includes an order method selection field 110, an order content confirmation field 120, a member registration field 130, a product sample display field 140, and a product detailed description field 1
50, product inventory display field 160, shopping cart field 1
70 and a voice input guidance display unit 180.

【0049】注文方法選択欄110には、カタログ注文
欄112、お買得品注文欄113、商品検索注文欄11
4、購入実績商品からの注文欄115、おすすめレシピ
からの注文欄116を備えている。商品検索注文欄11
4には、検索する態様の詳細として、ジャンルから探す
場合、あいうえお順で探す場合、手続きワードで探す場
合を用意している。会員登録欄130には、会員規約説
明欄132、ショッピングメンバ登録欄134、メンバ
登録の変更欄136、ショッピングメンバの停止・退会
欄138を備えている。
The order method selection field 110 includes a catalog order field 112, a bargain product order field 113, and a product search order field 11
4. It has an order column 115 for the purchased actual products and an order column 116 for the recommended recipe. Product search order column 11
As the details of the search mode, there are prepared in 4 a case of searching by genre, a case of AIUEO, and a case of searching by procedure word. The member registration column 130 includes a member agreement explanation column 132, a shopping member registration column 134, a member registration change column 136, and a shopping member suspension / withdrawal column 138.

【0050】商品見本表示欄140には、例えばユーザ
が商品検索注文欄114にて検索した商品の見本が写真
や動画などで説明される。商品詳細説明欄150には商
品見本表示欄140に表示した商品の詳細、例えば商品
が洋服の場合には商品名、金額、サイズ、色、数量が表
示される。商品在庫表示欄160は商品見本表示欄14
0に表示した商品の在庫状態を表示するもので、洋服の
場合にはフリース、ラムウール、エアチックジャケッ
ト、ハンドニット等の種類毎に、在庫数量が表示され
る。好ましくは、在庫商品の番号毎に色やサイズも表示
すると、商品見本表示欄140に表示した商品との対応
関係が明確となり、商品を購入するユーザばかりでなく
店舗管理にも役立つ。
In the product sample display field 140, for example, a sample of the product searched by the user in the product search order field 114 is explained with a photograph or a moving image. In the product detail description field 150, details of the product displayed in the product sample display field 140, for example, when the product is clothes, the product name, price, size, color, and quantity are displayed. The product inventory display field 160 is the product sample display field 14
This indicates the stock status of the product displayed at 0. In the case of clothes, the stock quantity is displayed for each type such as fleece, lambswool, aeric jacket, and hand knit. Preferably, if the color and size are displayed for each number of the stocked product, the correspondence with the product displayed in the product sample display field 140 becomes clear, which is useful not only for the user who purchases the product but also for store management.

【0051】ショッピングカート欄170には、購入予
約商品表示欄172、購入金額表示欄174、注文決定
欄176が設けられている。購入予約商品表示欄172
には、購入予約商品の単価、数量、規格サイズ、金額が
表示されると共に、削除によって予約の取消しにも対処
できるようにしている。購入金額表示欄174には、購
入予約商品表示欄172に登録された購入予約商品の合
計金額が表示されると共に、配送料についても案内が表
示される。注文決定欄176をユーザが操作すると、購
入予約商品表示欄172に登録された購入予約商品の注
文がユーザ端末1からショッピングサイトサーバ2に送
信される。音声入力案内表示部180は、キーボードや
マウスに代えて音声でも入力できることをユーザに知ら
せるもので、併せて音声入力に対して多義的な解釈が可
能であるためショッピングサイトサーバ2側でユーザの
意思が確認できない場合に、ユーザの意思確認を取るの
に必要な表示を行う。
The shopping cart column 170 is provided with a purchase reservation item display column 172, a purchase price display column 174, and an order determination column 176. Purchase reserved product display field 172
Displays the unit price, quantity, standard size, and price of the reserved product for purchase, and also enables cancellation of the reservation by deleting it. In the purchase price display field 174, the total price of the purchase reservation products registered in the purchase reservation product display field 172 is displayed, and a guide is also displayed regarding the delivery charge. When the user operates the order determination field 176, the order for the purchase reserved product registered in the purchase reserved product display field 172 is transmitted from the user terminal 1 to the shopping site server 2. The voice input guidance display unit 180 informs the user that voice can be input instead of the keyboard and mouse. In addition, since the voice input can be ambiguously interpreted, the shopping site server 2 side makes the user's intention. When is not confirmed, the display necessary for confirming the user's intention is displayed.

【0052】ショッピングサイト画面100は、音声を
用いたオンラインショッピングを行うためのシステムで
あるため、食料品、衣類、家電等あらゆる商品に適用す
ることが可能である。まず、ショッピングサイトサーバ
2上のショッピングサイトの運営者は、音声サーバ3の
運営者と契約を結び、該当サイトの辞書データベース3
32やグラマデータベース334の作成を依頼する。こ
のときに、例えば「甘いワイン」や「魚料理にあうワイ
ン」などの特定商品について消費者が知りたいと考える
嗜好や用途に関する抽象的な手続きワードを、特定の商
品と結びつけておくことによりユーザの利便性を最大に
することも可能である。
Since the shopping site screen 100 is a system for online shopping using voice, it can be applied to all kinds of products such as groceries, clothes and home appliances. First, the operator of the shopping site on the shopping site server 2 makes a contract with the operator of the voice server 3, and the dictionary database 3 of the relevant site is entered.
32 and the creation of the grammar database 334 are requested. At this time, for example, by connecting an abstract procedure word related to a preference or purpose that the consumer wants to know about a specific product such as “sweet wine” or “a wine suitable for fish dishes” with the specific product, It is also possible to maximize the convenience of.

【0053】図14は検索結果を購入希望商品としてリ
スト表示する一例を示す画面図で、ここでは検索結果表
示欄190とショッピングカート欄170を表示してあ
る。検索結果は、例えばユーザが商品検索注文欄114
に検索条件を入力した商品名に対するものである。ユー
ザがユーザ端末1に対して「甘い赤ワイン」と発語す
る、ショッピングサイトサーバ2は商品データベース2
3を検索して、該当する銘柄のワインリストを金額と共
に検索結果表示欄190に表示する。
FIG. 14 is a screen view showing an example in which the search results are displayed as a list of desired products for purchase. Here, a search result display field 190 and a shopping cart field 170 are displayed. The search result is, for example, the item search order column 114 by the user.
It is for the product name for which the search condition is entered. The user speaks “sweet red wine” to the user terminal 1, and the shopping site server 2 is the product database 2
3 is displayed, and the wine list of the corresponding brand is displayed in the search result display field 190 together with the price.

【0054】図15は消費者が購入予約した商品をショ
ッピングカートに明認表示する一例を示す画面図であ
る。ユーザが検索結果表示欄190の表示を見て、「3
番を2本」と発語すると、ショッピングカート25には
ワインリストに3番として表示された銘柄の商品「甘い
赤ワインC」が指定数量だけ追加される。
FIG. 15 is a screen view showing an example in which the product for which the consumer has made a purchase reservation is displayed on the shopping cart. When the user looks at the display of the search result display field 190, “3
When the user speaks "No. 2", the designated quantity of the product "Sweet Red Wine C" of the brand displayed as No. 3 in the wine list is added to the shopping cart 25.

【0055】図16は購入確認画面の一例を示す図であ
る。ユーザがショッピングカート欄170の注文決定欄
176、若しくは「注文決定」と発語すると、このユー
ザの意思表示がユーザ端末1からショッピングサイトサ
ーバ2に送信される。すると、ショッピングカート欄1
70上に、購入確認画面178が表示される。ここで、
ユーザが「注文決定」と再度発語することで注文が確定
し、一連の購入プロセスが完了する。
FIG. 16 is a diagram showing an example of the purchase confirmation screen. When the user utters the order decision field 176 of the shopping cart field 170 or “Order decision”, the user's intention is transmitted from the user terminal 1 to the shopping site server 2. Then, shopping cart column 1
A purchase confirmation screen 178 is displayed on the screen 70. here,
When the user utters "order decision" again, the order is confirmed and the series of purchase process is completed.

【0056】図17は認識デコーダ部における同音異義
語の問合せ機能を説明する画面図である。日本語におい
ては、母音の数が他の外国語に比較して少ないため、同
音異義語の問合せ機能を充実させる必要がある。同音異
義語の例として、ユーザが「さけ」という手続きワード
を発語したとする。すると、音声入力案内表示部180
の噴出し欄186にて『「飲む酒」か「魚の鮭」か』を
ユーザに問い直すと共に、音声認識表示欄187に問合
せ内容を簡便に表示する。また、音声入力様式表示欄1
85にて発語内容の様式を表示している。声で注文表示
欄188においては、ユーザに音声入力による商品注文
が可能であることを告知している。
FIG. 17 is a screen view for explaining the function of inquiring homonyms in the recognition decoder section. Since the number of vowels in Japanese is smaller than that in other foreign languages, it is necessary to enhance the function for inquiring homonyms. As an example of the homonyms, it is assumed that the user utters a procedure word “Sasuke”. Then, the voice input guidance display unit 180
In the squirt column 186, the user is asked again "whether it is" drinking sake "or" fish salmon "", and the inquiry contents are simply displayed in the voice recognition display column 187. Also, the voice input style display field 1
At 85, the style of the utterance content is displayed. In the order display field 188 by voice, the user is notified that the product can be ordered by voice input.

【0057】次に、商品検索機能の詳細を説明する。商
品検索機能は、図8のS124における商品検索機能並
び図13の商品検索注文欄114に関連するもので、ブ
ラウザ制御部16、ウェブ制御部22並びに商品データ
ベース23の有機的な連携関係を示している。商品検索
機能には、中間検索ワードとして、複合手続きワード検
索機能、異種カテゴリー検索機能、抽象語手続きワード
の検索機能を設けると、利便性が増す。例えば、複合手
続きワードを用いた商品検索機能を用いると、単なる単
語に比較してより自然な会話に近いものであり、消費者
にとって馴染みやすい。複合手続きワードの例として、
ユーザが「フルジップの赤Mサイズ」と発語すると、図
13のように目的の商品が商品見本表示欄140や商品
詳細説明欄150に直ちに表示される。
Next, the details of the product search function will be described. The product search function is related to the product search function in S124 of FIG. 8 and the product search order column 114 of FIG. 13, and shows an organic cooperative relationship between the browser control unit 16, the web control unit 22, and the product database 23. There is. If the product search function is provided with a compound procedure word search function, a heterogeneous category search function, and an abstract word procedure word search function as intermediate search words, convenience is increased. For example, if a product search function using a compound procedure word is used, it is closer to a natural conversation than a mere word, and is easily familiar to consumers. As an example of a compound procedure word,
When the user says "Full Zip Red M size", the target product is immediately displayed in the product sample display field 140 or the product detail description field 150 as shown in FIG.

【0058】図18は異種カテゴリーの検索機能を説明
する画面図である。異なるカテゴリーの検索例として、
ユーザが「なべ料理」のような用途に関する手続きワー
ドを発語する。すると、音声認識表示欄187に認識し
た単語や文章を表示する。そして、音声認識した手続き
ワードを用いて商品データベース23を検索して、検索
結果表示欄190に検索された商品が表示される。表示
される商品検索結果は、複数のカテゴリーから関連する
アイテムの一覧で、例えば「なべ料理」に対して食材と
しての白菜、つみれ、チキンボール、おでん、ちくわに
加えて、調理用器具の消耗品である卓上コンロ用ボンベ
等が表示される。食材と調理用器具の消耗品とは異なる
カテゴリーの商品であるが、ユーザの便宜を考慮して検
索結果表示欄190に表示している。
FIG. 18 is a screen view for explaining the search function for different categories. As an example of searching for different categories,
The user utters a procedural word for a purpose such as "nabe cooking". Then, the recognized word or sentence is displayed in the voice recognition display field 187. Then, the product database 23 is searched using the procedure word recognized by voice, and the searched product is displayed in the search result display field 190. The displayed product search results are a list of related items from multiple categories. For example, in addition to Chinese cabbage, pickles, chicken balls, oden, chikuwa as ingredients for "nabe dishes," consumables for cooking utensils. A cylinder for a tabletop stove is displayed. Although they are products in different categories from consumables such as food and cooking utensils, they are displayed in the search result display field 190 in consideration of user convenience.

【0059】図19は抽象語手続きワードの検索機能を
説明する画面図である。音声操作説明欄200には、音
声認識表示欄202が設けられている。抽象語手続きワ
ードの例として、ユーザが自然食品を扱うサイトで「甘
い」と発語すると、音声認識表示欄202に音声認識結
果として「甘い」が表示される。そして、音声認識した
手続きワードを用いて商品データベース23を検索し
て、検索結果表示欄190に検索された商品が表示され
る。即ち、検索結果表示欄190にはジャム、ショート
ケーキ、アイスクリーム、あんぱん、ジュースのよう
な、抽象語手続きワード「甘い」に関連する商品の一覧
を表示する。
FIG. 19 is a screen diagram for explaining the abstract word procedure word search function. A voice recognition display column 202 is provided in the voice operation explanation column 200. As an example of the abstract word procedural word, when the user speaks “sweet” at a site that deals with natural food, “sweet” is displayed in the voice recognition display field 202 as a voice recognition result. Then, the product database 23 is searched using the procedure word recognized by voice, and the searched product is displayed in the search result display field 190. That is, the search result display field 190 displays a list of products related to the abstract word procedural word “sweet” such as jam, shortcake, ice cream, anpan, and juice.

【0060】抽象語手続きワードの他の例として、商品
のトップブランドを商品の普通名詞に準じて取り扱う態
様がある。消費者の多くは、商品を普通名詞ではなく自
己の良く購入するブランド名で認識しているという現実
に適合させたものである。例えば、ユーザがアルコール
飲料を扱うサイトで『スーパードライ』(登録商標)や
『一番絞り』(登録商標)と発語すると、検索結果表示
欄190には音声認識結果としてユーザの発語した単語
を表示すると共に、検索エンジンではこれらの登録商標
に対応する普通名詞『ビール』にて商品データベース2
3を検索して、検索結果表示欄190に検索された商品
がブランドや製造販売者毎に表示される。
As another example of the abstract word procedure word, there is a mode in which the top brand of a product is handled according to the common noun of the product. Many consumers adapt to the reality that they recognize the product as a brand name that they often buy rather than as a common noun. For example, if the user says “Super Dry” (registered trademark) or “Ichiban Shibori” (registered trademark) at a site that handles alcoholic beverages, the search result display field 190 displays the words that the user has spoken as a voice recognition result. Is displayed, and the search engine uses the common noun "beer" corresponding to these registered trademarks in the product database 2
3 is searched, and the searched products are displayed in the search result display field 190 for each brand or manufacturer.

【0061】このような音声認識機能を有するショッピ
ングサイト画面100にて、ユーザが商品を購入する状
態を時系列的に説明する。図20はユーザがショッピン
グサイト画面100にアクセスした初期状態を示す画面
図である。ショッピングカート欄170は空の状態で、
商品は何も選択されていない。ここで、ユーザが商品検
索注文欄114にて商品『ポテトチップス』を発語する
と、検索結果表示欄190には商品『ポテトチップス』
に含まれる何種類かの商品検索結果が表示される。商品
検索結果には、製造販売者A、B、C毎の代表的なブラ
ンドの商品を含めるのがよく、また商品検索結果は購入
主体にとって馴染みやすい態様で表示する。ユーザは
『3番を2個カートに追加』と発語すると、音声認識表
示欄202には音声認識結果として「3番を2個カート
に追加」が表示される。
A state in which the user purchases a product on the shopping site screen 100 having such a voice recognition function will be described in time series. FIG. 20 is a screen diagram showing an initial state in which the user has accessed the shopping site screen 100. The shopping cart field 170 is empty,
No products have been selected. Here, when the user utters the product “Potato Chips” in the product search order field 114, the search result display field 190 displays the product “Potato Chips”.
Several types of product search results included in are displayed. It is preferable that the product search results include products of representative brands of the respective manufacturers A, B, and C, and the product search results are displayed in a manner that is familiar to purchasers. When the user utters “Add 2 to Cart 3”, the voice recognition display field 202 displays “Add 2 to Cart 3” as the voice recognition result.

【0062】図21はショッピングカートに対し購入予
定商品を収容する形態の説明図である。音声認識表示欄
202の音声認識結果に適合するように、3番の商品
「ポテトチップス塩なし」2個がショッピングカート欄
170の購入予約商品表示欄172に表示される。購入
金額表示欄174には、購入予約商品表示欄172の商
品の配送料込みの合計額が表示される。
FIG. 21 is an explanatory view of a form in which the shopping cart stores the products to be purchased. Two 3rd products “without potato chips salt” are displayed in the purchase reservation product display field 172 of the shopping cart field 170 so as to match the voice recognition result of the voice recognition display field 202. The purchase price display field 174 displays the total price of the products in the purchase reservation product display field 172 including the delivery charge.

【0063】図22はショッピングカートの収容商品に
対する購入契約の成立を説明する説明図である。ユーザ
が購入したい商品の検索手続きワードを発語して、検索
結果表示欄190に表示された商品検索結果の中から、
商品を選択してショッピングカート欄170に加えて行
く。そして、ユーザが「購入します」と発語するか、注
文決定欄176をマウスにて操作すると、音声入力案内
表示部180の噴出し欄186に『お買い上げ有難う御
座いました』と表示される。
FIG. 22 is an explanatory diagram for explaining the establishment of a purchase contract for a product stored in a shopping cart. From the product search results displayed in the search result display field 190, the user utters a search procedure word for the product to be purchased,
Select a product and add it to the shopping cart field 170. Then, when the user utters “I will purchase” or operates the order determination field 176 with the mouse, “Thank you for your purchase” is displayed in the ejection field 186 of the voice input guidance display unit 180. .

【0064】図23は購入商品の送付先登録画面と支払
い方法の確認画面を示している。ユーザは依頼主の氏
名、住所、電話番号、生年月日、性別等を登録する。こ
の場合に、ユーザは会員登録欄130のショッピングメ
ンバ登録欄134に購入商品の送付先登録をしたり支払
い方法を予め登録しておくと、ショッピングサイトでの
購入の度に送付先登録や支払い方法の指定をする必要が
なくなり、便利である。ユーザの識別は、例えば会員登
録欄130にて発行される会員番号とパスワードを用い
ると良い。
FIG. 23 shows a delivery product registration screen for purchased products and a payment method confirmation screen. The user registers the client's name, address, telephone number, date of birth, gender, etc. In this case, if the user registers the destination of the purchased product in the shopping member registration column 134 of the member registration column 130 and registers the payment method in advance, the destination registration and the payment method are performed each time the purchase is made at the shopping site. It is convenient because you do not need to specify. For identification of the user, for example, a member number and password issued in the member registration field 130 may be used.

【0065】図24は発語された音声の認識が出来なか
った場合に再度の発語を促す画面図である。音声認識一
致率算定手段151にて、ユーザの発語した音声の認識
一致率が予め定められた閾値よりも低いと判断された時
は、音声認識ができなかったことを音声認識表示欄18
7に「???」が表示される。このとき、ユーザに対し
て音声認識ができなかったことを明確にするため、噴出
し欄186に「なんですか?」と表示し、さらに聞返し
手段152によりユーザに再度音声入力することを促
す。噴出し欄186には、ユーザに再度の発語を促すた
めに、他の用語を自由に用いることも可能である。
FIG. 24 is a screen view for prompting another utterance when the uttered voice cannot be recognized. When the voice recognition concordance calculating unit 151 determines that the recognition concordance of the voice uttered by the user is lower than a predetermined threshold value, the voice recognition display field 18 indicates that the voice cannot be recognized.
“????” is displayed on 7. At this time, in order to make clear to the user that voice recognition was not possible, “What?” Is displayed in the gush field 186, and further the prompting means 152 prompts the user to input a voice again. Other words can be freely used in the blowout column 186 in order to prompt the user to speak again.

【0066】図25は発語された音声は充分に認識でき
るが、その発語に対して複数の候補があった場合の画面
図である。音声認識一致率算定手段151にて、ユーザ
の発語した音声の認識一致率が予め定められた閾値より
も低いが、音声の認識一致率が高い音声認識されたとき
の手続きワードと近似している場合は、複数候補呈示部
153にて手続きワードを複数の候補として提示する。
例えば、ユーザが「マット」と発語としたが、音声の認
識一致率が閾値を下回る場合、手続きワードとして「裁
縫の糸(ニット)」、「雑貨のマット」、「食料品の納
豆」を候補として噴出し欄186に提示して、ユーザに
再度の発語を促すことが可能となる。
FIG. 25 is a screen view when the spoken voice can be sufficiently recognized, but there are a plurality of candidates for the spoken voice. In the voice recognition coincidence rate calculating means 151, the recognition coincidence rate of the voice uttered by the user is lower than a predetermined threshold value, but the voice recognition coincidence rate is high, and is approximated to the procedure word at the time of voice recognition. If so, the plural candidate presenting unit 153 presents the procedure word as a plurality of candidates.
For example, if the user utters “Mat” but the voice recognition concordance rate is below the threshold value, the procedure words are “Sewing thread (knit)”, “Miscellaneous mat”, and “Food natto”. It is possible to present the candidate in the squirt field 186 as a candidate and prompt the user to speak again.

【0067】[0067]

【発明の効果】本発明のショッピングサイトは、ユーザ
により発語された内容に対して、ユーザ端末により音声
認識された手続きワードを通信網経由で受信する手続き
ワード受信手段と、前記手続きワードに基づいて商品デ
ータベースを検索する商品検索手段と、当該検索に合致
する商品検索結果をユーザ端末にて参照可能な状態とす
る商品検索結果作成手段と、前記商品検索結果の中から
前記ユーザにより発語して指定された商品を、前記ユー
ザの指定に従いカートに格納するカート格納手段と、前
記ユーザの商品の購入意思表示に基づいて、前記カート
に収容された商品の取引を履行させる商品取引履行手段
とを備える構成としたので、ユーザは音声を使って、イ
ンターネットなどの通信網を利用したオンラインショッ
ピングができる。また、商品検索手段と商品検索結果作
成手段により、ユーザの欲しい商品に到達するのにショ
ッピングサイトのサイト構成に依存する多くのページを
通過する必要がなくなり、ユーザは高い利便性を享受で
きる。特に、通信網として動画配信可能な高速通信網を
用いる場合には、応答時間の遅さなどのストレスも感じ
ることがない。
EFFECT OF THE INVENTION The shopping site of the present invention is based on the procedure word receiving means for receiving, through the communication network, the procedure word speech-recognized by the user terminal for the content uttered by the user. A product search means for searching the product database with a product, a product search result creating means for making a product search result matching the search available on the user terminal, and a message uttered by the user from the product search results. Cart storing means for storing the designated product in the cart according to the user's designation, and product transaction fulfilling means for fulfilling the transaction of the product contained in the cart based on the user's intention to purchase the product. Since the configuration is provided, the user can use voice to perform online shopping using a communication network such as the Internet. Further, the product search unit and the product search result creation unit eliminate the need to go through many pages depending on the site configuration of the shopping site to reach the product desired by the user, and the user can enjoy high convenience. In particular, when a high-speed communication network capable of moving image distribution is used as the communication network, stress such as slow response time is not felt.

【0068】本発明の音声認識装置は、ショッピングサ
イトにアクセスして、ユーザにより発語された内容に対
して音声認識された手続きワードを送信して、商品の購
入を進めるショッピングサイト用のユーザ端末に用いら
れる音声認識装置において、ユーザの発語した音声を音
声認識するために、予め登録された前記ユーザの音響モ
デルデータベースと、前記ユーザの発語した音声を入力
し、音響モデルデータベースを参照して前記ユーザの発
語した音声の認識一致率を算定する音声認識一致率算定
手段と、前記算定された音声の認識一致率が予め定めら
れた閾値よりも低いときは、前記ユーザに対して再度の
発語を促す聞返し手段とを備える構成としたので、イン
ターネットなどの通信網を利用したオンラインショッピ
ングにおいても、ユーザは音声を使って商品の購入手続
きを行う場合に、ショッピングサイトは音声認識装置と
共同してユーザの発語した音声の認識を円滑に行なうこ
とができる。
The voice recognition device of the present invention accesses the shopping site, transmits the procedure word recognized by voice to the content uttered by the user, and advances the purchase of the product. The user terminal for the shopping site. In the voice recognition device used for, in order to recognize the voice uttered by the user, the acoustic model database of the user registered in advance and the voice uttered by the user are input, and the acoustic model database is referred to. Voice recognition matching rate calculation means for calculating the recognition matching rate of the voice uttered by the user, and when the calculated recognition matching rate of the voice is lower than a predetermined threshold, Since it is configured to have a reply means for prompting the utterance of, even in online shopping using a communication network such as the Internet, Over The is in the case of the purchase of goods by using the voice, shopping site can be carried out smoothly the recognition of voice that speech of the user in conjunction with voice recognition device.

【0069】本発明の音声認識サポート装置は、ユーザ
端末により音声認識された手続きワードを通信網経由で
受信し、前記手続きワードに基づいて商品データベース
を検索して当該検索に合致する商品検索結果を作成し、
前記ユーザの商品の購入意思表示に基づいて、前記商品
検索結果に含まれる商品の取引を履行させるショッピン
グサイトに対して、ユーザ端末による音声認識をサポー
トする音声認識サポート装置であって、ショッピングサ
イト毎に設けられる音声認識用共通データベースを管理
する手段を備える構成としたので、ショッピングサイト
の運営者は、音声認識用共通データベースの内容を更改
することにより、新商品の追加をいちいちユーザに通知
することなく対処できる。
The voice recognition support device of the present invention receives the procedure word recognized by the user terminal through the communication network, searches the product database based on the procedure word, and displays the product search result matching the search. make,
A voice recognition support device that supports voice recognition by a user terminal for a shopping site that executes a transaction of a product included in the product search result based on the user's display of purchase intention of the product. Since the configuration is provided with means for managing the voice recognition common database, the shopping site operator notifies the users of addition of new products one by one by updating the contents of the voice recognition common database. Can be dealt with without.

【図面の簡単な説明】[Brief description of drawings]

【図1】 本発明の一実施の形態を示す構成ブロック図
である。
FIG. 1 is a configuration block diagram showing an embodiment of the present invention.

【図2】 ユーザ端末の構成ブロック図である。FIG. 2 is a configuration block diagram of a user terminal.

【図3】 ショッピングサイトサーバの構成ブロック図
である。
FIG. 3 is a configuration block diagram of a shopping site server.

【図4】 音声サーバの構成ブロック図である。FIG. 4 is a configuration block diagram of a voice server.

【図5】 ユーザ端末によるショッピングサイトでの商
品購入を説明する流れ図である。
FIG. 5 is a flowchart illustrating a product purchase at a shopping site by a user terminal.

【図6】 ユーザによる発語がユーザ端末によって有効
に音声認識される状態に移行する為の、ユーザ端末、シ
ョッピングサイトサーバ、音声サーバ間の処理を説明す
る流れ図である。
FIG. 6 is a flowchart illustrating processing between the user terminal, the shopping site server, and the voice server for shifting to a state in which the user's utterance is effectively voice-recognized by the user terminal.

【図7】 手続きワードの種類を説明する図である。FIG. 7 is a diagram illustrating types of procedure words.

【図8】 ユーザが商品の検索を行う時の流れ図であ
る。
FIG. 8 is a flowchart when a user searches for products.

【図9】 ユーザが商品検索結果を用いて商品選択を行
う時の流れ図である。
FIG. 9 is a flow chart when the user selects a product using the product search result.

【図10】 ユーザが商品の購入を行う時の流れ図であ
る。
FIG. 10 is a flow chart when a user purchases a product.

【図11】 音声認識処理を説明する流れ図である。FIG. 11 is a flowchart illustrating a voice recognition process.

【図12】 ユーザが音声ショッピングを行ったことの
履歴を残すための流れ図である。
FIG. 12 is a flowchart for leaving a history that a user has performed voice shopping.

【図13】 ショッピングサイトがユーザ端末に表示す
るウェブページの一例を示す画面図である。
FIG. 13 is a screen diagram showing an example of a web page displayed on the user terminal by the shopping site.

【図14】 検索結果を購入希望商品としてリスト表示
する一例を示す画面図である。
FIG. 14 is a screen diagram showing an example of displaying a list of search results as desired products for purchase.

【図15】 消費者が購入予約した商品をショッピング
カートに明認表示する一例を示す画面図である。
FIG. 15 is a screen view showing an example in which a product for which a consumer has made a purchase reservation is displayed clearly on a shopping cart.

【図16】 購入確認画面の一例を示す図である。FIG. 16 is a diagram showing an example of a purchase confirmation screen.

【図17】 認識デコーダ部における同音異義語の問合
せ機能を説明する画面図である。
FIG. 17 is a screen diagram illustrating a function of inquiring homonyms in the recognition decoder unit.

【図18】 異なるカテゴリーの検索機能を説明する画
面図である。
FIG. 18 is a screen diagram illustrating a search function for different categories.

【図19】 抽象語手続きワードの検索機能を説明する
画面図である。
FIG. 19 is a screen diagram illustrating a search function for abstract word procedure words.

【図20】 ユーザがショッピングサイト画面にアクセ
スした初期状態を示す画面図である。
FIG. 20 is a screen diagram showing an initial state in which the user has accessed the shopping site screen.

【図21】 ショッピングカートに対し購入予定商品を
収容する形態の説明図である。
FIG. 21 is an explanatory diagram of a form in which a product to be purchased is stored in a shopping cart.

【図22】 ショッピングカートの収容商品に対する購
入契約の成立を説明する説明図である。
FIG. 22 is an explanatory diagram illustrating the establishment of a purchase contract for a product stored in a shopping cart.

【図23】 購入商品の送付先登録画面と支払い方法の
確認画面を示している。
FIG. 23 shows a destination registration screen for purchased products and a payment method confirmation screen.

【図24】 発語された音声の認識が出来なかった場合
に再度の発語を促す画面図である。
FIG. 24 is a screen diagram for prompting another utterance when the uttered voice cannot be recognized.

【図25】 発語された音声は充分に認識できるがその
発語に対して複数の候補があった場合の画面図である。
FIG. 25 is a screen diagram when a spoken voice can be sufficiently recognized but there are a plurality of candidates for the spoken word.

【符号の説明】[Explanation of symbols]

1 ユーザ端末 2 ショッピングサイトサーバ 3 音声サーバ 4 インターネット 11 音声入力部 12 音響分析部 14、21、31 ネットワークカード部 15 認識デコーダ部 151 音声認識一致率算定手段 152 聞返し手段 153 複数候補呈示部 16 ブラウザ制御部 17 音響モデルデータベース 18 音声認識用データベース 182、332 辞書データベース 184、334 グラマデータベース 22 ウェブ制御部 221 手続きワード受信手段 222 商品検索手段 223 商品検索結果作成手段 224 カート格納手段 225 商品取引履行手段 23 商品データベース 24 注文データベース 25 ショッピングカート 32 音声システム管理部 33 音声認識用共通データベース 34 サイト情報データベース 1 user terminal 2 shopping site server 3 voice server 4 Internet 11 Voice input section 12 Acoustic analysis section 14, 21, 31 Network card section 15 Recognition decoder section 151 Speech recognition matching rate calculation means 152 Means of reply 153 Multiple candidate presentation section 16 Browser control unit 17 Acoustic model database 18 Speech recognition database 182, 332 dictionary database 184,334 Grammar Database 22 Web control 221 Procedure word receiving means 222 Product Search Method 223 Product search result creation means 224 Cart storage means 225 Commodity Transaction Performance Means 23 product database 24 Order database 25 shopping cart 32 Voice System Management Department 33 Common database for voice recognition 34 Site Information Database

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G10L 15/00 G10L 3/00 551A 15/22 561C Fターム(参考) 5B075 KK07 KK34 KK37 ND20 NK02 PP07 PP25 PQ02 PQ46 UU40 5D015 KK02 ─────────────────────────────────────────────────── ─── Continuation of front page (51) Int.Cl. 7 Identification code FI theme code (reference) G10L 15/00 G10L 3/00 551A 15/22 561C F term (reference) 5B075 KK07 KK34 KK37 ND20 NK02 PP07 PP25 PQ02 PQ46 UU40 5D015 KK02

Claims (12)

【特許請求の範囲】[Claims] 【請求項1】 ユーザにより発語された内容に対して、
ユーザ端末により音声認識された手続きワードを通信網
経由で受信し;前記手続きワードに基づいて商品データ
ベースを検索して、当該検索に合致する商品検索結果を
前記ユーザ端末にて参照させ;前記ユーザ端末により音
声認識された商品選択の意思表示であって、前記商品検
索結果の中から前記ユーザにより指定された商品をカー
トに格納し;前記ユーザにより発語された前記カートに
収容された商品の購入意思表示に基づいて売買を成立さ
せる;ことを特徴とするオンラインショッピング方法。
1. The content uttered by a user,
The procedure word recognized by the user terminal is received through the communication network; the product database is searched based on the procedure word, and the product search result matching the search is referred to by the user terminal; Is a voice-recognized intention to select a product and stores the product specified by the user from the product search results in the cart; purchase of the product contained in the cart uttered by the user An online shopping method, characterized in that a sale is established based on an indication of intention.
【請求項2】 ユーザにより発語された内容に対して、
ユーザ端末により音声認識された手続きワードを通信網
経由で受信する手段と;前記手続きワードに基づいて商
品データベースを検索する商品検索手段と;当該検索に
合致する商品検索結果を前記ユーザ端末にて参照可能な
状態とする商品検索結果作成手段と;前記商品検索結果
の中から前記ユーザにより発語して指定された商品を、
前記ユーザの指定に従いカートに格納する手段と;前記
ユーザの商品の購入意思表示に基づいて、前記カートに
収容された商品の取引を履行させる商品取引履行手段と
を備える;ことを特徴とするショッピングサイト。
2. The content uttered by the user,
A means for receiving a procedure word recognized by the user terminal through a communication network; a product search means for searching a product database based on the procedure word; and a product search result matching the search in the user terminal Product search result creating means for enabling a product; and a product specified by the user uttered from the product search results,
Shopping according to the user's designation; and means for storing a commodity in the cart based on the user's intention to purchase the commodity, the commodity transaction fulfilling means for fulfilling the transaction of the commodity accommodated in the cart. site.
【請求項3】 前記ユーザ端末には音声認識用データベ
ースが備えられており;前記ショッピングサイトに設け
られる前記商品データベースの更新情報を含む音声認識
用共通データベースと;前記通信網経由で前記ショッピ
ングサイトにアクセスしてきた前記ユーザ端末の音声認
識用データベースの改定状態と、前記音声認識用共通デ
ータベースの改定状態との差異を検出して、前記音声認
識用共通データベースと同一の改定状態となるように前
記音声認識用データベースの内容を更改する等値化手段
とを備える;ことを特徴とする請求項2に記載のショッ
ピングサイト。
3. The voice recognition database is provided in the user terminal; a voice recognition common database including update information of the product database provided in the shopping site; and a voice recognition database in the shopping site via the communication network. The difference between the revision state of the voice recognition database of the user terminal that has accessed and the revision state of the voice recognition common database is detected, and the voice is set to the same revision state as the voice recognition common database. 3. A shopping site according to claim 2, further comprising: an equalization means for updating the contents of the recognition database.
【請求項4】 前記商品検索手段は、前記手続きワード
が商品の普通名詞に代えてブランドである場合に、前記
ブランドの使用される商品の普通名詞として前記商品デ
ータベースを検索することを特徴とする請求項2又は請
求項3に記載のショッピングサイト。
4. The product search means searches the product database as a common noun of a product used by the brand when the procedure word is a brand instead of the common noun of the product. The shopping site according to claim 2 or 3.
【請求項5】 前記商品検索手段は、前記手続きワード
で示される商品の普通名詞に対して、当該商品に関連付
けて使用される関連商品の普通名詞も含めて前記商品デ
ータベースを検索することを特徴とする請求項2又は請
求項3に記載のショッピングサイト。
5. The product search means searches the product database for common nouns of products indicated by the procedure word, including common nouns of related products used in association with the product. The shopping site according to claim 2 or claim 3.
【請求項6】 前記商品検索手段は、前記手続きワード
が商品の有する属性を示す場合に、当該属性を備える商
品の普通名詞を中間検索ワードとして抽出し、前記中間
検索ワードにより前記商品データベースを検索すること
を特徴とする請求項2又は請求項3に記載のショッピン
グサイト。
6. The product search means, when the procedure word indicates an attribute of a product, extracts a common noun of a product having the attribute as an intermediate search word, and searches the product database by the intermediate search word. The shopping site according to claim 2 or 3, wherein
【請求項7】 前記商品検索手段は、前記手続きワード
が商品の有する複数の属性を示す属性用語を含む手続き
文である場合に、当該手続き文を構成する属性用語を抽
出し、前記抽出された複数の属性用語の属性を備える商
品の普通名詞を中間検索ワードとして抽出し、前記中間
検索ワード並びに前記抽出された複数の属性用語により
前記商品データベースを検索することを特徴とする請求
項2又は請求項3に記載のショッピングサイト。
7. The product search means, when the procedure word is a procedural sentence containing an attribute term indicating a plurality of attributes of a product, extracts the attribute term that constitutes the procedural sentence, and extracts the procedural sentence. The common noun of a product having attributes of a plurality of attribute terms is extracted as an intermediate search word, and the product database is searched by the intermediate search word and the extracted plurality of attribute terms. The shopping site according to Item 3.
【請求項8】 前記商品検索結果作成手段では、前記商
品検索手段により検索された前記商品について、ブラン
ド名毎に区分して前記商品検索結果に含ませることを特
徴とする請求項4乃至請求項7の何れか一つに記載のシ
ョッピングサイト。
8. The product search result creating means divides the products searched by the product search means by brand name and includes them in the product search result. Shopping site according to any one of 7.
【請求項9】 前記商品取引履行手段は、前記カートに
収容された商品の購入意思表示がユーザ端末の音声認識
により行われた履歴を残すことを特徴とする請求項2乃
至請求項8の何れか一つに記載のショッピングサイト。
9. The product transaction fulfillment means leaves a history of a purchase intention display of a product accommodated in the cart, which is performed by voice recognition of a user terminal. The shopping site described in one.
【請求項10】 ショッピングサイトにアクセスして、
ユーザにより発語された内容に対して音声認識された手
続きワードを送信して、商品の購入を進めるショッピン
グサイト用ユーザ端末に用いられる音声認識装置おい
て;前記ユーザの発語した音声を音声認識するために、
予め登録された前記ユーザの音響モデルデータベース
と;前記ユーザの発語した音声を入力し、前記音響モデ
ルデータベースを参照して前記ユーザの発語した音声の
認識一致率を算定する手段と;前記算定された音声の認
識一致率が予め定められた閾値よりも低いときは、前記
ユーザに対して再度の発語を促す聞返し手段とを備え
る;音声認識装置。
10. Accessing a shopping site,
In a voice recognition device used for a user terminal for a shopping site, which transmits a speech-recognized procedure word with respect to the content uttered by a user to proceed with the purchase of a product; In order to
An acoustic model database of the user registered in advance; means for inputting the speech uttered by the user, and calculating a recognition matching rate of the speech uttered by the user with reference to the acoustic model database; And a voice recognition device for prompting the user to utter again when the recognition recognition rate of the generated voice is lower than a predetermined threshold.
【請求項11】 前記算定された音声の認識一致率が予
め定められた閾値よりも低いときは、前記算定された音
声の認識一致率が相対的に高く音声認識された手続きワ
ードを複数候補として提示することを特徴とする請求項
10に記載の音声認識装置。
11. When the calculated voice recognition concordance rate is lower than a predetermined threshold, the calculated voice recognition concordance rate is relatively high. The voice recognition device according to claim 10, which is presented.
【請求項12】 ユーザ端末により音声認識された手続
きワードを通信網経由で受信し、前記手続きワードに基
づいて商品データベースを検索して当該検索に合致する
商品検索結果を作成し、前記ユーザの商品の購入意思表
示に基づいて、前記商品検索結果に含まれる商品の取引
を履行させるショッピングサイトに対して、前記ユーザ
端末による音声認識をサポートする音声認識サポート装
置であって;前記ショッピングサイト毎に設けられる音
声認識用共通データベースを管理する手段を備えること
を特徴とする音声認識サポート装置。
12. A procedure word recognized by a voice from a user terminal is received via a communication network, a commodity database is searched based on the procedure word, a commodity search result matching the search is created, and the commodity of the user. A voice recognition support device that supports voice recognition by the user terminal with respect to a shopping site that executes a transaction of a product included in the product search result based on the purchase intention display of the product; provided for each of the shopping sites. A voice recognition support device comprising means for managing a common database for voice recognition.
JP2001226070A 2001-07-26 2001-07-26 On-line shopping method, shopping site, voice recognizing device and voice recognition supporting device Pending JP2003044756A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001226070A JP2003044756A (en) 2001-07-26 2001-07-26 On-line shopping method, shopping site, voice recognizing device and voice recognition supporting device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001226070A JP2003044756A (en) 2001-07-26 2001-07-26 On-line shopping method, shopping site, voice recognizing device and voice recognition supporting device

Publications (1)

Publication Number Publication Date
JP2003044756A true JP2003044756A (en) 2003-02-14

Family

ID=19058956

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001226070A Pending JP2003044756A (en) 2001-07-26 2001-07-26 On-line shopping method, shopping site, voice recognizing device and voice recognition supporting device

Country Status (1)

Country Link
JP (1) JP2003044756A (en)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004265217A (en) * 2003-03-03 2004-09-24 Nec Corp Mobile communication terminal having voice recognition function and keyword retrieval method using the same terminal
JP2004318597A (en) * 2003-04-17 2004-11-11 Kyodo Printing Co Ltd Recommendation system
JP2005025287A (en) * 2003-06-30 2005-01-27 Toppan Printing Co Ltd Server of search site and method for providing search page
JP2009145435A (en) * 2007-12-12 2009-07-02 O Chuhei System and method for providing unspecified speaker speech recognition engine used in a plurality of apparatuses to individual user via the internet
JP2010113390A (en) * 2008-11-04 2010-05-20 Hands:Kk Merchandise information retrieval device, method and computer program
JP2012018518A (en) * 2010-07-07 2012-01-26 Cyber Clerk Institute Operation support device and operation support method
JP2012208837A (en) * 2011-03-30 2012-10-25 Hitachi Consumer Electronics Co Ltd Screen display method in net supermarket system
JP2016524235A (en) * 2014-03-21 2016-08-12 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド Search recommendation method and apparatus
JP6185216B1 (en) * 2016-10-06 2017-08-23 株式会社オプティム Information providing system, information providing apparatus, information providing method, and program
JP6240291B1 (en) * 2016-10-27 2017-11-29 ヤフー株式会社 Determination apparatus, determination method, and determination program
JP6250852B1 (en) * 2017-03-16 2017-12-20 ヤフー株式会社 Determination program, determination apparatus, and determination method
JP2018073410A (en) * 2017-10-20 2018-05-10 ヤフー株式会社 Determination device, determination method, and determination program
WO2018087994A1 (en) * 2016-11-14 2018-05-17 シャープ株式会社 Communication device, control method, and information processing program
JP2018120326A (en) * 2017-01-24 2018-08-02 株式会社プロフィールド Commodity information management device, commodity information management method and program
JP2018156627A (en) * 2017-11-15 2018-10-04 ヤフー株式会社 Determination program, determination device, and determination method
CN109192214A (en) * 2018-08-21 2019-01-11 平安科技(深圳)有限公司 A kind of voice number obtaining method, storage medium and robot
US10282417B2 (en) 2016-02-19 2019-05-07 International Business Machines Corporation Conversational list management
JP2021504775A (en) * 2017-12-22 2021-02-15 グーグル エルエルシーGoogle LLC Electronic list user interface

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01222299A (en) * 1988-03-01 1989-09-05 Nippon Denso Co Ltd Voice recognizing device
JPH08263345A (en) * 1995-03-28 1996-10-11 Nec Telecom Syst Ltd Data base updating management method
JPH11259269A (en) * 1998-03-13 1999-09-24 Omron Corp Information processor and method therefor and storage medium
JP2000293754A (en) * 1999-04-07 2000-10-20 Toshiba Tec Corp Merchandise sales registered data processor
WO2001005155A1 (en) * 1999-07-09 2001-01-18 Fujitsu Limited Internet shopping system utilizing set top box and voice recognition
JP2001101222A (en) * 1999-10-01 2001-04-13 Just Syst Corp Data retrieving device and storage medium in which program for data retrieval is stored
JP2001109742A (en) * 1999-08-05 2001-04-20 Toshiba Corp Method for integrating and processing web page parts and client device
JP2001118007A (en) * 1999-08-17 2001-04-27 Citibank Na System and method for use of distributed electronic wallet

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01222299A (en) * 1988-03-01 1989-09-05 Nippon Denso Co Ltd Voice recognizing device
JPH08263345A (en) * 1995-03-28 1996-10-11 Nec Telecom Syst Ltd Data base updating management method
JPH11259269A (en) * 1998-03-13 1999-09-24 Omron Corp Information processor and method therefor and storage medium
JP2000293754A (en) * 1999-04-07 2000-10-20 Toshiba Tec Corp Merchandise sales registered data processor
WO2001005155A1 (en) * 1999-07-09 2001-01-18 Fujitsu Limited Internet shopping system utilizing set top box and voice recognition
JP2001109742A (en) * 1999-08-05 2001-04-20 Toshiba Corp Method for integrating and processing web page parts and client device
JP2001118007A (en) * 1999-08-17 2001-04-27 Citibank Na System and method for use of distributed electronic wallet
JP2001101222A (en) * 1999-10-01 2001-04-13 Just Syst Corp Data retrieving device and storage medium in which program for data retrieval is stored

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004265217A (en) * 2003-03-03 2004-09-24 Nec Corp Mobile communication terminal having voice recognition function and keyword retrieval method using the same terminal
JP2004318597A (en) * 2003-04-17 2004-11-11 Kyodo Printing Co Ltd Recommendation system
JP2005025287A (en) * 2003-06-30 2005-01-27 Toppan Printing Co Ltd Server of search site and method for providing search page
JP2009145435A (en) * 2007-12-12 2009-07-02 O Chuhei System and method for providing unspecified speaker speech recognition engine used in a plurality of apparatuses to individual user via the internet
JP2010113390A (en) * 2008-11-04 2010-05-20 Hands:Kk Merchandise information retrieval device, method and computer program
JP2012018518A (en) * 2010-07-07 2012-01-26 Cyber Clerk Institute Operation support device and operation support method
JP2012208837A (en) * 2011-03-30 2012-10-25 Hitachi Consumer Electronics Co Ltd Screen display method in net supermarket system
JP2016524235A (en) * 2014-03-21 2016-08-12 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド Search recommendation method and apparatus
US10282417B2 (en) 2016-02-19 2019-05-07 International Business Machines Corporation Conversational list management
JP6185216B1 (en) * 2016-10-06 2017-08-23 株式会社オプティム Information providing system, information providing apparatus, information providing method, and program
US10817923B2 (en) 2016-10-06 2020-10-27 Optim Corporation Information providing system, information providing apparatus, information providing method, and program
WO2018066102A1 (en) * 2016-10-06 2018-04-12 株式会社オプティム Information providing system, information providing device, information providing method, and program
JP2018073046A (en) * 2016-10-27 2018-05-10 ヤフー株式会社 Determination device, determination method, and determination program
JP6240291B1 (en) * 2016-10-27 2017-11-29 ヤフー株式会社 Determination apparatus, determination method, and determination program
WO2018087994A1 (en) * 2016-11-14 2018-05-17 シャープ株式会社 Communication device, control method, and information processing program
JP2018120326A (en) * 2017-01-24 2018-08-02 株式会社プロフィールド Commodity information management device, commodity information management method and program
JP2018155882A (en) * 2017-03-16 2018-10-04 ヤフー株式会社 Determination program, determination device, and determination method
JP6250852B1 (en) * 2017-03-16 2017-12-20 ヤフー株式会社 Determination program, determination apparatus, and determination method
JP2018073410A (en) * 2017-10-20 2018-05-10 ヤフー株式会社 Determination device, determination method, and determination program
JP2018156627A (en) * 2017-11-15 2018-10-04 ヤフー株式会社 Determination program, determination device, and determination method
JP2021504775A (en) * 2017-12-22 2021-02-15 グーグル エルエルシーGoogle LLC Electronic list user interface
US11100147B2 (en) 2017-12-22 2021-08-24 Google Llc Electronic list user interface
US11734323B2 (en) 2017-12-22 2023-08-22 Google Llc Electronic list user interface
CN109192214A (en) * 2018-08-21 2019-01-11 平安科技(深圳)有限公司 A kind of voice number obtaining method, storage medium and robot
CN109192214B (en) * 2018-08-21 2023-03-03 平安科技(深圳)有限公司 Voice number taking method, storage medium and robot

Similar Documents

Publication Publication Date Title
US20230419383A1 (en) Systems and methods for virtual agents to help customers and businesses
US11798053B2 (en) Information provision system, information provision method, and storage medium
JP5480389B2 (en) Specialized for dynamic search suggestions and classification
JP2003044756A (en) On-line shopping method, shopping site, voice recognizing device and voice recognition supporting device
WO2018133723A1 (en) Voice shopping method and device, and computer readable storage medium
EP1269732B1 (en) Interacting with a data network using a telephonic device
AU2002256369B2 (en) Location-based services
EP2113909B1 (en) Location-based services
US7752266B2 (en) System and method to facilitate translation of communications between entities over a network
KR20020093852A (en) System and method for voice access to internet-based information
US20140013202A1 (en) Web page display system
AU2001247456A1 (en) System and method for voice access to internet-based information
JP2003036270A (en) Method and system for evaluating text-based product
WO2001071481A2 (en) System and method for funneling user responses in an internet voice portal system to determine a desired item or service
US11907999B2 (en) System, method, and computer readable medium for automatic item rankings
CN110377812A (en) Self-help shopping method, apparatus, equipment and computer readable storage medium
US20030046289A1 (en) Meta browsing with external execution of third party services
US10445793B2 (en) Review text output system and review text output method
KR101547756B1 (en) System and method for online-talk question and answer completion and computer-readable storage medium with program therefor
KR20020078714A (en) Consumer Purchase-apply System For The Usage Appraisement Of Product User
JP2002099764A (en) Method and device for providing information
KR20100037711A (en) Method for collecting, providing goods information service and system thereof
Sadi et al. Development of a Voice Controlled Web based E-Commerce
JP2005222154A (en) Information distribution system
JP2001344478A (en) System and method for article purchase by internet shopping, broker server, and recording medium with recorded article purchase program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080627

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101207

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110426