JPH11282648A - 音声による情報案内方法および装置 - Google Patents
音声による情報案内方法および装置Info
- Publication number
- JPH11282648A JPH11282648A JP10046581A JP4658198A JPH11282648A JP H11282648 A JPH11282648 A JP H11282648A JP 10046581 A JP10046581 A JP 10046581A JP 4658198 A JP4658198 A JP 4658198A JP H11282648 A JPH11282648 A JP H11282648A
- Authority
- JP
- Japan
- Prior art keywords
- information
- voice
- voice information
- phrase
- providing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 28
- 238000006243 chemical reaction Methods 0.000 claims abstract description 17
- 238000010586 diagram Methods 0.000 description 15
- 238000001514 detection method Methods 0.000 description 9
- 230000005236 sound signal Effects 0.000 description 7
- 230000015572 biosynthetic process Effects 0.000 description 6
- 238000003786 synthesis reaction Methods 0.000 description 6
- 238000000926 separation method Methods 0.000 description 4
- 230000035807 sensation Effects 0.000 description 3
- 235000001630 Pyrus pyrifolia var culta Nutrition 0.000 description 2
- 240000002609 Pyrus pyrifolia var. culta Species 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 2
- LFYJSSARVMHQJB-QIXNEVBVSA-N bakuchiol Chemical compound CC(C)=CCC[C@@](C)(C=C)\C=C\C1=CC=C(O)C=C1 LFYJSSARVMHQJB-QIXNEVBVSA-N 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 230000003442 weekly effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/93—Document management systems
- G06F16/94—Hypermedia
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/955—Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
- G06F16/9558—Details of hyperlinks; Management of linked annotations
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
Abstract
々な分野で応用されている。しかしながら現状の情報提
供方法には、機能上、操作上の問題点があり音声情報提
供の手段としては不十分である。これは機能的には階層
的な音声情報の検索が困難であることまた利用者からの
操作が容易でないためである。 【解決手段】本発明では提供する音声情報の中に、詳細
情報を含む語句であることを示すホットスポットを含ま
せる。利用者は音声情報を聞きながらホットスポットを
認識し、所望のホットスポットを指定することが出来
る。音声情報提供手段は、指定語句を検出し指定語句の
詳細音声情報の格納場所を特定する。さらに音声情報提
供手段は、該詳細音声情報検索、受信しホットスポット
を含む音声情報を利用者に提供する。
Description
び情報提供に関する、より詳細には利用者の所望する情
報を指定、検出、検索および提供する方法および装置に
関する。
情報が、家庭を含む様々な場所からパーソナル・コンピ
ュータを使って簡単に入手できるようになった。つまり
世界中に張り巡らされたワールド・ワイド・ウェブを経
由してブラウザにより簡単に情報の検索、入手が可能に
なった。インターネットで検索・表示された情報の中
で、さらに詳細情報を含む語句は、そのことが認識でき
るように、アンダーラインを引いたりあるいは色を変え
るなどの工夫をして表示されている。このように表示さ
れた語句を「ホットスポット」と呼ぶ。このホットスポ
ットの上にポインタ(またはカーソル)を持ってきて、
そこでマウスをクリックするとその語句にリンクされた
詳細情報提供サイトにジャンプする。これによって、さ
らにホットスポットに関する詳細情報の入手が可能とな
る。
パーソナル・コンピュータなどの端末機が必要である。
端末機のない場所からは当然のことながら情報の検索・
入手は出来ない。また、端末機があっても、目で見なが
ら手動で操作し指定していかないと検索できないのは当
然であり、ハンデキャップのある人には利用できない場
合がある。例えば、現在のブラウザではマウスを使って
画面を見ながら指定することが前提になっている。目の
見えない人には使えない。また、寝たきりの人にとって
は、パーソナル・コンピュータの前に座って、マウスを
操作しキーボードを叩くことは負担となる場合もある。
これらの問題を解決するために、音声による情報を提供
することが考えられる。
化の要求とあいまって様々な分野で応用されている。し
かしながら現状の電話による情報提供方法には、機能上
の問題点があり音声情報提供の手段としては不十分であ
る。この理由のひとつとして、上述のホットスポットを
音声情報の中に含ませることが困難であることがあげら
れる。現在の音声情報の提供は簡単な番号案内あるい
は、人間による応答までのつなぎの役割しか果していな
い。実際の音声情報提供を例にとって説明する。一例と
して音声による情報案内で説明する。これらの音声情報
案内では、全体のメニュー提示をするときには「お客様
のお住まいのエリアを発信音の後に入力してください、
1.東京地区、2.神奈川地区、3.埼玉地区、4.千
葉地区、5.山梨地区」とアナウンスされ、その後、発
信音の後に利用者が該当する番号を入力していた。この
ような提供方法を用いる理由は、ホットスポットがメニ
ューの音声情報の中に含まれていないためである。この
方法の欠点はメニューの全体がわからないため、全部の
メニューを最後まで聞く必要がある。また全部のメニュ
ーを聞いた後に番号を押すために必要な番号を記憶して
おく必要がある。メニューが長くなると記憶違いによる
エラーが発生する可能性がある。そのために、簡単なメ
ニューしか提供できない。また、1つ前のメニューに戻
る操作が面倒であるなど操作性上の問題もある。この様
に現在の音声による情報提供方法は、機能上あるいは操
作上の問題があり、必要な情報を広く深く、利用者のニ
ーズに合わせて提供出来るものではない。
声情報提供において、利用者による必要情報の指定、検
出、検索および提供に関して改善した方法及び装置を提
案することである。本発明によれば、利用者の所望する
幅広い内容的に対して詳しい音声情報を、容易な操作方
法で提供で出来る。本発明の他の目的はインターネット
経由でブラウザを使って情報検索を行うことが出来るの
と同じように、音声による情報検索および情報提供を実
現するための方法及びシステムを提供することである。
は、提供する音声情報の中にホットスポットを含ませ
る。利用者は音声情報を聞きながらホットスポットを認
識し、所望のホットスポットを指定することが出来る。
音声情報提供手段は利用者によって指定されたホットス
ポットを検出し、ホットスポットで指定された語句に関
する詳細情報が格納されている場所を特定する。音声情
報提供手段は特定された格納場所を検索し、詳細情報を
受信する。音声情報提供手段は受信された詳細情報を利
用者に提供する。このとき提供される詳細情報には、同
様にホットスポットが含まれているので、利用者はさら
に詳細情報を指定できる。
報の中にホットスポットを含ませ、それが利用者にホッ
トスポットであることを認識させる必要がある。このた
めにホットスポットの音声提供時には、そのことが認識
できる音を重畳させる。あるいは、音声のトーンを変え
ることも出来る。例えば、本文は男性の声で提供しホッ
トスポット部分は女性の声で提供することも出来る。さ
らには利用者の他の五感に訴えることも出来る。ホット
スポットの音声提供時には、音声情報受信手段を機械的
に振動させる、あるいは、ランプを点灯させることも可
能である。利用者が所望のホットスポットを指定するた
めには、利用者の発声音による制御も可能である。また
音声情報受信手段がプッシュホン受話器である場合に
は、特定のボタンを押すことによって指定することも出
来る。
音声ファイルについて説明する。図1に示すように、音
声ファイルは音声データ及びホットスポット指定部から
構成されている。音声ファイルの実施例として次の4つ
の例を挙げることが出来る。 1)1つの音声ファイル中、ファイルの先頭部分にホッ
トスポット指定部をまとめて格納し、続いて音声データ
部を格納する方法(図2A、音声ファイル実施例1)。
ホットスポット指定部にはヘッダ部、ホットスポットの
始点情報、終点情報、詳細情報の格納場所情報などが含
まれる(図2B)。ヘッダ部にはホットスポットのシーケ
ンス番号などが含まれる。ホットスポットの始点情報に
は、ホットスポットの開始時間、あるいは直前のホット
スポット終了から次のホットスポット開始までのバイト
数などが含まれる。同様にホットスポットの終点情報に
は、ホットスポットの終了時間、あるいはホットスポッ
ト開始から終了までのバイト数などが含まれる。
と、ホットスポット指定データとを分散して、格納する
方法(図3A、音声ファイル実施例2)。この場合、音声
データ部とホットスポット指定部を区別するため、各ホ
ットスポット指定部の最初の部分にスタートビット(複
数)を付ける。スタートビットは特定のビットパターン
(例えば16進数でFF)とし、音声データには、この特
定のビットパターンは使わないもとのする。そのビット
パターンがデータ中にあらわれたときは、ホットスポッ
ト指定部の開始であると判断する。そのビットパターン
の後に、そのホットスポット指定部で指定されるホット
スポットの長さ情報、及びそのホットスポット指定部で
指定される語句の詳細情報格納場所情報などが格納され
ている(図3B)。ホットスポットの長さの情報として、
ホットスポットのバイト長、あるいは、ホットスポット
の時間長などの情報を格納することが出来る。
別のファイルとする方法。例えば、音声データをYYY.au
というファイルとし、ホットスポット指定部をXXX.hsと
いう名前で格納し、音声情報提供手段が、両方のファイ
ルを参照して、処理を行なう(図4、音声ファイル実施
例3)。これらのファイルの内容は、音声ファイル実施
例1、及び音声ファイル実施例2で示したものと同様で
ある。4)音声データとホットスポット指定データを別
のファイルとし、音声データの指定及びホットスポット
指定は、特定の記述言語で書かれたファイル中に記述す
る方法(図5、音声ファイル実施例4)。この方法で
は、まず、音声情報提供手段は、その記述言語で書かれ
たファイルを音声情報格納手段からダウンロードし参照
する。それには、音声データが格納されている場所(本
実施例ではURLアドレス、URL:ユニフォーム・リソ
ース・ロケータ以下、URL)とホットスポット指定情
報とが含まれている。それにしたがって、音声情報検索
手段を通じて音声情報格納手段から音声データを読み出
し、ホットスポット処理を行なう。以下に音声データと
ホットスポット指定のための言語の例を示す。これは、
ワールドワイドウェブで使われているHTML言語に類似し
ているが、音声データの指定と、音声データ中のホット
スポット指定を記述できるように記述方法を拡張してあ
る。ここでは、この言語をHSML(HyperSpeech Markup
Language)言語と呼ぶ。
報格納手段によって、例えば、weather.hsmlという名前
で格納されている。上記、<HSML>と</HSML>で囲まれた
部分はこの言語の始まりと終わりを示す。<HEAD>と</HE
AD>で囲まれた部分は、ヘッダ部であることを示し、<TI
TLE>と</TITLE>で囲まれた部分は、タイトルを示し、<B
ODY>と</BODY>で囲まれた部分は、本文を示し、これら
は、HTML言語と同様の定義である。本文中、<AUDIO src
="weather.au">は、音声データの所在をしめしており、
この場合、音声データのURLアドレスはweather.auであ
ることを示している。<AUDIOMAP>と</AUDIOMAP>で囲ま
れた部分は、この部分が音声データに対するホットスポ
ット指定データであることを示している。
ットスポット指定データである。はじめの行は、weathe
r.auという音声データの0時間0分20秒から0時間0
分30秒の間がホットスポットであり、そのホットスポ
ットが指示されたとき、URLアドレスがtokyo.auである
音声データを再生することを示している。次の行も同様
に、weather.auという音声データの35秒から45秒の間
がホットスポットであり、そのホットスポットが指示さ
れたとき、URLアドレスがkanagawa.auである音声データ
を再生することを示している。次の行は、weather.auと
いう音声データの50秒から1分0秒の間がホットスポッ
トであり、そのホットスポットが指示されたとき、URL
アドレスがweelky.hsmlというHSML言語で書かれたファ
イルを解釈して実行することを示している。weelky.hsm
lファイルには、weather.hsmlと同様に、音声データの
所在の情報やホットスポット指定データが含まれてい
る。以上、音声ファイルのいくつかの構造の例について
説明したが、以下これらを使った実施例について説明す
る。
声情報格納手段(110)、音声情報検索手段(15
0)、音声情報提供手段(120)、音声情報伝達手段
(130)、及び音声情報受信手段(140)が示され
ている。音声情報格納手段(110)には予め本発明に
従ったフォーマットで音声ファイルが格納されている。
音声情報提供手段(120)は、音声情報格納手段(1
10)に格納されている音声ファイルを受信し、受信し
た音声ファイルを音声情報に変換する。音声情報受信手
段(140)へ提供するとき、詳細音声情報を有する語
句(ホットスポット)の音声変換時には、詳細情報を有
しない語句の音声変換時とは、利用者が識別できる手段
で、音声情報受信手段(140)へ伝える(122)。
次に利用者は音声情報提供手段(120)によって提供
される音声情報の中で、利用者が詳細情報を検索したい
所望の語句を検出したときには、その所望の語句を指定
し音声情報提供手段(120)に伝える(142)。
定した語句を検出し、指定された語句が格納されている
場所を特定する。音声情報提供手段(120)は音声情
報格納手段(110)を検索し(124)、音声情報格
納手段(110)からの所望の音声ファイルを受信する
(112)。音声情報提供手段(120)は音声ファイ
ルを音声情報に変換し、利用者に提供する。音声ファイ
ルを音声情報に変換するときには、前述と同様に、詳細
音声情報を有する語句(ホットスポット)の音声変換時
には、詳細情報を有しない語句の音声変換時とは利用者
が識別できる手段で、音声情報受信手段(140)へ伝
える。この操作を、利用者が所望の情報を入手するまで
繰り返す。本発明は、さらに音声情報伝達手段(13
0)として、公衆通信網、構内通信網あるいはその他の
情報伝達手段を、音声情報検索手段(150)として、
インターネット、イントラネットあるいはその他の情報
検索手段を用いて容易に広範に適用可能である。
例2では、音声情報検索手段としてインターネットで利
用されるワールド・ワイド・ウエブ(250)を、音声
情報伝達手段として公衆回線網(230)を、音声情報
格納手段としてワールド・ワイド・ウエブに接続されて
いる各サイト(210)を、音声情報提供手段として音
声情報交換機(220)を、及び音声情報受信手段とし
て公衆回線網に接続されている受話器(240)として
いる。ワールド・ワイド・ウエブにおいて、URLで指
定される各サイトには、通常、画像情報、文書情報、音
響情報などが格納されている。これらの情報は利用者へ
送られ、利用者の端末機上で画像情報、文書情報、音響
情報などが再生される。本実施例においては、図8に示
されるように、各URLのサイトには画像情報だけでは
なく複数の音声ファイル(300)も格納されている。
ロック図を示す。音声情報交換機400は音声復号器4
10、及びホットスポット検出器420を有する。受話
機(440)は公衆回線網に接続されている音声情報受
信手段である。また、ワールド・ワイド・ウエブ・サイ
ト(430)はワールド・ワイド・ウエブに接続されて
いる音声情報格納手段である。各サイト(430)には
複数の音声ファイルが格納されている(図8)。音声復
号器(410)はワールド・ワイド・ウエブに接続され
ている各サイト(430)からの音声ファイルを受信す
る(412)。受信した音声ファイルは音声ファイル分
離ブロック(434)へ送られる。音声ファイルの中で
音声データは音声信号合成ブロック(436)へ、ホッ
トスポット指定部はホットスポット指定ブロック(43
8)、及びURL特定ブロック(456)へそれぞれ送
られる。音声データはD/A変換ブロック(437)へ
送られ、アナログ音声に変換され利用者へ送られる。音
声情報を提供している時、ホットスポット部分になる
と、ホットスポット指定ブロックから音声信号合成ブロ
ックへ信号が行く。音声信号合成ブロックは、ホットス
ポット指定ブロックからの信号を受け取ると、特定周波
数の音を重畳するように音声信号を合成する。合成され
た音声信号はD/A変換器へ送られ、特定周波数の音が
重畳されたアナログ信号に変換され、利用者へ送られる
(422)。あるいはアナログ信号に変換することなく
デジタル信号として受話器へ送ることも出来る。
を知りたいホットスポットになると、それを指定する。
図11に示されるように、プッシュ信号検出ブロック
(542)は利用者が入力した信号を検出する。その情
報は信号合成ブロック(544)を経由して、ホットス
ポット検出器(420)へ送られる。図9に示すように
ホットスポット検出器(420)は、利用者からの信号
(442)を受信し、信号検出ブロック(454)は送
られた信号の種類を特定する。ホットスポットが指定さ
れた場合には、信号がURL特定ブロック(456)へ
送られ、URL特定ブロック(456)は利用者が指定
したホットスポットが格納されているURLを特定す
る。特定されたURLを用いて音声情報の検索を行う
(424)。信号検出ブロック(454)へ他の制御信
号が送られた場合には、目的に応じて音声復号器(41
0)の音声信号合成ブロック(436)あるいはホット
スポット指定ブロック(438)へ信号が送られる。図
7をもとにした本発明が実行されるフローチャートを図
10に示す。 10:受話器と音声情報変換機の接続 音声情報を得たい利用者はまず受話器240をダイヤル
することによって公衆回線網230を通じて音声情報交
換機220へ接続する。 20:利用者によるWWWサイトの指定 利用者には、予め本サービスを開始するためのWWWの
サイトを指定する情報が与えられている。利用者はこの
情報を入力する。 30:音声情報変換機によるWWWサイトのアクセス 音声情報交換機220は利用者の指示に従って、ワール
ド・ワイド・ウエブ250を経由して本サービスを開始
するための情報が格納されている音声情報サーバ210
をアクセスする(224)。
0を介して音声データ部とホットスポット指定部を含む
音声ファイルを受け取る(212)。 50:音声ファイルの音声変換および利用者への提供 受信された音声ファイルには、ホットスポットが含まれ
ている。ホットスポットの音声には、それがホットスポ
ットであることを利用者に伝えるために、認識できるよ
うな音声を重畳して提供する(222)。 60:さらに詳細情報が必用? もし、この音声情報が利用者の所望の情報であり、さら
なる詳細情報が不要ならば、利用者の目的は達成された
ことになり、これで音声情報の検索は終了する。そうで
はなく、さらに詳細情報が必要ならばステップ70へ行
く。 70:利用者によるホットスポットの指定 利用者は、ホットスポットを認識しそれが詳細情報を聞
きたい所望の語句である時にはプッシュホン受話器の
「*」を押す。詳細情報を有する語句(ホットスポッ
ト)の発音直後は間を置く。これは利用者がその語句を
認識し反応するまでのタイムラグが必要なためである。
交換機(220)へ信号が送られる(242)。音声情
報交換機220では利用者から指定されたホットスポッ
トを検出し、それに対応するURLを特定する。ステッ
プ30へもどり、ワールド・ワイド・ウエブ250を通
じてそのURLに対応する音声ファイルが格納されてい
るサイトをアクセスする(224)。以下ステップ30
からステップ80を繰り返すことにより、利用者は所望
の音声による情報を入手することが出来る。
「#」および「*」と数字ボタンの組み合わせて使用す
ることにより、様々な制御信号を音声情報交換機220
に送ることが出来る。1例として、「#0」:ホームペ
ージへ戻る。「#*1」:1つ前の、ホットスポットへ
戻る、「#*2」:2つ前の、ホットスポットへ戻る、
「#1」:ホットスポットを1つスキップする、「#
2」:ホットスポットを2つスキップする等の制御信号
を送ることができる。また「*」と「#」を同時に押す
ことによって音声情報交換機220からのメニュー・コ
ントロール用の音声に移行することができる。この制御
音声は1例として「前のページ、次のページ、またはホ
ームページに戻ることができます」といったアナウンス
がなされる。このとき「前のページ」、「次のペー
ジ」、「ホームページ」の個所がホットスポットになっ
ている。
機220から音声を提供する時に、ホットスポットであ
ることを示すために特殊音を重畳した音声を提供する例
を説明した。しかしながら、利用者にこのことを伝える
ためには様々の方法が考えられる。特殊音を重畳する代
わりに、本文全体は男性の発生音で作成し、ホットスポ
ットの部分は女性の発生音へ変えることによって、それ
を伝えることも出来る。また聴覚に訴える音ではなく利
用者の他の五感に訴えて、ホットスポットであることを
伝えることが出来る。1実施例として受話器にバイブレ
ータを取り付けることにより振動によって伝える事が出
来る。あるいは、ランプ等を取付けることによりランプ
等の点灯により視覚に訴えることもできる。
内部ブロック図を示す。音声情報交換機から送られた信
号(518)には、可聴音声信号だけではなくホットス
ポットの送信時には、人間の聴覚には聞こえない音が重
畳されている。信号分離ブロック(522)で、その音
を分離・検出する。分離された信号がトリガとなり、駆
動ブロック(526)を通して、体感信号発生ブロック
(528)が駆動される。体感信号発生ブロック(52
8)は、利用者に受話器を機械的に振動させることによ
って、現在提供されている語句がホットスポットである
ことを知らせる。体感信号発生ブロック(528)は機
械的な振動には限らない。例えば、ランプの点灯によっ
て利用者の視覚に訴えることも出来る。
チャートのステップ70において、発声音制御モードに
切り替えることにより、プッシュホンのボタンを押す代
わりに利用者の発声音によって制御することも出来る。
実施例4では、「**」と2回押すと、モードが切り替
わり、利用者の発声音による制御が可能になる。そのと
きは「#」を押す代わりに、「それ」と発声する。制御
音声はこれ以外にも「まえ」、「つぎ」、「ホーム」等
がある。図9のブロック図を用いて説明する。受話器か
ら「**」と2回押すと発生音制御モードに切り替わ
る。制御信号である発声音が、ホットスポット検出器
(420)内の信号検出ブロック(454)へ送られ
る。音声認識ブロック(456)は信号検出ブロック
(454)から送られる信号を認識しその結果を信号検
出ブロック(454)戻す。信号検出ブロック(45
4)は認識された信号に従って次のステップの処理を進
める。音声認識は上に述べたように単純な発声音のみを
用い、既存の技術を適用することにより実施できる。こ
れによりベットの上に寝ていて手足が不自由な状態でも
情報検索及び情報入手が可能である。
ド・ワイド・ウエブに限定されることなく、幅広く応用
できることは明らかである。上記以外の具体的な応用例
として、製品のサポート・オフィス案内、天気情報など
を直接音声で提供するなど、応用例には枚挙に暇がな
い。本願発明により、ユーザの使い勝手も大幅に向上さ
れることは明らかである。また、音声情報提供手段は公
衆回線網を使い、音声情報検索手段、および音声情報格
納手段は音声情報交換手段に内蔵することも出来る。あ
る製品のサポート・オフィス案内を例にとると次のよう
になる。「お客様のお住まいのエリアが読み上げられた
時、#を押してください、東京地区、神奈川地区、埼玉
地区、山梨地区」とアナウンスされる。所望のエリアが
読み上げられた時に、「#」を押しそのエリアを指定し
さらに詳細エリアを指定していく。これらの操作を繰り
返すことによって、所望のサポート・オフィスの電話番
号がより早く入手できる。「#」を活用するとさらに効
率よく選択できる。この時アナウンスされる文章は、普
通の文章として記述できるので利用者はより自然に情報
を探すことができる。
次のような効果が期待できる。 1)利用者の所望する音声情報の検索および提供が、容
易な操作方法で、広い範囲の情報に対し、より詳細に出
来る。本方法は、音声情報を提供する場合に広い応用範
囲に応用できる。 2)利用者は、端末機がなくても音声情報受信手段さえ
あれば世界中に張り巡らされたワールド・ワイド・ウエ
ブを介して、必要な情報の検索および入手が出来る。 3)ハンディキャップのある人も、音声情報受信手段さ
えあればワールド・ワイド・ウエブを介して必要な音声
情報の検索・入手が出来る。
ある。
る。
ある。
る。
る。
る。
示す図である。
る。
る。
サイト 434:音声ファイル分離ブロック 436:音声信号合成ブロック 437:D/A変換ブロック 438:ホットスポット指定ブロック 454:信号検出ブロック 456:URL特定ブロック 522:信号分離ブロック 528:体感信号発声ブロック
Claims (12)
- 【請求項1】音声情報格納手段、音声情報検索手段、音
声情報提供手段、音声情報伝達手段、及び音声情報受信
手段を有する装置を用いて、以下の(a)ないし(h)
の工程を行うことにより、音声情報の検索及び提供を行
うことを特徴とする方法、(a)前記音声情報受信手段
を音声情報伝達手段を経由して前記音声情報提供手段へ
接続する工程、(b)前記音声情報受信手段から前記音
声情報提供手段へ前記音声情報格納手段を指定する工
程、(c)前記音声情報提供手段が音声情報検索手段を
経由して前記音声情報格納手段を検索する工程(d)前
記音声情報提供手段が音声情報検索手段を経由して前記
音声情報格納手段からの音声ファイルを受信する工程、
(e)前記音声情報提供手段が前記音声ファイルを音声
情報に変換し、前記音声情報伝達手段経由で前記音声情
報受信手段へ提供する工程であって、詳細音声情報を有
する語句の音声変換時には、詳細情報を有しない語句の
音声変換時とは利用者が識別できる手段を用いて、前記
音声情報受信手段へ提供する工程、(f)前記音声情報
提供手段によって、提供される音声情報の中で、利用者
が詳細情報を検索したい所望の語句を検出したときに、
前記所望の語句を指定し前記音声情報提供手段に前記音
声情報伝達手段経由で伝える工程、(g)前記音声情報
提供手段が前記指定された所望の語句を検出し、前記指
定された所望の語句するが格納されている手段を特定す
る工程(h)利用者が所望の音声情報を得るまで(c)
ないし(g)を繰り返す工程。 - 【請求項2】請求項1に記載の音声により情報の検索及
び提供を行う方法において、前記音声情報格納手段には
1つまたは複数の音声ファイルが格納されており、該音
声ファイルには一つまたは複数の音声データ部及び1つ
または複数のホットスポット指定部が含まれており、 該ホットスポット指定部はヘッダ部、始点情報部、終点
情報部、ホットスポット長情報、および詳細情報格納場
所情報部を含み、前記始点情報部は前記詳細情報を有す
る語句の音声変換の開始情報を含み、前記終点情報部は
前記詳細情報を有する語句の音声変換の終了情報を含
み、前記ホットスポット長情報はホットスポットのバイ
ト数あるいは時間長を含み、前記詳細情報格納場所情報
部は前記詳細情報を有する語句が指定された時に検索す
る音声情報格納手段を特定する情報を含み、 前記音声データ部は提供すべき音声データおよび前記詳
細情報を有する語句を含むことを特徴とする方法。 - 【請求項3】請求項1に記載の音声により情報の検索及
び提供を行う方法において、前記音声情報検索手段はワ
ールド・ワイド・ウエブであり、前記音声情報格納手段
は前記ワールド・ワイド・ウエブに接続されたサーバ上
にあり、各サーバに前記音声ファイルを含むことを特徴
とする方法。 - 【請求項4】請求項1に記載の音声により情報の検索及
び提供を行う方法において、前記音声情報提供手段は、
前記詳細情報を有する語句の音声には、詳細情報を有し
ない語句の音声とは、利用者が識別できるように異なる
音声変換を行って音声情報を提供することを特徴とする
方法。 - 【請求項5】請求項1に記載の音声により情報の検索及
び提供を行う方法において、前記音声情報受信手段は、
前記音声情報受信手段を振動させる手段を有し、前記音
声情報提供手段から前記詳細音声情報を有する語句を受
信した時、前記音声情報受信手段を振動させることによ
り、利用者に該語句が前記詳細音声情報を有する語句で
あることを伝えることを特徴とする方法。 - 【請求項6】請求項1に記載の音声により情報の検索及
び提供を行う方法において、前記音声情報伝達手段は公
衆回線網であることを特徴とする方法。 - 【請求項7】請求項1に記載の音声により情報の検索及
び提供を行う方法において、前記語句を指定する工程は
音声情報受信手段のボタンを押すこと、あるいは利用者
の発声音のいずれか1つあるいは双方によって指定する
ことを特徴とする方法。 - 【請求項8】音声情報格納手段、音声情報検索手段、音
声情報提供手段、音声情報伝達手段、及び音声情報受信
手段を有する装置であって、以下の(a)ないし(h)
の工程を行うことにより、音声情報の検索及び提供を行
うことを特徴とする装置、(a)前記音声情報受信手段
を音声情報伝達手段を経由して前記音声情報提供手段へ
接続する工程、(b)前記音声情報受信手段から前記音
声情報提供手段へ前記音声情報格納手段を指定する工
程、(c)前記音声情報提供手段が音声情報検索手段を
経由して前記音声情報格納手段を検索する工程(d)前
記音声情報提供手段が音声情報検索手段を経由して前記
音声情報格納手段からの音声ファイルを受信する工程、
(e)前記音声情報提供手段が前記音声ファイルを音声
情報に変換し、前記音声情報伝達手段経由で前記音声情
報受信手段へ提供する工程であって、詳細音声情報を有
する語句の音声変換時には、詳細情報を有しない語句の
音声変換時とは利用者が識別できる手段を用いて、前記
音声情報受信手段へ提供する工程、(f)前記音声情報
提供手段によって、提供される音声情報の中で、利用者
が詳細情報を検索したい所望の語句を検出したときに、
前記所望の語句を指定し前記音声情報提供手段に前記音
声情報伝達手段経由で伝える工程、(g)前記音声情報
提供手段が前記指定された所望の語句を検出し、前記指
定された所望の語句するが格納されている手段を特定す
る工程、(h)利用者が所望の音声情報を得るまで
(c)ないし(g)を繰り返す工程。 - 【請求項9】請求項8に記載の音声により情報の検索及
び提供を行う装置において、前記音声情報提供手段は以
下(a)ないし(e)の手段を有することを特徴とする
装置、(a)詳細情報を有する語句の音声情報提供時に
は、詳細情報を有しない語句の音声情報提供時とは、利
用者が識別できる手段で、前記音声情報伝達手段経由で
前記音声情報受信手段へ伝える手段、(b)前記利用者
によって指定された所望の語句を検出し、前記指定され
た所望の語句が格納されている情報格納手段を特定する
手段、(c)前記音声情報検索手段を経由して前記音声
情報格納手段を検索する手段(e)前記検索された音声
情報を受信する手段。 - 【請求項10】請求項8に記載の音声により情報の検索
及び提供を行う装置において、前記音声情報提供手段
は、前記詳細情報を有する語句の音声には、詳細情報を
有しない語句の音声とは、利用者が識別できるように異
なる音声変換を行って音声情報を提供することを特徴と
する装置。 - 【請求項11】請求項8に記載の音声により情報の検索
及び提供を行う装置において、前記音声情報受信手段
は、前記音声情報受信手段を振動させる手段を有し、前
記音声情報提供手段から前記詳細音声情報を有する語句
を受信した時、前記音声情報受信手段を振動させること
により、利用者に該語句が前記詳細音声情報を有する語
句であることを伝えることを特徴とする装置。 - 【請求項12】請求項8に記載の音声により情報の検索
及び提供を行う装置において、前記音声情報受信手段
は、発光手段を有し、前記音声情報提供手段から前記詳
細音声情報を有する語句を受信した時、前記発光手段を
動作させることにより、利用者に該語句が前記詳細音声
情報を有する語句であることを伝えることを特徴とする
装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP04658198A JP4197195B2 (ja) | 1998-02-27 | 1998-02-27 | 音声情報の提供方法 |
US09/257,327 US6249764B1 (en) | 1998-02-27 | 1999-02-25 | System and method for retrieving and presenting speech information |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP04658198A JP4197195B2 (ja) | 1998-02-27 | 1998-02-27 | 音声情報の提供方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH11282648A true JPH11282648A (ja) | 1999-10-15 |
JP4197195B2 JP4197195B2 (ja) | 2008-12-17 |
Family
ID=12751279
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP04658198A Expired - Fee Related JP4197195B2 (ja) | 1998-02-27 | 1998-02-27 | 音声情報の提供方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US6249764B1 (ja) |
JP (1) | JP4197195B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001282503A (ja) * | 2000-03-31 | 2001-10-12 | Canon Inc | データ処理装置及び方法、ブラウザシステム、ブラウザ装置、記録媒体 |
JP2002057811A (ja) * | 2000-08-09 | 2002-02-22 | Jiyakosu:Kk | 声紋電話システム |
JP2003044496A (ja) * | 2001-07-26 | 2003-02-14 | Nec Corp | 情報サービス提供方法、装置及びプログラム |
JP2008505566A (ja) * | 2004-06-30 | 2008-02-21 | グレネイル エレクトロニクス インコーポレイテッド | 地域分散型ボイスメッセージングシステムにおけるメッセージ耐久性及び取り出し |
Families Citing this family (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8421158B2 (en) * | 1998-12-21 | 2013-04-16 | Megica Corporation | Chip structure with a passive device and method for forming the same |
US8178435B2 (en) | 1998-12-21 | 2012-05-15 | Megica Corporation | High performance system-on-chip inductor using post passivation process |
US6303423B1 (en) | 1998-12-21 | 2001-10-16 | Megic Corporation | Method for forming high performance system-on-chip using post passivation process |
US7531417B2 (en) * | 1998-12-21 | 2009-05-12 | Megica Corporation | High performance system-on-chip passive device using post passivation process |
US6618478B1 (en) * | 1999-09-27 | 2003-09-09 | Ameritech Corporation | Telephone set having a help key and methods and systems for use therewith |
US7330815B1 (en) | 1999-10-04 | 2008-02-12 | Globalenglish Corporation | Method and system for network-based speech recognition |
US20030078779A1 (en) * | 2000-01-04 | 2003-04-24 | Adesh Desai | Interactive voice response system |
US7120629B1 (en) * | 2000-05-24 | 2006-10-10 | Reachforce, Inc. | Prospects harvester system for providing contact data about customers of product or service offered by business enterprise extracting text documents selected from newsgroups, discussion forums, mailing lists, querying such data to provide customers who confirm to business profile data |
US7082427B1 (en) | 2000-05-24 | 2006-07-25 | Reachforce, Inc. | Text indexing system to index, query the archive database document by keyword data representing the content of the documents and by contact data associated with the participant who generated the document |
US7003517B1 (en) * | 2000-05-24 | 2006-02-21 | Inetprofit, Inc. | Web-based system and method for archiving and searching participant-based internet text sources for customer lead data |
US7330850B1 (en) | 2000-10-04 | 2008-02-12 | Reachforce, Inc. | Text mining system for web-based business intelligence applied to web site server logs |
US7043531B1 (en) | 2000-10-04 | 2006-05-09 | Inetprofit, Inc. | Web-based customer lead generator system with pre-emptive profiling |
JP2002366194A (ja) * | 2001-05-30 | 2002-12-20 | Nokia Corp | ハイパーサウンドドキュメント |
US6759275B1 (en) * | 2001-09-04 | 2004-07-06 | Megic Corporation | Method for making high-performance RF integrated circuits |
CA2359544A1 (en) * | 2001-10-22 | 2003-04-22 | Dspfactory Ltd. | Low-resource real-time speech recognition system using an oversampled filterbank |
US7184886B1 (en) * | 2001-12-21 | 2007-02-27 | Garmin Ltd. | Navigation system, method and device with detour algorithm |
EP1475611B1 (en) * | 2003-05-07 | 2007-07-11 | Harman/Becker Automotive Systems GmbH | Method and application apparatus for outputting speech, data carrier comprising speech data |
US20040267563A1 (en) * | 2003-06-30 | 2004-12-30 | Rebecca Dunn | Implementing an effective medical treatment management program |
US20040267564A1 (en) * | 2003-06-30 | 2004-12-30 | Rebecca Dunn | Facilitating effective medical treatment management |
US7355282B2 (en) | 2004-09-09 | 2008-04-08 | Megica Corporation | Post passivation interconnection process and structures |
US8008775B2 (en) | 2004-09-09 | 2011-08-30 | Megica Corporation | Post passivation interconnection structures |
TWI254576B (en) * | 2004-10-22 | 2006-05-01 | Lite On It Corp | Auxiliary function-switching method for digital video player |
US8275618B2 (en) * | 2004-12-22 | 2012-09-25 | Nuance Communications, Inc. | Mobile dictation correction user interface |
US8384189B2 (en) * | 2005-03-29 | 2013-02-26 | Megica Corporation | High performance system-on-chip using post passivation process |
CN1901163B (zh) | 2005-07-22 | 2011-04-13 | 米辑电子股份有限公司 | 连续电镀制作线路组件的方法及线路组件结构 |
WO2008002098A1 (en) * | 2006-06-29 | 2008-01-03 | Lg Electronics, Inc. | Method and apparatus for an audio signal processing |
CN101727904B (zh) * | 2008-10-31 | 2013-04-24 | 国际商业机器公司 | 语音翻译方法和装置 |
KR101195415B1 (ko) * | 2010-12-29 | 2012-10-29 | 포항공과대학교 산학협력단 | 원자층 증착을 이용한 엑스선(Xray)/감마선(γray)집속 광학계의 제조방법 |
CN105957530B (zh) | 2016-04-28 | 2020-01-03 | 海信集团有限公司 | 一种语音控制方法、装置和终端设备 |
US10708340B2 (en) * | 2017-11-30 | 2020-07-07 | International Business Machines Corporation | Methods and systems for improving efficiency in data transfers |
CN112767924A (zh) * | 2021-02-26 | 2021-05-07 | 北京百度网讯科技有限公司 | 语音识别方法、装置、电子设备及存储介质 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5890123A (en) * | 1995-06-05 | 1999-03-30 | Lucent Technologies, Inc. | System and method for voice controlled video screen display |
US5838682A (en) * | 1995-11-28 | 1998-11-17 | Bell Atlantic Network Services, Inc. | Method and apparatus for establishing communications with a remote node on a switched network based on hypertext dialing information received from a packet network |
US5983176A (en) * | 1996-05-24 | 1999-11-09 | Magnifi, Inc. | Evaluation of media content in media files |
US5903892A (en) * | 1996-05-24 | 1999-05-11 | Magnifi, Inc. | Indexing of media content on a network |
US5799063A (en) * | 1996-08-15 | 1998-08-25 | Talk Web Inc. | Communication system and method of providing access to pre-recorded audio messages via the Internet |
US5926789A (en) * | 1996-12-19 | 1999-07-20 | Bell Communications Research, Inc. | Audio-based wide area information system |
US5983190A (en) * | 1997-05-19 | 1999-11-09 | Microsoft Corporation | Client server animation system for managing interactive user interface characters |
-
1998
- 1998-02-27 JP JP04658198A patent/JP4197195B2/ja not_active Expired - Fee Related
-
1999
- 1999-02-25 US US09/257,327 patent/US6249764B1/en not_active Expired - Lifetime
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001282503A (ja) * | 2000-03-31 | 2001-10-12 | Canon Inc | データ処理装置及び方法、ブラウザシステム、ブラウザ装置、記録媒体 |
US7251602B2 (en) | 2000-03-31 | 2007-07-31 | Canon Kabushiki Kaisha | Voice browser system |
JP2002057811A (ja) * | 2000-08-09 | 2002-02-22 | Jiyakosu:Kk | 声紋電話システム |
JP2003044496A (ja) * | 2001-07-26 | 2003-02-14 | Nec Corp | 情報サービス提供方法、装置及びプログラム |
JP2008505566A (ja) * | 2004-06-30 | 2008-02-21 | グレネイル エレクトロニクス インコーポレイテッド | 地域分散型ボイスメッセージングシステムにおけるメッセージ耐久性及び取り出し |
Also Published As
Publication number | Publication date |
---|---|
US6249764B1 (en) | 2001-06-19 |
JP4197195B2 (ja) | 2008-12-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4197195B2 (ja) | 音声情報の提供方法 | |
KR101027548B1 (ko) | 통신 시스템용 보이스 브라우저 다이얼로그 인에이블러 | |
JP3936718B2 (ja) | インターネットコンテンツのアクセスに関するシステム及び方法 | |
KR100425378B1 (ko) | 정보 분배 방법, 정보 분배 시스템, 정보 분배 서버, 이동통신망 시스템 및 통신 서비스 제공 방법 | |
CA2372544C (en) | Information access method, information access system and program therefor | |
WO2000033548A9 (en) | System for and method of creating and browsing a voice web | |
US6823370B1 (en) | System and method for retrieving select web content | |
EP0854417A2 (en) | Voice activated control unit | |
JPH09321894A (ja) | 情報処理装置 | |
US20070294064A1 (en) | Automatic location-specific content selection for portable information retrieval devices | |
JP2003163745A (ja) | 電話機、対話応答装置、対話応答端末および対話応答システム | |
GB2317070A (en) | Voice processing/internet system | |
JP2000510270A (ja) | 音声による広域情報システム | |
JPH11249867A (ja) | 音声ブラウザシステム | |
EP0959401A2 (en) | Audio control method and audio controlled device | |
JP3452250B2 (ja) | 無線携帯端末通信システム | |
JP4392190B2 (ja) | データコンテンツ送信装置およびデータコンテンツ送信プログラム | |
JP2002099531A (ja) | 単語登録システム、これに用いられる単語登録装置及び単語送信装置並びに単語登録方法 | |
JPH10322478A (ja) | 音声によるハイパーテキストアクセス装置 | |
KR20000018212A (ko) | 전화를 이용한 음악정보 검색시스템 | |
JPH10301944A (ja) | Wwwブラウザ装置 | |
JPH10164249A (ja) | 情報処理装置 | |
KR20000000048A (ko) | 동시 음성 앵커를 이용하는 오디오 웹 브라우저 시스템 및 오디오 웹 브라우저 구현방법 | |
JP2000231526A (ja) | コンテンツ登録装置、および、そのプログラムを記録した記録媒体 | |
JP2001312443A (ja) | 情報配信方法および情報配信システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20041108 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060704 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20061004 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20061010 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20061228 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20071102 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071113 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20071220 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080924 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080925 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111010 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121010 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121010 Year of fee payment: 4 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131010 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |