JPH11282648A - 音声による情報案内方法および装置 - Google Patents

音声による情報案内方法および装置

Info

Publication number
JPH11282648A
JPH11282648A JP10046581A JP4658198A JPH11282648A JP H11282648 A JPH11282648 A JP H11282648A JP 10046581 A JP10046581 A JP 10046581A JP 4658198 A JP4658198 A JP 4658198A JP H11282648 A JPH11282648 A JP H11282648A
Authority
JP
Japan
Prior art keywords
information
voice
voice information
phrase
providing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10046581A
Other languages
English (en)
Other versions
JP4197195B2 (ja
Inventor
Naohiko Kamae
尚彦 釜江
Akira Hirayama
亮 平山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HP Inc
Original Assignee
Hewlett Packard Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hewlett Packard Co filed Critical Hewlett Packard Co
Priority to JP04658198A priority Critical patent/JP4197195B2/ja
Priority to US09/257,327 priority patent/US6249764B1/en
Publication of JPH11282648A publication Critical patent/JPH11282648A/ja
Application granted granted Critical
Publication of JP4197195B2 publication Critical patent/JP4197195B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • G06F16/94Hypermedia
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9558Details of hyperlinks; Management of linked annotations
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue

Abstract

(57)【要約】 【課題】音声情報提供は、省力化の要求とあいまって様
々な分野で応用されている。しかしながら現状の情報提
供方法には、機能上、操作上の問題点があり音声情報提
供の手段としては不十分である。これは機能的には階層
的な音声情報の検索が困難であることまた利用者からの
操作が容易でないためである。 【解決手段】本発明では提供する音声情報の中に、詳細
情報を含む語句であることを示すホットスポットを含ま
せる。利用者は音声情報を聞きながらホットスポットを
認識し、所望のホットスポットを指定することが出来
る。音声情報提供手段は、指定語句を検出し指定語句の
詳細音声情報の格納場所を特定する。さらに音声情報提
供手段は、該詳細音声情報検索、受信しホットスポット
を含む音声情報を利用者に提供する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は音声による情報検索およ
び情報提供に関する、より詳細には利用者の所望する情
報を指定、検出、検索および提供する方法および装置に
関する。
【0002】
【従来の技術】近年インターネットの普及により様々な
情報が、家庭を含む様々な場所からパーソナル・コンピ
ュータを使って簡単に入手できるようになった。つまり
世界中に張り巡らされたワールド・ワイド・ウェブを経
由してブラウザにより簡単に情報の検索、入手が可能に
なった。インターネットで検索・表示された情報の中
で、さらに詳細情報を含む語句は、そのことが認識でき
るように、アンダーラインを引いたりあるいは色を変え
るなどの工夫をして表示されている。このように表示さ
れた語句を「ホットスポット」と呼ぶ。このホットスポ
ットの上にポインタ(またはカーソル)を持ってきて、
そこでマウスをクリックするとその語句にリンクされた
詳細情報提供サイトにジャンプする。これによって、さ
らにホットスポットに関する詳細情報の入手が可能とな
る。
【0003】しかしながら、これらを実現するためには
パーソナル・コンピュータなどの端末機が必要である。
端末機のない場所からは当然のことながら情報の検索・
入手は出来ない。また、端末機があっても、目で見なが
ら手動で操作し指定していかないと検索できないのは当
然であり、ハンデキャップのある人には利用できない場
合がある。例えば、現在のブラウザではマウスを使って
画面を見ながら指定することが前提になっている。目の
見えない人には使えない。また、寝たきりの人にとって
は、パーソナル・コンピュータの前に座って、マウスを
操作しキーボードを叩くことは負担となる場合もある。
これらの問題を解決するために、音声による情報を提供
することが考えられる。
【0004】自動化された音声による情報提供は、省力
化の要求とあいまって様々な分野で応用されている。し
かしながら現状の電話による情報提供方法には、機能上
の問題点があり音声情報提供の手段としては不十分であ
る。この理由のひとつとして、上述のホットスポットを
音声情報の中に含ませることが困難であることがあげら
れる。現在の音声情報の提供は簡単な番号案内あるい
は、人間による応答までのつなぎの役割しか果していな
い。実際の音声情報提供を例にとって説明する。一例と
して音声による情報案内で説明する。これらの音声情報
案内では、全体のメニュー提示をするときには「お客様
のお住まいのエリアを発信音の後に入力してください、
1.東京地区、2.神奈川地区、3.埼玉地区、4.千
葉地区、5.山梨地区」とアナウンスされ、その後、発
信音の後に利用者が該当する番号を入力していた。この
ような提供方法を用いる理由は、ホットスポットがメニ
ューの音声情報の中に含まれていないためである。この
方法の欠点はメニューの全体がわからないため、全部の
メニューを最後まで聞く必要がある。また全部のメニュ
ーを聞いた後に番号を押すために必要な番号を記憶して
おく必要がある。メニューが長くなると記憶違いによる
エラーが発生する可能性がある。そのために、簡単なメ
ニューしか提供できない。また、1つ前のメニューに戻
る操作が面倒であるなど操作性上の問題もある。この様
に現在の音声による情報提供方法は、機能上あるいは操
作上の問題があり、必要な情報を広く深く、利用者のニ
ーズに合わせて提供出来るものではない。
【0005】
【発明が解決しようとする課題】本発明の主目的は、音
声情報提供において、利用者による必要情報の指定、検
出、検索および提供に関して改善した方法及び装置を提
案することである。本発明によれば、利用者の所望する
幅広い内容的に対して詳しい音声情報を、容易な操作方
法で提供で出来る。本発明の他の目的はインターネット
経由でブラウザを使って情報検索を行うことが出来るの
と同じように、音声による情報検索および情報提供を実
現するための方法及びシステムを提供することである。
【課題を解決するための手段】
【0006】これらの問題を解決するために、本発明で
は、提供する音声情報の中にホットスポットを含ませ
る。利用者は音声情報を聞きながらホットスポットを認
識し、所望のホットスポットを指定することが出来る。
音声情報提供手段は利用者によって指定されたホットス
ポットを検出し、ホットスポットで指定された語句に関
する詳細情報が格納されている場所を特定する。音声情
報提供手段は特定された格納場所を検索し、詳細情報を
受信する。音声情報提供手段は受信された詳細情報を利
用者に提供する。このとき提供される詳細情報には、同
様にホットスポットが含まれているので、利用者はさら
に詳細情報を指定できる。
【0007】これを実現するためには、提供する音声情
報の中にホットスポットを含ませ、それが利用者にホッ
トスポットであることを認識させる必要がある。このた
めにホットスポットの音声提供時には、そのことが認識
できる音を重畳させる。あるいは、音声のトーンを変え
ることも出来る。例えば、本文は男性の声で提供しホッ
トスポット部分は女性の声で提供することも出来る。さ
らには利用者の他の五感に訴えることも出来る。ホット
スポットの音声提供時には、音声情報受信手段を機械的
に振動させる、あるいは、ランプを点灯させることも可
能である。利用者が所望のホットスポットを指定するた
めには、利用者の発声音による制御も可能である。また
音声情報受信手段がプッシュホン受話器である場合に
は、特定のボタンを押すことによって指定することも出
来る。
【0008】
【実施の形態】まず、以下に説明する実施例で使われる
音声ファイルについて説明する。図1に示すように、音
声ファイルは音声データ及びホットスポット指定部から
構成されている。音声ファイルの実施例として次の4つ
の例を挙げることが出来る。 1)1つの音声ファイル中、ファイルの先頭部分にホッ
トスポット指定部をまとめて格納し、続いて音声データ
部を格納する方法(図2A、音声ファイル実施例1)。
ホットスポット指定部にはヘッダ部、ホットスポットの
始点情報、終点情報、詳細情報の格納場所情報などが含
まれる(図2B)。ヘッダ部にはホットスポットのシーケ
ンス番号などが含まれる。ホットスポットの始点情報に
は、ホットスポットの開始時間、あるいは直前のホット
スポット終了から次のホットスポット開始までのバイト
数などが含まれる。同様にホットスポットの終点情報に
は、ホットスポットの終了時間、あるいはホットスポッ
ト開始から終了までのバイト数などが含まれる。
【0009】2)1つの音声ファイル中に、音声データ
と、ホットスポット指定データとを分散して、格納する
方法(図3A、音声ファイル実施例2)。この場合、音声
データ部とホットスポット指定部を区別するため、各ホ
ットスポット指定部の最初の部分にスタートビット(複
数)を付ける。スタートビットは特定のビットパターン
(例えば16進数でFF)とし、音声データには、この特
定のビットパターンは使わないもとのする。そのビット
パターンがデータ中にあらわれたときは、ホットスポッ
ト指定部の開始であると判断する。そのビットパターン
の後に、そのホットスポット指定部で指定されるホット
スポットの長さ情報、及びそのホットスポット指定部で
指定される語句の詳細情報格納場所情報などが格納され
ている(図3B)。ホットスポットの長さの情報として、
ホットスポットのバイト長、あるいは、ホットスポット
の時間長などの情報を格納することが出来る。
【0010】3)音声データとホットスポット指定部を
別のファイルとする方法。例えば、音声データをYYY.au
というファイルとし、ホットスポット指定部をXXX.hsと
いう名前で格納し、音声情報提供手段が、両方のファイ
ルを参照して、処理を行なう(図4、音声ファイル実施
例3)。これらのファイルの内容は、音声ファイル実施
例1、及び音声ファイル実施例2で示したものと同様で
ある。4)音声データとホットスポット指定データを別
のファイルとし、音声データの指定及びホットスポット
指定は、特定の記述言語で書かれたファイル中に記述す
る方法(図5、音声ファイル実施例4)。この方法で
は、まず、音声情報提供手段は、その記述言語で書かれ
たファイルを音声情報格納手段からダウンロードし参照
する。それには、音声データが格納されている場所(本
実施例ではURLアドレス、URL:ユニフォーム・リソ
ース・ロケータ以下、URL)とホットスポット指定情
報とが含まれている。それにしたがって、音声情報検索
手段を通じて音声情報格納手段から音声データを読み出
し、ホットスポット処理を行なう。以下に音声データと
ホットスポット指定のための言語の例を示す。これは、
ワールドワイドウェブで使われているHTML言語に類似し
ているが、音声データの指定と、音声データ中のホット
スポット指定を記述できるように記述方法を拡張してあ
る。ここでは、この言語をHSML(HyperSpeech Markup
Language)言語と呼ぶ。
【0011】 −−−−−−−−HSML言語例(weather.hsml)−−−−−−−− <HSML> <HEAD> <TITLE>明日の天気</TITLE> </HEAD> <BODY> <AUDIO src="weather.au"> <AUDIOMAP> <AUDIOAREA start="00:00:20" end="00:00:30" href="tokyo.au"> <AUDIOAREA start="00:00:35" end="00:00:45" href="kanagawa.au"> <AUDIOAREA start="00:00:50" end="00:01:00" href="weekly.hsml"> </AUDIOMAP> </BODY> </HSML>
【0012】このように記述されたファイルが、音声情
報格納手段によって、例えば、weather.hsmlという名前
で格納されている。上記、<HSML>と</HSML>で囲まれた
部分はこの言語の始まりと終わりを示す。<HEAD>と</HE
AD>で囲まれた部分は、ヘッダ部であることを示し、<TI
TLE>と</TITLE>で囲まれた部分は、タイトルを示し、<B
ODY>と</BODY>で囲まれた部分は、本文を示し、これら
は、HTML言語と同様の定義である。本文中、<AUDIO src
="weather.au">は、音声データの所在をしめしており、
この場合、音声データのURLアドレスはweather.auであ
ることを示している。<AUDIOMAP>と</AUDIOMAP>で囲ま
れた部分は、この部分が音声データに対するホットスポ
ット指定データであることを示している。
【0013】<AUDIOAREAで始まる各行が、それぞれ、ホ
ットスポット指定データである。はじめの行は、weathe
r.auという音声データの0時間0分20秒から0時間0
分30秒の間がホットスポットであり、そのホットスポ
ットが指示されたとき、URLアドレスがtokyo.auである
音声データを再生することを示している。次の行も同様
に、weather.auという音声データの35秒から45秒の間
がホットスポットであり、そのホットスポットが指示さ
れたとき、URLアドレスがkanagawa.auである音声データ
を再生することを示している。次の行は、weather.auと
いう音声データの50秒から1分0秒の間がホットスポッ
トであり、そのホットスポットが指示されたとき、URL
アドレスがweelky.hsmlというHSML言語で書かれたファ
イルを解釈して実行することを示している。weelky.hsm
lファイルには、weather.hsmlと同様に、音声データの
所在の情報やホットスポット指定データが含まれてい
る。以上、音声ファイルのいくつかの構造の例について
説明したが、以下これらを使った実施例について説明す
る。
【0014】(実施例1)図6には、本発明で用いる音
声情報格納手段(110)、音声情報検索手段(15
0)、音声情報提供手段(120)、音声情報伝達手段
(130)、及び音声情報受信手段(140)が示され
ている。音声情報格納手段(110)には予め本発明に
従ったフォーマットで音声ファイルが格納されている。
音声情報提供手段(120)は、音声情報格納手段(1
10)に格納されている音声ファイルを受信し、受信し
た音声ファイルを音声情報に変換する。音声情報受信手
段(140)へ提供するとき、詳細音声情報を有する語
句(ホットスポット)の音声変換時には、詳細情報を有
しない語句の音声変換時とは、利用者が識別できる手段
で、音声情報受信手段(140)へ伝える(122)。
次に利用者は音声情報提供手段(120)によって提供
される音声情報の中で、利用者が詳細情報を検索したい
所望の語句を検出したときには、その所望の語句を指定
し音声情報提供手段(120)に伝える(142)。
【0015】音声情報提供手段(120)は利用者が指
定した語句を検出し、指定された語句が格納されている
場所を特定する。音声情報提供手段(120)は音声情
報格納手段(110)を検索し(124)、音声情報格
納手段(110)からの所望の音声ファイルを受信する
(112)。音声情報提供手段(120)は音声ファイ
ルを音声情報に変換し、利用者に提供する。音声ファイ
ルを音声情報に変換するときには、前述と同様に、詳細
音声情報を有する語句(ホットスポット)の音声変換時
には、詳細情報を有しない語句の音声変換時とは利用者
が識別できる手段で、音声情報受信手段(140)へ伝
える。この操作を、利用者が所望の情報を入手するまで
繰り返す。本発明は、さらに音声情報伝達手段(13
0)として、公衆通信網、構内通信網あるいはその他の
情報伝達手段を、音声情報検索手段(150)として、
インターネット、イントラネットあるいはその他の情報
検索手段を用いて容易に広範に適用可能である。
【0016】(実施例2)図7に示されるように、実施
例2では、音声情報検索手段としてインターネットで利
用されるワールド・ワイド・ウエブ(250)を、音声
情報伝達手段として公衆回線網(230)を、音声情報
格納手段としてワールド・ワイド・ウエブに接続されて
いる各サイト(210)を、音声情報提供手段として音
声情報交換機(220)を、及び音声情報受信手段とし
て公衆回線網に接続されている受話器(240)として
いる。ワールド・ワイド・ウエブにおいて、URLで指
定される各サイトには、通常、画像情報、文書情報、音
響情報などが格納されている。これらの情報は利用者へ
送られ、利用者の端末機上で画像情報、文書情報、音響
情報などが再生される。本実施例においては、図8に示
されるように、各URLのサイトには画像情報だけでは
なく複数の音声ファイル(300)も格納されている。
【0017】図9には、音声情報交換機400の機能ブ
ロック図を示す。音声情報交換機400は音声復号器4
10、及びホットスポット検出器420を有する。受話
機(440)は公衆回線網に接続されている音声情報受
信手段である。また、ワールド・ワイド・ウエブ・サイ
ト(430)はワールド・ワイド・ウエブに接続されて
いる音声情報格納手段である。各サイト(430)には
複数の音声ファイルが格納されている(図8)。音声復
号器(410)はワールド・ワイド・ウエブに接続され
ている各サイト(430)からの音声ファイルを受信す
る(412)。受信した音声ファイルは音声ファイル分
離ブロック(434)へ送られる。音声ファイルの中で
音声データは音声信号合成ブロック(436)へ、ホッ
トスポット指定部はホットスポット指定ブロック(43
8)、及びURL特定ブロック(456)へそれぞれ送
られる。音声データはD/A変換ブロック(437)へ
送られ、アナログ音声に変換され利用者へ送られる。音
声情報を提供している時、ホットスポット部分になる
と、ホットスポット指定ブロックから音声信号合成ブロ
ックへ信号が行く。音声信号合成ブロックは、ホットス
ポット指定ブロックからの信号を受け取ると、特定周波
数の音を重畳するように音声信号を合成する。合成され
た音声信号はD/A変換器へ送られ、特定周波数の音が
重畳されたアナログ信号に変換され、利用者へ送られる
(422)。あるいはアナログ信号に変換することなく
デジタル信号として受話器へ送ることも出来る。
【0018】利用者は音声情報を聞きながら、詳細情報
を知りたいホットスポットになると、それを指定する。
図11に示されるように、プッシュ信号検出ブロック
(542)は利用者が入力した信号を検出する。その情
報は信号合成ブロック(544)を経由して、ホットス
ポット検出器(420)へ送られる。図9に示すように
ホットスポット検出器(420)は、利用者からの信号
(442)を受信し、信号検出ブロック(454)は送
られた信号の種類を特定する。ホットスポットが指定さ
れた場合には、信号がURL特定ブロック(456)へ
送られ、URL特定ブロック(456)は利用者が指定
したホットスポットが格納されているURLを特定す
る。特定されたURLを用いて音声情報の検索を行う
(424)。信号検出ブロック(454)へ他の制御信
号が送られた場合には、目的に応じて音声復号器(41
0)の音声信号合成ブロック(436)あるいはホット
スポット指定ブロック(438)へ信号が送られる。図
7をもとにした本発明が実行されるフローチャートを図
10に示す。 10:受話器と音声情報変換機の接続 音声情報を得たい利用者はまず受話器240をダイヤル
することによって公衆回線網230を通じて音声情報交
換機220へ接続する。 20:利用者によるWWWサイトの指定 利用者には、予め本サービスを開始するためのWWWの
サイトを指定する情報が与えられている。利用者はこの
情報を入力する。 30:音声情報変換機によるWWWサイトのアクセス 音声情報交換機220は利用者の指示に従って、ワール
ド・ワイド・ウエブ250を経由して本サービスを開始
するための情報が格納されている音声情報サーバ210
をアクセスする(224)。
【0019】40:音声ファイルの受信 音声情報交換機220はワールド・ワイド・ウエブ25
0を介して音声データ部とホットスポット指定部を含む
音声ファイルを受け取る(212)。 50:音声ファイルの音声変換および利用者への提供 受信された音声ファイルには、ホットスポットが含まれ
ている。ホットスポットの音声には、それがホットスポ
ットであることを利用者に伝えるために、認識できるよ
うな音声を重畳して提供する(222)。 60:さらに詳細情報が必用? もし、この音声情報が利用者の所望の情報であり、さら
なる詳細情報が不要ならば、利用者の目的は達成された
ことになり、これで音声情報の検索は終了する。そうで
はなく、さらに詳細情報が必要ならばステップ70へ行
く。 70:利用者によるホットスポットの指定 利用者は、ホットスポットを認識しそれが詳細情報を聞
きたい所望の語句である時にはプッシュホン受話器の
「*」を押す。詳細情報を有する語句(ホットスポッ
ト)の発音直後は間を置く。これは利用者がその語句を
認識し反応するまでのタイムラグが必要なためである。
【0020】80:URLの検出 プッシュホン受話器の「*」を押すことにより音声情報
交換機(220)へ信号が送られる(242)。音声情
報交換機220では利用者から指定されたホットスポッ
トを検出し、それに対応するURLを特定する。ステッ
プ30へもどり、ワールド・ワイド・ウエブ250を通
じてそのURLに対応する音声ファイルが格納されてい
るサイトをアクセスする(224)。以下ステップ30
からステップ80を繰り返すことにより、利用者は所望
の音声による情報を入手することが出来る。
【0021】さらに、ステップ70において、利用者は
「#」および「*」と数字ボタンの組み合わせて使用す
ることにより、様々な制御信号を音声情報交換機220
に送ることが出来る。1例として、「#0」:ホームペ
ージへ戻る。「#*1」:1つ前の、ホットスポットへ
戻る、「#*2」:2つ前の、ホットスポットへ戻る、
「#1」:ホットスポットを1つスキップする、「#
2」:ホットスポットを2つスキップする等の制御信号
を送ることができる。また「*」と「#」を同時に押す
ことによって音声情報交換機220からのメニュー・コ
ントロール用の音声に移行することができる。この制御
音声は1例として「前のページ、次のページ、またはホ
ームページに戻ることができます」といったアナウンス
がなされる。このとき「前のページ」、「次のペー
ジ」、「ホームページ」の個所がホットスポットになっ
ている。
【0022】(実施例3)実施例2では、音声情報交換
機220から音声を提供する時に、ホットスポットであ
ることを示すために特殊音を重畳した音声を提供する例
を説明した。しかしながら、利用者にこのことを伝える
ためには様々の方法が考えられる。特殊音を重畳する代
わりに、本文全体は男性の発生音で作成し、ホットスポ
ットの部分は女性の発生音へ変えることによって、それ
を伝えることも出来る。また聴覚に訴える音ではなく利
用者の他の五感に訴えて、ホットスポットであることを
伝えることが出来る。1実施例として受話器にバイブレ
ータを取り付けることにより振動によって伝える事が出
来る。あるいは、ランプ等を取付けることによりランプ
等の点灯により視覚に訴えることもできる。
【0023】図11に実施例を示す。図11は受話器の
内部ブロック図を示す。音声情報交換機から送られた信
号(518)には、可聴音声信号だけではなくホットス
ポットの送信時には、人間の聴覚には聞こえない音が重
畳されている。信号分離ブロック(522)で、その音
を分離・検出する。分離された信号がトリガとなり、駆
動ブロック(526)を通して、体感信号発生ブロック
(528)が駆動される。体感信号発生ブロック(52
8)は、利用者に受話器を機械的に振動させることによ
って、現在提供されている語句がホットスポットである
ことを知らせる。体感信号発生ブロック(528)は機
械的な振動には限らない。例えば、ランプの点灯によっ
て利用者の視覚に訴えることも出来る。
【0024】(実施例4)さらに、図10に示すフロー
チャートのステップ70において、発声音制御モードに
切り替えることにより、プッシュホンのボタンを押す代
わりに利用者の発声音によって制御することも出来る。
実施例4では、「**」と2回押すと、モードが切り替
わり、利用者の発声音による制御が可能になる。そのと
きは「#」を押す代わりに、「それ」と発声する。制御
音声はこれ以外にも「まえ」、「つぎ」、「ホーム」等
がある。図9のブロック図を用いて説明する。受話器か
ら「**」と2回押すと発生音制御モードに切り替わ
る。制御信号である発声音が、ホットスポット検出器
(420)内の信号検出ブロック(454)へ送られ
る。音声認識ブロック(456)は信号検出ブロック
(454)から送られる信号を認識しその結果を信号検
出ブロック(454)戻す。信号検出ブロック(45
4)は認識された信号に従って次のステップの処理を進
める。音声認識は上に述べたように単純な発声音のみを
用い、既存の技術を適用することにより実施できる。こ
れによりベットの上に寝ていて手足が不自由な状態でも
情報検索及び情報入手が可能である。
【0025】(実施例5)本発明は公衆回線網、ワール
ド・ワイド・ウエブに限定されることなく、幅広く応用
できることは明らかである。上記以外の具体的な応用例
として、製品のサポート・オフィス案内、天気情報など
を直接音声で提供するなど、応用例には枚挙に暇がな
い。本願発明により、ユーザの使い勝手も大幅に向上さ
れることは明らかである。また、音声情報提供手段は公
衆回線網を使い、音声情報検索手段、および音声情報格
納手段は音声情報交換手段に内蔵することも出来る。あ
る製品のサポート・オフィス案内を例にとると次のよう
になる。「お客様のお住まいのエリアが読み上げられた
時、#を押してください、東京地区、神奈川地区、埼玉
地区、山梨地区」とアナウンスされる。所望のエリアが
読み上げられた時に、「#」を押しそのエリアを指定し
さらに詳細エリアを指定していく。これらの操作を繰り
返すことによって、所望のサポート・オフィスの電話番
号がより早く入手できる。「#」を活用するとさらに効
率よく選択できる。この時アナウンスされる文章は、普
通の文章として記述できるので利用者はより自然に情報
を探すことができる。
【0026】
【発明の効果】以上説明したように、本発明を用いると
次のような効果が期待できる。 1)利用者の所望する音声情報の検索および提供が、容
易な操作方法で、広い範囲の情報に対し、より詳細に出
来る。本方法は、音声情報を提供する場合に広い応用範
囲に応用できる。 2)利用者は、端末機がなくても音声情報受信手段さえ
あれば世界中に張り巡らされたワールド・ワイド・ウエ
ブを介して、必要な情報の検索および入手が出来る。 3)ハンディキャップのある人も、音声情報受信手段さ
えあればワールド・ワイド・ウエブを介して必要な音声
情報の検索・入手が出来る。
【図面の簡単な説明】
【図1】本発明の音声ファイルを示す図である。
【図2A】本発明の音声ファイルの実施例1を示す図で
ある。
【図2B】本発明のホットスポット指定部を示す図であ
る。
【図3A】本発明の音声ファイルの実施例2を示す図で
ある。
【図3B】本発明のホットスポット指定部を示す図であ
る。
【図4】本発明の音声ファイルの実施例3を示す図であ
る。
【図5】本発明の音声ファイルの実施例4を示す図であ
る。
【図6】本発明の実施例1を示す図である。
【図7】本発明の実施例2を示す図である。
【図8】本発明のワールド・ワイド・ウエブ・サイトを
示す図である。
【図9】本発明の音声情報交換機の機能ブロック図であ
る。
【図10】本発明の好適実施例のフローチャート図であ
る。
【図11】本発明の受話器の機能ブロック図である。
【符号の説明】
110:音声情報格納手段 120:音声情報提供手段 130:音声情報伝達手段 140:音声情報受信手段 150:音声情報検索手段 210:ワールド・ワイド・ウエブのサイト 220:音声情報交換機 230:公衆回線網 240:公衆回線網に接続されている受話器 250:ワールド・ワイド・ウエブ 410:音声復号器 420:ホットスポット検出器 430:ワールド・ワイド・ウエブに接続されている各
サイト 434:音声ファイル分離ブロック 436:音声信号合成ブロック 437:D/A変換ブロック 438:ホットスポット指定ブロック 454:信号検出ブロック 456:URL特定ブロック 522:信号分離ブロック 528:体感信号発声ブロック
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 FI H04M 3/50 H04M 11/08 11/08 G06F 15/40 310F 15/403 310Z (72)発明者 平山 亮 神奈川県川崎市高津区坂戸3丁目2番2号 ヒューレット・パッカードラボラトリー ズジャパンインク内

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】音声情報格納手段、音声情報検索手段、音
    声情報提供手段、音声情報伝達手段、及び音声情報受信
    手段を有する装置を用いて、以下の(a)ないし(h)
    の工程を行うことにより、音声情報の検索及び提供を行
    うことを特徴とする方法、(a)前記音声情報受信手段
    を音声情報伝達手段を経由して前記音声情報提供手段へ
    接続する工程、(b)前記音声情報受信手段から前記音
    声情報提供手段へ前記音声情報格納手段を指定する工
    程、(c)前記音声情報提供手段が音声情報検索手段を
    経由して前記音声情報格納手段を検索する工程(d)前
    記音声情報提供手段が音声情報検索手段を経由して前記
    音声情報格納手段からの音声ファイルを受信する工程、
    (e)前記音声情報提供手段が前記音声ファイルを音声
    情報に変換し、前記音声情報伝達手段経由で前記音声情
    報受信手段へ提供する工程であって、詳細音声情報を有
    する語句の音声変換時には、詳細情報を有しない語句の
    音声変換時とは利用者が識別できる手段を用いて、前記
    音声情報受信手段へ提供する工程、(f)前記音声情報
    提供手段によって、提供される音声情報の中で、利用者
    が詳細情報を検索したい所望の語句を検出したときに、
    前記所望の語句を指定し前記音声情報提供手段に前記音
    声情報伝達手段経由で伝える工程、(g)前記音声情報
    提供手段が前記指定された所望の語句を検出し、前記指
    定された所望の語句するが格納されている手段を特定す
    る工程(h)利用者が所望の音声情報を得るまで(c)
    ないし(g)を繰り返す工程。
  2. 【請求項2】請求項1に記載の音声により情報の検索及
    び提供を行う方法において、前記音声情報格納手段には
    1つまたは複数の音声ファイルが格納されており、該音
    声ファイルには一つまたは複数の音声データ部及び1つ
    または複数のホットスポット指定部が含まれており、 該ホットスポット指定部はヘッダ部、始点情報部、終点
    情報部、ホットスポット長情報、および詳細情報格納場
    所情報部を含み、前記始点情報部は前記詳細情報を有す
    る語句の音声変換の開始情報を含み、前記終点情報部は
    前記詳細情報を有する語句の音声変換の終了情報を含
    み、前記ホットスポット長情報はホットスポットのバイ
    ト数あるいは時間長を含み、前記詳細情報格納場所情報
    部は前記詳細情報を有する語句が指定された時に検索す
    る音声情報格納手段を特定する情報を含み、 前記音声データ部は提供すべき音声データおよび前記詳
    細情報を有する語句を含むことを特徴とする方法。
  3. 【請求項3】請求項1に記載の音声により情報の検索及
    び提供を行う方法において、前記音声情報検索手段はワ
    ールド・ワイド・ウエブであり、前記音声情報格納手段
    は前記ワールド・ワイド・ウエブに接続されたサーバ上
    にあり、各サーバに前記音声ファイルを含むことを特徴
    とする方法。
  4. 【請求項4】請求項1に記載の音声により情報の検索及
    び提供を行う方法において、前記音声情報提供手段は、
    前記詳細情報を有する語句の音声には、詳細情報を有し
    ない語句の音声とは、利用者が識別できるように異なる
    音声変換を行って音声情報を提供することを特徴とする
    方法。
  5. 【請求項5】請求項1に記載の音声により情報の検索及
    び提供を行う方法において、前記音声情報受信手段は、
    前記音声情報受信手段を振動させる手段を有し、前記音
    声情報提供手段から前記詳細音声情報を有する語句を受
    信した時、前記音声情報受信手段を振動させることによ
    り、利用者に該語句が前記詳細音声情報を有する語句で
    あることを伝えることを特徴とする方法。
  6. 【請求項6】請求項1に記載の音声により情報の検索及
    び提供を行う方法において、前記音声情報伝達手段は公
    衆回線網であることを特徴とする方法。
  7. 【請求項7】請求項1に記載の音声により情報の検索及
    び提供を行う方法において、前記語句を指定する工程は
    音声情報受信手段のボタンを押すこと、あるいは利用者
    の発声音のいずれか1つあるいは双方によって指定する
    ことを特徴とする方法。
  8. 【請求項8】音声情報格納手段、音声情報検索手段、音
    声情報提供手段、音声情報伝達手段、及び音声情報受信
    手段を有する装置であって、以下の(a)ないし(h)
    の工程を行うことにより、音声情報の検索及び提供を行
    うことを特徴とする装置、(a)前記音声情報受信手段
    を音声情報伝達手段を経由して前記音声情報提供手段へ
    接続する工程、(b)前記音声情報受信手段から前記音
    声情報提供手段へ前記音声情報格納手段を指定する工
    程、(c)前記音声情報提供手段が音声情報検索手段を
    経由して前記音声情報格納手段を検索する工程(d)前
    記音声情報提供手段が音声情報検索手段を経由して前記
    音声情報格納手段からの音声ファイルを受信する工程、
    (e)前記音声情報提供手段が前記音声ファイルを音声
    情報に変換し、前記音声情報伝達手段経由で前記音声情
    報受信手段へ提供する工程であって、詳細音声情報を有
    する語句の音声変換時には、詳細情報を有しない語句の
    音声変換時とは利用者が識別できる手段を用いて、前記
    音声情報受信手段へ提供する工程、(f)前記音声情報
    提供手段によって、提供される音声情報の中で、利用者
    が詳細情報を検索したい所望の語句を検出したときに、
    前記所望の語句を指定し前記音声情報提供手段に前記音
    声情報伝達手段経由で伝える工程、(g)前記音声情報
    提供手段が前記指定された所望の語句を検出し、前記指
    定された所望の語句するが格納されている手段を特定す
    る工程、(h)利用者が所望の音声情報を得るまで
    (c)ないし(g)を繰り返す工程。
  9. 【請求項9】請求項8に記載の音声により情報の検索及
    び提供を行う装置において、前記音声情報提供手段は以
    下(a)ないし(e)の手段を有することを特徴とする
    装置、(a)詳細情報を有する語句の音声情報提供時に
    は、詳細情報を有しない語句の音声情報提供時とは、利
    用者が識別できる手段で、前記音声情報伝達手段経由で
    前記音声情報受信手段へ伝える手段、(b)前記利用者
    によって指定された所望の語句を検出し、前記指定され
    た所望の語句が格納されている情報格納手段を特定する
    手段、(c)前記音声情報検索手段を経由して前記音声
    情報格納手段を検索する手段(e)前記検索された音声
    情報を受信する手段。
  10. 【請求項10】請求項8に記載の音声により情報の検索
    及び提供を行う装置において、前記音声情報提供手段
    は、前記詳細情報を有する語句の音声には、詳細情報を
    有しない語句の音声とは、利用者が識別できるように異
    なる音声変換を行って音声情報を提供することを特徴と
    する装置。
  11. 【請求項11】請求項8に記載の音声により情報の検索
    及び提供を行う装置において、前記音声情報受信手段
    は、前記音声情報受信手段を振動させる手段を有し、前
    記音声情報提供手段から前記詳細音声情報を有する語句
    を受信した時、前記音声情報受信手段を振動させること
    により、利用者に該語句が前記詳細音声情報を有する語
    句であることを伝えることを特徴とする装置。
  12. 【請求項12】請求項8に記載の音声により情報の検索
    及び提供を行う装置において、前記音声情報受信手段
    は、発光手段を有し、前記音声情報提供手段から前記詳
    細音声情報を有する語句を受信した時、前記発光手段を
    動作させることにより、利用者に該語句が前記詳細音声
    情報を有する語句であることを伝えることを特徴とする
    装置。
JP04658198A 1998-02-27 1998-02-27 音声情報の提供方法 Expired - Fee Related JP4197195B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP04658198A JP4197195B2 (ja) 1998-02-27 1998-02-27 音声情報の提供方法
US09/257,327 US6249764B1 (en) 1998-02-27 1999-02-25 System and method for retrieving and presenting speech information

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP04658198A JP4197195B2 (ja) 1998-02-27 1998-02-27 音声情報の提供方法

Publications (2)

Publication Number Publication Date
JPH11282648A true JPH11282648A (ja) 1999-10-15
JP4197195B2 JP4197195B2 (ja) 2008-12-17

Family

ID=12751279

Family Applications (1)

Application Number Title Priority Date Filing Date
JP04658198A Expired - Fee Related JP4197195B2 (ja) 1998-02-27 1998-02-27 音声情報の提供方法

Country Status (2)

Country Link
US (1) US6249764B1 (ja)
JP (1) JP4197195B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001282503A (ja) * 2000-03-31 2001-10-12 Canon Inc データ処理装置及び方法、ブラウザシステム、ブラウザ装置、記録媒体
JP2002057811A (ja) * 2000-08-09 2002-02-22 Jiyakosu:Kk 声紋電話システム
JP2003044496A (ja) * 2001-07-26 2003-02-14 Nec Corp 情報サービス提供方法、装置及びプログラム
JP2008505566A (ja) * 2004-06-30 2008-02-21 グレネイル エレクトロニクス インコーポレイテッド 地域分散型ボイスメッセージングシステムにおけるメッセージ耐久性及び取り出し

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8421158B2 (en) * 1998-12-21 2013-04-16 Megica Corporation Chip structure with a passive device and method for forming the same
US8178435B2 (en) 1998-12-21 2012-05-15 Megica Corporation High performance system-on-chip inductor using post passivation process
US6303423B1 (en) 1998-12-21 2001-10-16 Megic Corporation Method for forming high performance system-on-chip using post passivation process
US7531417B2 (en) * 1998-12-21 2009-05-12 Megica Corporation High performance system-on-chip passive device using post passivation process
US6618478B1 (en) * 1999-09-27 2003-09-09 Ameritech Corporation Telephone set having a help key and methods and systems for use therewith
US7330815B1 (en) 1999-10-04 2008-02-12 Globalenglish Corporation Method and system for network-based speech recognition
US20030078779A1 (en) * 2000-01-04 2003-04-24 Adesh Desai Interactive voice response system
US7120629B1 (en) * 2000-05-24 2006-10-10 Reachforce, Inc. Prospects harvester system for providing contact data about customers of product or service offered by business enterprise extracting text documents selected from newsgroups, discussion forums, mailing lists, querying such data to provide customers who confirm to business profile data
US7082427B1 (en) 2000-05-24 2006-07-25 Reachforce, Inc. Text indexing system to index, query the archive database document by keyword data representing the content of the documents and by contact data associated with the participant who generated the document
US7003517B1 (en) * 2000-05-24 2006-02-21 Inetprofit, Inc. Web-based system and method for archiving and searching participant-based internet text sources for customer lead data
US7330850B1 (en) 2000-10-04 2008-02-12 Reachforce, Inc. Text mining system for web-based business intelligence applied to web site server logs
US7043531B1 (en) 2000-10-04 2006-05-09 Inetprofit, Inc. Web-based customer lead generator system with pre-emptive profiling
JP2002366194A (ja) * 2001-05-30 2002-12-20 Nokia Corp ハイパーサウンドドキュメント
US6759275B1 (en) * 2001-09-04 2004-07-06 Megic Corporation Method for making high-performance RF integrated circuits
CA2359544A1 (en) * 2001-10-22 2003-04-22 Dspfactory Ltd. Low-resource real-time speech recognition system using an oversampled filterbank
US7184886B1 (en) * 2001-12-21 2007-02-27 Garmin Ltd. Navigation system, method and device with detour algorithm
EP1475611B1 (en) * 2003-05-07 2007-07-11 Harman/Becker Automotive Systems GmbH Method and application apparatus for outputting speech, data carrier comprising speech data
US20040267563A1 (en) * 2003-06-30 2004-12-30 Rebecca Dunn Implementing an effective medical treatment management program
US20040267564A1 (en) * 2003-06-30 2004-12-30 Rebecca Dunn Facilitating effective medical treatment management
US7355282B2 (en) 2004-09-09 2008-04-08 Megica Corporation Post passivation interconnection process and structures
US8008775B2 (en) 2004-09-09 2011-08-30 Megica Corporation Post passivation interconnection structures
TWI254576B (en) * 2004-10-22 2006-05-01 Lite On It Corp Auxiliary function-switching method for digital video player
US8275618B2 (en) * 2004-12-22 2012-09-25 Nuance Communications, Inc. Mobile dictation correction user interface
US8384189B2 (en) * 2005-03-29 2013-02-26 Megica Corporation High performance system-on-chip using post passivation process
CN1901163B (zh) 2005-07-22 2011-04-13 米辑电子股份有限公司 连续电镀制作线路组件的方法及线路组件结构
WO2008002098A1 (en) * 2006-06-29 2008-01-03 Lg Electronics, Inc. Method and apparatus for an audio signal processing
CN101727904B (zh) * 2008-10-31 2013-04-24 国际商业机器公司 语音翻译方法和装置
KR101195415B1 (ko) * 2010-12-29 2012-10-29 포항공과대학교 산학협력단 원자층 증착을 이용한 엑스선(X­ray)/감마선(γ­ray)집속 광학계의 제조방법
CN105957530B (zh) 2016-04-28 2020-01-03 海信集团有限公司 一种语音控制方法、装置和终端设备
US10708340B2 (en) * 2017-11-30 2020-07-07 International Business Machines Corporation Methods and systems for improving efficiency in data transfers
CN112767924A (zh) * 2021-02-26 2021-05-07 北京百度网讯科技有限公司 语音识别方法、装置、电子设备及存储介质

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5890123A (en) * 1995-06-05 1999-03-30 Lucent Technologies, Inc. System and method for voice controlled video screen display
US5838682A (en) * 1995-11-28 1998-11-17 Bell Atlantic Network Services, Inc. Method and apparatus for establishing communications with a remote node on a switched network based on hypertext dialing information received from a packet network
US5983176A (en) * 1996-05-24 1999-11-09 Magnifi, Inc. Evaluation of media content in media files
US5903892A (en) * 1996-05-24 1999-05-11 Magnifi, Inc. Indexing of media content on a network
US5799063A (en) * 1996-08-15 1998-08-25 Talk Web Inc. Communication system and method of providing access to pre-recorded audio messages via the Internet
US5926789A (en) * 1996-12-19 1999-07-20 Bell Communications Research, Inc. Audio-based wide area information system
US5983190A (en) * 1997-05-19 1999-11-09 Microsoft Corporation Client server animation system for managing interactive user interface characters

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001282503A (ja) * 2000-03-31 2001-10-12 Canon Inc データ処理装置及び方法、ブラウザシステム、ブラウザ装置、記録媒体
US7251602B2 (en) 2000-03-31 2007-07-31 Canon Kabushiki Kaisha Voice browser system
JP2002057811A (ja) * 2000-08-09 2002-02-22 Jiyakosu:Kk 声紋電話システム
JP2003044496A (ja) * 2001-07-26 2003-02-14 Nec Corp 情報サービス提供方法、装置及びプログラム
JP2008505566A (ja) * 2004-06-30 2008-02-21 グレネイル エレクトロニクス インコーポレイテッド 地域分散型ボイスメッセージングシステムにおけるメッセージ耐久性及び取り出し

Also Published As

Publication number Publication date
US6249764B1 (en) 2001-06-19
JP4197195B2 (ja) 2008-12-17

Similar Documents

Publication Publication Date Title
JP4197195B2 (ja) 音声情報の提供方法
KR101027548B1 (ko) 통신 시스템용 보이스 브라우저 다이얼로그 인에이블러
JP3936718B2 (ja) インターネットコンテンツのアクセスに関するシステム及び方法
KR100425378B1 (ko) 정보 분배 방법, 정보 분배 시스템, 정보 분배 서버, 이동통신망 시스템 및 통신 서비스 제공 방법
CA2372544C (en) Information access method, information access system and program therefor
WO2000033548A9 (en) System for and method of creating and browsing a voice web
US6823370B1 (en) System and method for retrieving select web content
EP0854417A2 (en) Voice activated control unit
JPH09321894A (ja) 情報処理装置
US20070294064A1 (en) Automatic location-specific content selection for portable information retrieval devices
JP2003163745A (ja) 電話機、対話応答装置、対話応答端末および対話応答システム
GB2317070A (en) Voice processing/internet system
JP2000510270A (ja) 音声による広域情報システム
JPH11249867A (ja) 音声ブラウザシステム
EP0959401A2 (en) Audio control method and audio controlled device
JP3452250B2 (ja) 無線携帯端末通信システム
JP4392190B2 (ja) データコンテンツ送信装置およびデータコンテンツ送信プログラム
JP2002099531A (ja) 単語登録システム、これに用いられる単語登録装置及び単語送信装置並びに単語登録方法
JPH10322478A (ja) 音声によるハイパーテキストアクセス装置
KR20000018212A (ko) 전화를 이용한 음악정보 검색시스템
JPH10301944A (ja) Wwwブラウザ装置
JPH10164249A (ja) 情報処理装置
KR20000000048A (ko) 동시 음성 앵커를 이용하는 오디오 웹 브라우저 시스템 및 오디오 웹 브라우저 구현방법
JP2000231526A (ja) コンテンツ登録装置、および、そのプログラムを記録した記録媒体
JP2001312443A (ja) 情報配信方法および情報配信システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041108

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060704

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20061004

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20061010

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061228

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20071102

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071113

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20071220

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080924

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080925

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111010

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121010

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121010

Year of fee payment: 4

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131010

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees