JP4197195B2 - 音声情報の提供方法 - Google Patents

音声情報の提供方法 Download PDF

Info

Publication number
JP4197195B2
JP4197195B2 JP04658198A JP4658198A JP4197195B2 JP 4197195 B2 JP4197195 B2 JP 4197195B2 JP 04658198 A JP04658198 A JP 04658198A JP 4658198 A JP4658198 A JP 4658198A JP 4197195 B2 JP4197195 B2 JP 4197195B2
Authority
JP
Japan
Prior art keywords
hot spot
information
audio
voice
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP04658198A
Other languages
English (en)
Other versions
JPH11282648A (ja
Inventor
尚彦 釜江
亮 平山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HP Inc
Original Assignee
Hewlett Packard Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hewlett Packard Co filed Critical Hewlett Packard Co
Priority to JP04658198A priority Critical patent/JP4197195B2/ja
Priority to US09/257,327 priority patent/US6249764B1/en
Publication of JPH11282648A publication Critical patent/JPH11282648A/ja
Application granted granted Critical
Publication of JP4197195B2 publication Critical patent/JP4197195B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • G06F16/94Hypermedia
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9558Details of hyperlinks; Management of linked annotations
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Telephonic Communication Services (AREA)
  • Information Transfer Between Computers (AREA)
  • Computer And Data Communications (AREA)

Description

【0001】
【産業上の利用分野】
本発明は音声による情報検索および情報提供に関する、より詳細には利用者の所望する情報を音声で提供する方法に関する。
【0002】
【従来の技術】
近年インターネットの普及により様々な情報が、家庭を含む様々な場所からパーソナル・コンピュータを使って簡単に入手できるようになった。つまり世界中に張り巡らされたワールド・ワイド・ウェブを経由してブラウザにより簡単に情報の検索、入手が可能になった。インターネットで検索・表示された情報の中で、さらに詳細情報を含む語句は、そのことが認識できるように、アンダーラインを引いたりあるいは色を変えるなどの工夫をして表示されている。このように表示された語句を「ホットスポット」と呼ぶ。このホットスポットの上にポインタ(またはカーソル)を持ってきて、そこでマウスをクリックするとその語句にリンクされた詳細情報提供サイトにジャンプする。これによって、さらにホットスポットに関する詳細情報の入手が可能となる。
【0003】
しかしながら、これらを実現するためにはパーソナル・コンピュータなどの端末機が必要である。端末機のない場所からは当然のことながら情報の検索・入手は出来ない。また、端末機があっても、目で見ながら手動で操作し指定していかないと検索できないのは当然であり、ハンデキャップのある人には利用できない場合がある。例えば、現在のブラウザではマウスを使って画面を見ながら指定することが前提になっている。目の見えない人には使えない。また、寝たきりの人にとっては、パーソナル・コンピュータの前に座って、マウスを操作しキーボードを叩くことは負担となる場合もある。これらの問題を解決するために、音声による情報を提供することが考えられる。
【0004】
自動化された音声による情報提供は、省力化の要求とあいまって様々な分野で応用されている。しかしながら現状の電話による情報提供方法には、機能上の問題点があり音声情報提供の手段としては不十分である。この理由のひとつとして、上述のホットスポットを音声情報の中に含ませることが困難であることがあげられる。現在の音声情報の提供は簡単な番号案内あるいは、人間による応答までのつなぎの役割しか果していない。実際の音声情報提供を例にとって説明する。一例として音声による情報案内で説明する。これらの音声情報案内では、全体のメニュー提示をするときには「お客様のお住まいのエリアを発信音の後に入力してください、1.東京地区、2.神奈川地区、3.埼玉地区、4.千葉地区、5.山梨地区」とアナウンスされ、その後、発信音の後に利用者が該当する番号を入力していた。このような提供方法を用いる理由は、ホットスポットがメニューの音声情報の中に含まれていないためである。この方法の欠点はメニューの全体がわからないため、全部のメニューを最後まで聞く必要がある。また全部のメニューを聞いた後に番号を押すために必要な番号を記憶しておく必要がある。メニューが長くなると記憶違いによるエラーが発生する可能性がある。そのために、簡単なメニューしか提供できない。また、1つ前のメニューに戻る操作が面倒であるなど操作性上の問題もある。この様に現在の音声による情報提供方法は、機能上あるいは操作上の問題があり、必要な情報を広く深く、利用者のニーズに合わせて提供出来るものではない。
【0005】
【発明が解決しようとする課題】
本発明の主目的は、音声情報提供において、利用者による必要情報の指定、検出、検索および提供に関して改善した方法及び装置を提案することである。本発明によれば、利用者の所望する幅広い内容的に対して詳しい音声情報を、容易な操作方法で提供で出来る。
本発明の他の目的はインターネット経由でブラウザを使って情報検索を行うことが出来るのと同じように、音声による情報検索および情報提供を実現するための方法及びシステムを提供することである。
【課題を解決するための手段】
【0006】
これらの問題を解決するために、本発明では、提供する音声情報の中にホットスポットを含ませる。利用者は音声情報を聞きながらホットスポットを認識し、所望のホットスポットを指定することが出来る。音声情報提供手段は利用者によって指定されたホットスポットを検出し、ホットスポットで指定された語句に関する詳細情報が格納されている場所を特定する。音声情報提供手段は特定された格納場所を検索し、詳細情報を受信する。音声情報提供手段は受信された詳細情報を利用者に提供する。このとき提供される詳細情報には、同様にホットスポットが含まれているので、利用者はさらに詳細情報を指定できる。
【0007】
これを実現するためには、提供する音声情報の中にホットスポットを含ませ、それが利用者にホットスポットであることを認識させる必要がある。このためにホットスポットの音声提供時には、そのことが認識できる音を重畳させる。あるいは、音声のトーンを変えることも出来る。例えば、本文は男性の声で提供しホットスポット部分は女性の声で提供することも出来る。さらには利用者の他の五感に訴えることも出来る。ホットスポットの音声提供時には、音声情報受信手段を機械的に振動させる、あるいは、ランプを点灯させることも可能である。
利用者が所望のホットスポットを指定するためには、利用者の発声音による制御も可能である。また音声情報受信手段がプッシュホン受話器である場合には、特定のボタンを押すことによって指定することも出来る。
【0008】
【実施の形態】
まず、以下に説明する実施例で使われる音声ファイルについて説明する。図1に示すように、音声ファイルは音声データ及びホットスポット指定部から構成されている。音声ファイルの実施例として次の4つの例を挙げることが出来る。
1)1つの音声ファイル中、ファイルの先頭部分にホットスポット指定部をまとめて格納し、続いて音声データ部を格納する方法(図2A、音声ファイル実施例1)。
ホットスポット指定部にはヘッダ部、ホットスポットの始点情報、終点情報、詳細情報の格納場所情報などが含まれる(図2B)。ヘッダ部にはホットスポットのシーケンス番号などが含まれる。ホットスポットの始点情報には、ホットスポットの開始時間、あるいは直前のホットスポット終了から次のホットスポット開始までのバイト数などが含まれる。同様にホットスポットの終点情報には、ホットスポットの終了時間、あるいはホットスポット開始から終了までのバイト数などが含まれる。
【0009】
2)1つの音声ファイル中に、音声データと、ホットスポット指定データとを分散して、格納する方法(図3A、音声ファイル実施例2)。
この場合、音声データ部とホットスポット指定部を区別するため、各ホットスポット指定部の最初の部分にスタートビット(複数)を付ける。スタートビットは特定のビットパターン(例えば16進数でFF)とし、音声データには、この特定のビットパターンは使わないもとのする。そのビットパターンがデータ中にあらわれたときは、ホットスポット指定部の開始であると判断する。そのビットパターンの後に、そのホットスポット指定部で指定されるホットスポットの長さ情報、及びそのホットスポット指定部で指定される語句の詳細情報格納場所情報などが格納されている(図3B)。ホットスポットの長さの情報として、ホットスポットのバイト長、あるいは、ホットスポットの時間長などの情報を格納することが出来る。
【0010】
3)音声データとホットスポット指定部を別のファイルとする方法。
例えば、音声データをYYY.auというファイルとし、ホットスポット指定部をXXX.hsという名前で格納し、音声情報提供手段が、両方のファイルを参照して、処理を行なう(図4、音声ファイル実施例3)。これらのファイルの内容は、音声ファイル実施例1、及び音声ファイル実施例2で示したものと同様である。
4)音声データとホットスポット指定データを別のファイルとし、音声データの指定及びホットスポット指定は、特定の記述言語で書かれたファイル中に記述する方法(図5、音声ファイル実施例4)。
この方法では、まず、音声情報提供手段は、その記述言語で書かれたファイルを音声情報格納手段からダウンロードし参照する。それには、音声データが格納されている場所(本実施例ではURLアドレス、URL:ユニフォーム・リソース・ロケータ以下、URL)とホットスポット指定情報とが含まれている。それにしたがって、音声情報検索手段を通じて音声情報格納手段から音声データを読み出し、ホットスポット処理を行なう。
以下に音声データとホットスポット指定のための言語の例を示す。これは、ワールドワイドウェブで使われているHTML言語に類似しているが、音声データの指定と、音声データ中のホットスポット指定を記述できるように記述方法を拡張してある。ここでは、この言語をHSML(HyperSpeech Markup Language)言語と呼ぶ。
【0011】
−−−−−−−−HSML言語例(weather.hsml)−−−−−−−−
<HSML>
<HEAD>
<TITLE>明日の天気</TITLE>
</HEAD>
<BODY>
<AUDIO src="weather.au">
<AUDIOMAP>
<AUDIOAREA start="00:00:20" end="00:00:30" href="tokyo.au">
<AUDIOAREA start="00:00:35" end="00:00:45" href="kanagawa.au">
<AUDIOAREA start="00:00:50" end="00:01:00" href="weekly.hsml">
</AUDIOMAP>
</BODY>
</HSML>
【0012】
このように記述されたファイルが、音声情報格納手段によって、例えば、weather.hsmlという名前で格納されている。上記、<HSML>と</HSML>で囲まれた部分はこの言語の始まりと終わりを示す。<HEAD>と</HEAD>で囲まれた部分は、ヘッダ部であることを示し、<TITLE>と</TITLE>で囲まれた部分は、タイトルを示し、<BODY>と</BODY>で囲まれた部分は、本文を示し、これらは、HTML言語と同様の定義である。本文中、<AUDIO src="weather.au">は、音声データの所在をしめしており、この場合、音声データのURLアドレスはweather.auであることを示している。<AUDIOMAP>と</AUDIOMAP>で囲まれた部分は、この部分が音声データに対するホットスポット指定データであることを示している。
【0013】
<AUDIOAREAで始まる各行が、それぞれ、ホットスポット指定データである。はじめの行は、weather.auという音声データの0時間0分20秒から0時間0分30秒の間がホットスポットであり、そのホットスポットが指示されたとき、URLアドレスがtokyo.auである音声データを再生することを示している。次の行も同様に、weather.auという音声データの35秒から45秒の間がホットスポットであり、そのホットスポットが指示されたとき、URLアドレスがkanagawa.auである音声データを再生することを示している。次の行は、weather.auという音声データの50秒から1分0秒の間がホットスポットであり、そのホットスポットが指示されたとき、URLアドレスがweelky.hsmlというHSML言語で書かれたファイルを解釈して実行することを示している。weelky.hsmlファイルには、weather.hsmlと同様に、音声データの所在の情報やホットスポット指定データが含まれている。
以上、音声ファイルのいくつかの構造の例について説明したが、以下これらを使った実施例について説明する。
【0014】
(実施例1)
図6には、本発明で用いる音声情報格納手段(110)、音声情報検索手段(150)、音声情報提供手段(120)、音声情報伝達手段(130)、及び音声情報受信手段(140)が示されている。音声情報格納手段(110)には予め本発明に従ったフォーマットで音声ファイルが格納されている。音声情報提供手段(120)は、音声情報格納手段(110)に格納されている音声ファイルを受信し、受信した音声ファイルを音声情報に変換する。音声情報受信手段(140)へ提供するとき、詳細音声情報を有する語句(ホットスポット)の音声変換時には、詳細情報を有しない語句の音声変換時とは、利用者が識別できる手段で、音声情報受信手段(140)へ伝える(122)。次に利用者は音声情報提供手段(120)によって提供される音声情報の中で、利用者が詳細情報を検索したい所望の語句を検出したときには、その所望の語句を指定し音声情報提供手段(120)に伝える(142)。
【0015】
音声情報提供手段(120)は利用者が指定した語句を検出し、指定された語句が格納されている場所を特定する。音声情報提供手段(120)は音声情報格納手段(110)を検索し(124)、音声情報格納手段(110)からの所望の音声ファイルを受信する(112)。音声情報提供手段(120)は音声ファイルを音声情報に変換し、利用者に提供する。音声ファイルを音声情報に変換するときには、前述と同様に、詳細音声情報を有する語句(ホットスポット)の音声変換時には、詳細情報を有しない語句の音声変換時とは利用者が識別できる手段で、音声情報受信手段(140)へ伝える。この操作を、利用者が所望の情報を入手するまで繰り返す。
本発明は、さらに音声情報伝達手段(130)として、公衆通信網、構内通信網あるいはその他の情報伝達手段を、音声情報検索手段(150)として、インターネット、イントラネットあるいはその他の情報検索手段を用いて容易に広範に適用可能である。
【0016】
(実施例2)
図7に示されるように、実施例2では、音声情報検索手段としてインターネットで利用されるワールド・ワイド・ウエブ(250)を、音声情報伝達手段として公衆回線網(230)を、音声情報格納手段としてワールド・ワイド・ウエブに接続されている各サイト(210)を、音声情報提供手段として音声情報交換機(220)を、及び音声情報受信手段として公衆回線網に接続されている受話器(240)としている。
ワールド・ワイド・ウエブにおいて、URLで指定される各サイトには、通常、画像情報、文書情報、音響情報などが格納されている。これらの情報は利用者へ送られ、利用者の端末機上で画像情報、文書情報、音響情報などが再生される。本実施例においては、図8に示されるように、各URLのサイトには画像情報だけではなく複数の音声ファイル(300)も格納されている。
【0017】
図9には、音声情報交換機400の機能ブロック図を示す。音声情報交換機400は音声復号器410、及びホットスポット検出器420を有する。受話機(440)は公衆回線網に接続されている音声情報受信手段である。また、ワールド・ワイド・ウエブ・サイト(430)はワールド・ワイド・ウエブに接続されている音声情報格納手段である。各サイト(430)には複数の音声ファイルが格納されている(図8)。
音声復号器(410)はワールド・ワイド・ウエブに接続されている各サイト(430)からの音声ファイルを受信する(412)。受信した音声ファイルは音声ファイル分離ブロック(434)へ送られる。音声ファイルの中で音声データは音声信号合成ブロック(436)へ、ホットスポット指定部はホットスポット指定ブロック(438)、及びURL特定ブロック(456)へそれぞれ送られる。音声データはD/A変換ブロック(437)へ送られ、アナログ音声に変換され利用者へ送られる。音声情報を提供している時、ホットスポット部分になると、ホットスポット指定ブロックから音声信号合成ブロックへ信号が行く。音声信号合成ブロックは、ホットスポット指定ブロックからの信号を受け取ると、特定周波数の音を重畳するように音声信号を合成する。合成された音声信号はD/A変換器へ送られ、特定周波数の音が重畳されたアナログ信号に変換され、利用者へ送られる(422)。あるいはアナログ信号に変換することなくデジタル信号として受話器へ送ることも出来る。
【0018】
利用者は音声情報を聞きながら、詳細情報を知りたいホットスポットになると、それを指定する。図11に示されるように、プッシュ信号検出ブロック(542)は利用者が入力した信号を検出する。その情報は信号合成ブロック(544)を経由して、ホットスポット検出器(420)へ送られる。図9に示すようにホットスポット検出器(420)は、利用者からの信号(442)を受信し、信号検出ブロック(454)は送られた信号の種類を特定する。ホットスポットが指定された場合には、信号がURL特定ブロック(456)へ送られ、URL特定ブロック(456)は利用者が指定したホットスポットが格納されているURLを特定する。特定されたURLを用いて音声情報の検索を行う(424)。信号検出ブロック(454)へ他の制御信号が送られた場合には、目的に応じて音声復号器(410)の音声信号合成ブロック(436)あるいはホットスポット指定ブロック(438)へ信号が送られる。
図7をもとにした本発明が実行されるフローチャートを図10に示す。
10:受話器と音声情報変換機の接続
音声情報を得たい利用者はまず受話器240をダイヤルすることによって公衆回線網230を通じて音声情報交換機220へ接続する。
20:利用者によるWWWサイトの指定
利用者には、予め本サービスを開始するためのWWWのサイトを指定する情報が与えられている。利用者はこの情報を入力する。
30:音声情報変換機によるWWWサイトのアクセス
音声情報交換機220は利用者の指示に従って、ワールド・ワイド・ウエブ250を経由して本サービスを開始するための情報が格納されている音声情報サーバ210をアクセスする(224)。
【0019】
40:音声ファイルの受信
音声情報交換機220はワールド・ワイド・ウエブ250を介して音声データ部とホットスポット指定部を含む音声ファイルを受け取る(212)。
50:音声ファイルの音声変換および利用者への提供
受信された音声ファイルには、ホットスポットが含まれている。ホットスポットの音声には、それがホットスポットであることを利用者に伝えるために、認識できるような音声を重畳して提供する(222)。
60:さらに詳細情報が必用?
もし、この音声情報が利用者の所望の情報であり、さらなる詳細情報が不要ならば、利用者の目的は達成されたことになり、これで音声情報の検索は終了する。そうではなく、さらに詳細情報が必要ならばステップ70へ行く。
70:利用者によるホットスポットの指定
利用者は、ホットスポットを認識しそれが詳細情報を聞きたい所望の語句である時にはプッシュホン受話器の「*」を押す。詳細情報を有する語句(ホットスポット)の発音直後は間を置く。これは利用者がその語句を認識し反応するまでのタイムラグが必要なためである。
【0020】
80:URLの検出
プッシュホン受話器の「*」を押すことにより音声情報交換機(220)へ信号が送られる(242)。音声情報交換機220では利用者から指定されたホットスポットを検出し、それに対応するURLを特定する。
ステップ30へもどり、ワールド・ワイド・ウエブ250を通じてそのURLに対応する音声ファイルが格納されているサイトをアクセスする(224)。
以下ステップ30からステップ80を繰り返すことにより、利用者は所望の音声による情報を入手することが出来る。
【0021】
さらに、ステップ70において、利用者は「#」および「*」と数字ボタンの組み合わせて使用することにより、様々な制御信号を音声情報交換機220に送ることが出来る。1例として、「#0」:ホームページへ戻る。「#*1」:1つ前の、ホットスポットへ戻る、「#*2」:2つ前の、ホットスポットへ戻る、「#1」:ホットスポットを1つスキップする、「#2」:ホットスポットを2つスキップする等の制御信号を送ることができる。また「*」と「#」を同時に押すことによって音声情報交換機220からのメニュー・コントロール用の音声に移行することができる。この制御音声は1例として「前のページ、次のページ、またはホームページに戻ることができます」といったアナウンスがなされる。このとき「前のページ」、「次のページ」、「ホームページ」の個所がホットスポットになっている。
【0022】
(実施例3)
実施例2では、音声情報交換機220から音声を提供する時に、ホットスポットであることを示すために特殊音を重畳した音声を提供する例を説明した。しかしながら、利用者にこのことを伝えるためには様々の方法が考えられる。特殊音を重畳する代わりに、本文全体は男性の発生音で作成し、ホットスポットの部分は女性の発生音へ変えることによって、それを伝えることも出来る。また聴覚に訴える音ではなく利用者の他の五感に訴えて、ホットスポットであることを伝えることが出来る。1実施例として受話器にバイブレータを取り付けることにより振動によって伝える事が出来る。あるいは、ランプ等を取付けることによりランプ等の点灯により視覚に訴えることもできる。
【0023】
図11に実施例を示す。図11は受話器の内部ブロック図を示す。音声情報交換機から送られた信号(518)には、可聴音声信号だけではなくホットスポットの送信時には、人間の聴覚には聞こえない音が重畳されている。信号分離ブロック(522)で、その音を分離・検出する。分離された信号がトリガとなり、駆動ブロック(526)を通して、体感信号発生ブロック(528)が駆動される。体感信号発生ブロック(528)は、利用者に受話器を機械的に振動させることによって、現在提供されている語句がホットスポットであることを知らせる。体感信号発生ブロック(528)は機械的な振動には限らない。例えば、ランプの点灯によって利用者の視覚に訴えることも出来る。
【0024】
(実施例4)
さらに、図10に示すフローチャートのステップ70において、発声音制御モードに切り替えることにより、プッシュホンのボタンを押す代わりに利用者の発声音によって制御することも出来る。実施例4では、「**」と2回押すと、モードが切り替わり、利用者の発声音による制御が可能になる。そのときは「#」を押す代わりに、「それ」と発声する。制御音声はこれ以外にも「まえ」、「つぎ」、「ホーム」等がある。
図9のブロック図を用いて説明する。受話器から「**」と2回押すと発生音制御モードに切り替わる。制御信号である発声音が、ホットスポット検出器(420)内の信号検出ブロック(454)へ送られる。音声認識ブロック(456)は信号検出ブロック(454)から送られる信号を認識しその結果を信号検出ブロック(454)戻す。信号検出ブロック(454)は認識された信号に従って次のステップの処理を進める。
音声認識は上に述べたように単純な発声音のみを用い、既存の技術を適用することにより実施できる。これによりベットの上に寝ていて手足が不自由な状態でも情報検索及び情報入手が可能である。
【0025】
(実施例5)
本発明は公衆回線網、ワールド・ワイド・ウエブに限定されることなく、幅広く応用できることは明らかである。上記以外の具体的な応用例として、製品のサポート・オフィス案内、天気情報などを直接音声で提供するなど、応用例には枚挙に暇がない。
本願発明により、ユーザの使い勝手も大幅に向上されることは明らかである。また、音声情報提供手段は公衆回線網を使い、音声情報検索手段、および音声情報格納手段は音声情報交換手段に内蔵することも出来る。ある製品のサポート・オフィス案内を例にとると次のようになる。「お客様のお住まいのエリアが読み上げられた時、#を押してください、東京地区、神奈川地区、埼玉地区、山梨地区」とアナウンスされる。所望のエリアが読み上げられた時に、「#」を押しそのエリアを指定しさらに詳細エリアを指定していく。これらの操作を繰り返すことによって、所望のサポート・オフィスの電話番号がより早く入手できる。「#」を活用するとさらに効率よく選択できる。この時アナウンスされる文章は、普通の文章として記述できるので利用者はより自然に情報を探すことができる。
【0026】
【発明の効果】
以上説明したように、本発明を用いると次のような効果が期待できる。
1)利用者の所望する音声情報の検索および提供が、容易な操作方法で、広い範囲の情報に対し、より詳細に出来る。本方法は、音声情報を提供する場合に広い応用範囲に応用できる。
2)利用者は、端末機がなくても音声情報受信手段さえあれば世界中に張り巡らされたワールド・ワイド・ウエブを介して、必要な情報の検索および入手が出来る。
3)ハンディキャップのある人も、音声情報受信手段さえあればワールド・ワイド・ウエブを介して必要な音声情報の検索・入手が出来る。
【図面の簡単な説明】
【図1】本発明の音声ファイルを示す図である。
【図2A】本発明の音声ファイルの実施例1を示す図である。
【図2B】本発明のホットスポット指定部を示す図である。
【図3A】本発明の音声ファイルの実施例2を示す図である。
【図3B】本発明のホットスポット指定部を示す図である。
【図4】本発明の音声ファイルの実施例3を示す図である。
【図5】本発明の音声ファイルの実施例4を示す図である。
【図6】本発明の実施例1を示す図である。
【図7】本発明の実施例2を示す図である。
【図8】本発明のワールド・ワイド・ウエブ・サイトを示す図である。
【図9】本発明の音声情報交換機の機能ブロック図である。
【図10】本発明の好適実施例のフローチャート図である。
【図11】本発明の受話器の機能ブロック図である。
【符号の説明】
110:音声情報格納手段
120:音声情報提供手段
130:音声情報伝達手段
140:音声情報受信手段
150:音声情報検索手段
210:ワールド・ワイド・ウエブのサイト
220:音声情報交換機
230:公衆回線網
240:公衆回線網に接続されている受話器
250:ワールド・ワイド・ウエブ
410:音声復号器
420:ホットスポット検出器
430:ワールド・ワイド・ウエブに接続されている各サイト
434:音声ファイル分離ブロック
436:音声信号合成ブロック
437:D/A変換ブロック
438:ホットスポット指定ブロック
454:信号検出ブロック
456:URL特定ブロック
522:信号分離ブロック
528:体感信号発声ブロック

Claims (6)

  1. 詳細音声情報を有する箇所であるホットスポットを識別する情報を含む音声情報に基く音声を提供する音声情報の提供方法において、
    前記音声の提供に当たって前記ホットスポットの提供は前記ホットスポットでない箇所の提供とは異なった態様で行い、
    利用者による前記ホットスポットの特定に応答して、特定された前記ホットスポットに対応する詳細音声情報に基く音声を前記利用者に提供し、
    前記音声情報は、前記音声を生成するための音声データ情報と前記音声データから分離され前記ホットスポットを識別するホットスポット指定情報に分けて記録される
    音声情報の提供方法。
  2. 前記音声情報データと前記ホットスポット指定情報はそれぞれ別個のファイルに記録される請求項1に記載の音声情報の提供方法。
  3. 前記音声情報データと前記ホットスポット指定情報は同一ファイル内の別の箇所に互いに分離して記録される請求項1に記載の音声情報の提供方法。
  4. 前記ホットスポット指定情報は、各ホットスポットの始点情報、終点情報および詳細音声情報格納場所情報を含む請求項1〜請求項3の何れかに記載の音声情報の提供方法。
  5. 前記ホットスポットの提供を前記ホットスポットでない箇所の提供とは異なった態様で行うことは、前記ホットスポットに対応する前記音声の音質を変化させること、前記ホットスポットであることを示す音声を重畳すること、機械的振動を提供すること、発光を行うことの何れかにより行われる請求項1〜請求項4の何れかに記載の音声情報の提供方法。
  6. 前記利用者による前記ホットスポットの特定は、特定のボタンの付勢または前記利用者の発声により行われる請求項1〜請求項5の何れかに記載の音声情報の提供方法。
JP04658198A 1998-02-27 1998-02-27 音声情報の提供方法 Expired - Fee Related JP4197195B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP04658198A JP4197195B2 (ja) 1998-02-27 1998-02-27 音声情報の提供方法
US09/257,327 US6249764B1 (en) 1998-02-27 1999-02-25 System and method for retrieving and presenting speech information

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP04658198A JP4197195B2 (ja) 1998-02-27 1998-02-27 音声情報の提供方法

Publications (2)

Publication Number Publication Date
JPH11282648A JPH11282648A (ja) 1999-10-15
JP4197195B2 true JP4197195B2 (ja) 2008-12-17

Family

ID=12751279

Family Applications (1)

Application Number Title Priority Date Filing Date
JP04658198A Expired - Fee Related JP4197195B2 (ja) 1998-02-27 1998-02-27 音声情報の提供方法

Country Status (2)

Country Link
US (1) US6249764B1 (ja)
JP (1) JP4197195B2 (ja)

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7531417B2 (en) * 1998-12-21 2009-05-12 Megica Corporation High performance system-on-chip passive device using post passivation process
US8178435B2 (en) 1998-12-21 2012-05-15 Megica Corporation High performance system-on-chip inductor using post passivation process
US8421158B2 (en) * 1998-12-21 2013-04-16 Megica Corporation Chip structure with a passive device and method for forming the same
US6303423B1 (en) * 1998-12-21 2001-10-16 Megic Corporation Method for forming high performance system-on-chip using post passivation process
US6618478B1 (en) * 1999-09-27 2003-09-09 Ameritech Corporation Telephone set having a help key and methods and systems for use therewith
US7330815B1 (en) * 1999-10-04 2008-02-12 Globalenglish Corporation Method and system for network-based speech recognition
US20030078779A1 (en) * 2000-01-04 2003-04-24 Adesh Desai Interactive voice response system
JP3862470B2 (ja) 2000-03-31 2006-12-27 キヤノン株式会社 データ処理装置及び方法、ブラウザシステム、ブラウザ装置、記録媒体
US7003517B1 (en) * 2000-05-24 2006-02-21 Inetprofit, Inc. Web-based system and method for archiving and searching participant-based internet text sources for customer lead data
US7082427B1 (en) 2000-05-24 2006-07-25 Reachforce, Inc. Text indexing system to index, query the archive database document by keyword data representing the content of the documents and by contact data associated with the participant who generated the document
US7120629B1 (en) * 2000-05-24 2006-10-10 Reachforce, Inc. Prospects harvester system for providing contact data about customers of product or service offered by business enterprise extracting text documents selected from newsgroups, discussion forums, mailing lists, querying such data to provide customers who confirm to business profile data
JP4812928B2 (ja) * 2000-08-09 2011-11-09 株式会社ジャコス 声紋電話システム
US7330850B1 (en) 2000-10-04 2008-02-12 Reachforce, Inc. Text mining system for web-based business intelligence applied to web site server logs
US7043531B1 (en) 2000-10-04 2006-05-09 Inetprofit, Inc. Web-based customer lead generator system with pre-emptive profiling
JP2002366194A (ja) * 2001-05-30 2002-12-20 Nokia Corp ハイパーサウンドドキュメント
JP2003044496A (ja) * 2001-07-26 2003-02-14 Nec Corp 情報サービス提供方法、装置及びプログラム
US6759275B1 (en) * 2001-09-04 2004-07-06 Megic Corporation Method for making high-performance RF integrated circuits
CA2359544A1 (en) * 2001-10-22 2003-04-22 Dspfactory Ltd. Low-resource real-time speech recognition system using an oversampled filterbank
US7184886B1 (en) * 2001-12-21 2007-02-27 Garmin Ltd. Navigation system, method and device with detour algorithm
DE60314844T2 (de) * 2003-05-07 2008-03-13 Harman Becker Automotive Systems Gmbh Verfahren und Vorrichtung zur Sprachausgabe, Datenträger mit Sprachdaten
US20040267564A1 (en) * 2003-06-30 2004-12-30 Rebecca Dunn Facilitating effective medical treatment management
US20040267563A1 (en) * 2003-06-30 2004-12-30 Rebecca Dunn Implementing an effective medical treatment management program
US7308083B2 (en) * 2004-06-30 2007-12-11 Glenayre Electronics, Inc. Message durability and retrieval in a geographically distributed voice messaging system
US7355282B2 (en) 2004-09-09 2008-04-08 Megica Corporation Post passivation interconnection process and structures
US8008775B2 (en) 2004-09-09 2011-08-30 Megica Corporation Post passivation interconnection structures
TWI254576B (en) * 2004-10-22 2006-05-01 Lite On It Corp Auxiliary function-switching method for digital video player
US8275618B2 (en) * 2004-12-22 2012-09-25 Nuance Communications, Inc. Mobile dictation correction user interface
US8384189B2 (en) * 2005-03-29 2013-02-26 Megica Corporation High performance system-on-chip using post passivation process
CN102157494B (zh) 2005-07-22 2013-05-01 米辑电子股份有限公司 线路组件
TWI371694B (en) * 2006-06-29 2012-09-01 Lg Electronics Inc Method and apparatus for an audio signal processing
CN101727904B (zh) * 2008-10-31 2013-04-24 国际商业机器公司 语音翻译方法和装置
KR101195415B1 (ko) * 2010-12-29 2012-10-29 포항공과대학교 산학협력단 원자층 증착을 이용한 엑스선(X­ray)/감마선(γ­ray)집속 광학계의 제조방법
CN105957530B (zh) * 2016-04-28 2020-01-03 海信集团有限公司 一种语音控制方法、装置和终端设备
US10708340B2 (en) * 2017-11-30 2020-07-07 International Business Machines Corporation Methods and systems for improving efficiency in data transfers
CN112767924A (zh) * 2021-02-26 2021-05-07 北京百度网讯科技有限公司 语音识别方法、装置、电子设备及存储介质

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5890123A (en) * 1995-06-05 1999-03-30 Lucent Technologies, Inc. System and method for voice controlled video screen display
US5838682A (en) * 1995-11-28 1998-11-17 Bell Atlantic Network Services, Inc. Method and apparatus for establishing communications with a remote node on a switched network based on hypertext dialing information received from a packet network
US5903892A (en) * 1996-05-24 1999-05-11 Magnifi, Inc. Indexing of media content on a network
US5983176A (en) * 1996-05-24 1999-11-09 Magnifi, Inc. Evaluation of media content in media files
US5799063A (en) * 1996-08-15 1998-08-25 Talk Web Inc. Communication system and method of providing access to pre-recorded audio messages via the Internet
US5926789A (en) * 1996-12-19 1999-07-20 Bell Communications Research, Inc. Audio-based wide area information system
US5983190A (en) * 1997-05-19 1999-11-09 Microsoft Corporation Client server animation system for managing interactive user interface characters

Also Published As

Publication number Publication date
US6249764B1 (en) 2001-06-19
JPH11282648A (ja) 1999-10-15

Similar Documents

Publication Publication Date Title
JP4197195B2 (ja) 音声情報の提供方法
JP3953886B2 (ja) 字幕抽出装置
TWI249729B (en) Voice browser dialog enabler for a communication system
US7197462B2 (en) System and method for information access
US8046229B2 (en) Method and apparatus for website navigation by the visually impaired
EP1341155B1 (en) Information processing apparatus and method with speech synthesis function
JPH0865645A (ja) テレビジョン信号で送られるデータの受信方法
WO2000033548A9 (en) System for and method of creating and browsing a voice web
JP5768842B2 (ja) コンテンツ再生装置およびコンテンツ再生プログラム
JP4392190B2 (ja) データコンテンツ送信装置およびデータコンテンツ送信プログラム
JPWO2007043427A1 (ja) 視聴装置
WO2006003714A1 (ja) 読み上げ機能付きブラウザプログラム、読み上げ機能付きブラウザ、ブラウジング処理方法およびブラウザプログラム記録媒体
KR100353689B1 (ko) 전화를 이용한 음악정보 검색시스템
KR100945162B1 (ko) 링백톤제공시스템 및 그 방법
KR19990031015A (ko) 음성 합성을 이용한 오디오 웹 브라우져 장치
JP2007323512A (ja) 情報提供システム、携帯端末及びプログラム
JP2002158624A (ja) 受信装置、データ放送受信システム、コンテンツアクセス方法、及びプログラム。
JP2002158803A (ja) 携帯端末通信システム、及び携帯端末
JP2006041856A (ja) テレビ番組と連携するウェブページをテレビ画面に表示する装置
KR100705901B1 (ko) 이동통신 단말기 및 텔레비젼을 위한 문자 및 음성정보서비스 시스템
JP2001312443A (ja) 情報配信方法および情報配信システム
JP4289080B2 (ja) 音声データ提供装置、音声データ提供方法、および音声データ提供プログラム
JP2004171111A (ja) Webブラウザ制御方法及び装置
JP2004062678A (ja) 利用者参加型情報展開システム及び利用者参加によって展開されるマルチメディア組み込み情報を表示する移動体情報端末
JP4029121B2 (ja) リモコン情報サーバ、カラオケシステム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041108

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060704

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20061004

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20061010

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061228

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20071102

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071113

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20071220

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080924

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080925

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111010

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121010

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121010

Year of fee payment: 4

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131010

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees