JPH08335160A - ビデオスクリーン表示を音声対話型にするシステム - Google Patents
ビデオスクリーン表示を音声対話型にするシステムInfo
- Publication number
- JPH08335160A JPH08335160A JP8141254A JP14125496A JPH08335160A JP H08335160 A JPH08335160 A JP H08335160A JP 8141254 A JP8141254 A JP 8141254A JP 14125496 A JP14125496 A JP 14125496A JP H08335160 A JPH08335160 A JP H08335160A
- Authority
- JP
- Japan
- Prior art keywords
- screen display
- video screen
- data
- data link
- recognizing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 claims description 17
- 230000002452 interceptive effect Effects 0.000 claims description 6
- 230000004044 response Effects 0.000 claims 1
- 230000011664 signaling Effects 0.000 claims 1
- 230000001755 vocal effect Effects 0.000 claims 1
- 230000003044 adaptive effect Effects 0.000 abstract 1
- 230000006870 function Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000003068 static effect Effects 0.000 description 4
- 238000013519 translation Methods 0.000 description 2
- 206010003246 arthritis Diseases 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000013468 resource allocation Methods 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/487—Arrangements for providing information services, e.g. recorded voice services or time announcements
- H04M3/493—Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
- H04M3/4938—Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals comprising a voice browser which renders and interprets, e.g. VoiceXML
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- User Interface Of Digital Computer (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Selective Calling Equipment (AREA)
- Digital Computer Display Output (AREA)
Abstract
システムを容易に適合させる。 【解決手段】 本発明の音声制御ビデオスクリーン表示
のシステム及び方法は、ワールドワイドウェブ網及び対
話型テレビジョン表示のような様々なビデオスクリーン
表示を巡る「手を用いない」ナビゲーションを提供す
る。システムの操作時には、ワールドワイドウェブ網の
ような応用例においては言語モデルは、到来するデータ
から導出される。
Description
クリーン表示を提供するシステム及び方法に関し、特
に、現存するシステムを音声対話型(ボイスインタラク
ティブ)に変更することに関する。
制御する従来の方法は、キーボード又は「マウス」装置
を使用する。ビデオスクリーン表示を制御するための他
の方法としては、表示スクリーン上のカーソルを動かす
ためのセンサパッド、手に持って使うポインティングス
タイラス(針)及び光ビーム等がある。
般に、固定された水平な表面を必要とし、またユーザは
表示スクリーンに近接していなくてはならない。また、
制御装置、即ちキーボードやマウスのための十分な空間
も必要である。
でなければならないので、身体的、視覚的に障害があ
り、又は関節炎のために動作できる範囲が制限されるよ
うな人にとっては使用することができない。
デオスクリーン表示は周知である。例えば、米国特許第
5,345,538号、第4,757,541号、第4,6
33,499号及び第4,158,750号を参照すると
よい。しかしながら、前述の従来の技術は、事前に定め
られ、事前に記憶された言語に依存する音声認識部(音
声レコグナイザー)を用いる音声制御ビデオスクリーン
表示システムを利用する。
音声認識システムは、音声対話型になるように現存する
非音声認識システムを容易に適合させることができない
という重大な欠点を有する。また、このように、音声認
識部によって認識可能な音声が、システムのオペレーテ
ィングプログラムやユーザのシステム操作に従って変化
するような音声制御ビデオスクリーン表示システムが必
要とされる。
ビデオスクリーン表示ののシステム及び方法が提供され
る。さらに、本発明は、キーワード(以下「データリン
ク」とする)の認識によって音声対話型とするように、
現存する音声認識ができる構成とされていないプログラ
ムにおいて用いられるシステム及び方法を提供する。特
に、本発明の音声制御ビデオスクリーン表示システム
は、ビデオスクリーン上への表示のためのドキュメント
(テキスト、イメージ、映像、音声、HTMLファイル
等)を連結するデータリンク集合(セット)を認識する
手段を含む。コンパイラは、インタプリタ(解釈部)か
らテキストを受け、データリンクに対応するコードを作
る。コンパイラによって作られたコードは、有限の操作
コマンドとマージ(併合)され、音声認識部に対して完
全な文法を形成する。コンパイラはまた、トランスレー
タ(翻訳部)による音声シーケンスへの翻訳のための語
彙(ボキャブラリー)を作る。音声シーケンス及び完全
な文法は次に、音声認識部へとロードされ(読み込ま
れ)、これは音声シーケンスに対応する発声された音を
認識し、デジタル化された音声を自然言語テキストに変
換する。音声認識部によって認識可能な音声は、ユーザ
によるシステムの操作及びシステムの標準入力装置に依
存する。
からの自然言語テキストの他に、インタプリタ及びコン
パイラからのコードを受け、ビデオスクリーン表示を行
わせるプログラミングコマンド(テキスト、バイトコー
ド、2進コード等からなるものを含む)を作る。従っ
て、本発明のシステム及び方法により、音声制御によっ
て新しいビデオスクリーン表示が得られ、スクリーン表
示操作を行えるようになる。
音声制御ビデオスクリーン表示システムのブロック図を
示す。音声制御ビデオスクリーン表示システム100
は、データ接続(データコネクション)103からのド
キュメントをアクセスし、音声制御システムの他の構成
部分までデータを与えるサーバ102を含む。本発明と
共に用いる適当なデータ接続の例としては、インターネ
ット、構内網(LAN)、モデム接続及び有線テレビジ
ョン等があるが、本発明はこれらのデータ接続に制限さ
れない。実際、ここに記述するシステムとの使用に適し
た他のデータ接続は容易に想像できる。
トスポット」として知られている)を認識する手段は、
ビデオスクリーン表示と関連づけられた(即ち、操作的
に連結された)データリンクを識別し、解釈する。デー
タリンク集合は、システムがアクティブであるがアイド
ル状態であるような、まだ達成されていていないような
データリンクを含んでいてもよい。データリンク集合を
認識する手段は、データリンクをそれらが事前に記憶さ
れたデータを単に取り出すときのみではなく受けられる
度に、識別し、解釈する。例えば、データリンクはビデ
オスクリーン表示をトラックするサーバから受けられ
る。代りに、データリンクは、特定のビデオスクリーン
表示の選択の際にユーザから受けられる。通常、データ
リンクは、ファイル、ドキュメント、ドキュメントの中
のページ、及びビデオスクリーン表示の一部を連結し、
これにより、ユーザがキーボードやマウス装置の使用に
よって様々なスクリーン表示を巡ってナビゲーションす
ることを可能にする。例えば、データリンクは、あるス
クリーン表示から別の表示まで、又は特定の表示の中で
(即ち、表示のある部分から別の部分まで)ナビゲーシ
ョンするように用いることができる。データリンクは、
線形的に想定できず、想像可能なあらゆる方法でもお互
い連結できる。本発明は、ワールドワイドウェブ(Worl
d Wide Web)のような音声認識ができる構成とされてい
ないものと予め関連づけられた様々なビデオスクリーン
表示の音声制御を達成するためにこれらのデータリンク
を用いる。
クリーン表示と関連づけられたデータリンクを識別又は
取り出すように動作できるインタプリタ104であるこ
とが好ましい。インタプリタ104は次に、ファイル名
又はパス名のようなドキュメントの位置を決める第1の
成分と、及び音声認識部106に文法を提供する第2の
成分とにデータリンクを分離する。インタプリタは、ソ
フトウェアインタフェースによってサーバ102に接続
されることが好ましい。
ンタフェースによってインタプリタ104に機能的に接
続されることが好ましい。文法コンパイラ110は、
(A)データリンクに対応するコードであって、ここ
で、このコードは、ビデオスクリーン表示のプログラミ
ングコマンドを作るために、自然言語テキストをファイ
ル名のようなコードと関係させるエバリュエータ112
へと送られることと、(B)音声認識部106のための
有限状態文法(finite state grammar)と、及び(C)
トランスレータ114による音声認識部106のための
音声シーケンスへの翻訳のための語彙とを作る。ここで
用いた用語のインタプリタ、コンパイラ及びエバリュエ
ータはお互い交換可能であることは容易に認識できる。
トランスレータ114は、例えば米国特許第4,685,
135号、第5,157,759号及び第5,204,90
5号に記述されているような、テキスト/音声(テキス
ト・トゥ・スピーチ)システムであってもよい。代り
に、トランスレータ114は検索表(ルックアップテー
ブル)であってもよい。
ソフトウェアインタフェース等の方法によって文法マー
ジャー116に機能的に接続されることが好ましい。文
法マージャー116は、スクロール、プルダウンメニュ
ー等のビデオスクリーン表示操作のために、言語を音声
認識部106が認識できるようにされる有限状態文法
を、静的ベース文法118とマージする。従って、文法
マージャー116は、音声認識部106への入力のため
に完全な文法を形成する。
ら受けたコード、及びテキスト/音声システムから受け
た音声シーケンスに対応する音声を識別する音声認識部
106によって分析される。音声認識部106は次に、
デジタル化された音声を自然言語テキストへと変換し、
これはエバリュエータ112の中にロードされる。エバ
リュエータ112は、ビデオスクリーン表示のためのプ
ログラミングコマンドを作るために、該自然言語テキス
トをインタプリタの出力と関係させる。従って、ユーザ
が話すと、新しいビデオスクリーン表示(若しくはスク
リーン表示の異なった部分)が得られたり、又は様々な
スクリーン表示操作が実行される。ここに記述された方
法に従うと、音声認識部106によって認識可能な言語
の範囲は、ユーザがスクリーン表示を通してナビゲーシ
ョンするにつれて変化する。ここに記述したシステム
が、ビデオスクリーン表示の特定の部分が受けられたこ
とを表す信号(符号でもよい)として、データリンクを
識別し、解釈するので、ビデオスクリーン表示データを
記憶するための大容量なメモリは必要とされない。
応用を提供するように適合できる。例えば、当分野で周
知であるように、インターネットのワールドワイドウェ
ブ(World Wide Web:WWW)網にアクセスし、表示す
るウェブブラウザと呼ばれるソフトウェアは、本発明に
従ってワールドワイドウェブの操作に音声制御を提供す
るように用いられる。従って、ユーザはキーボードやマ
ウスの使用無しでワールドワイドウェブを通してナビゲ
ーションできる。しかしながら、ここで述べた本発明の
音声制御ビデオスクリーン表示システム100は、多数
のプログラムアプリケーションで応用でき、ワールドワ
イドウェブ網の実施例に限定されない。
00は、対話型テレビジョンとしても用いることができ
ることができる。よく知られるように、ケーブルレス
「マウス」のような手に持って使う装置は、音声認識部
によって処理される音声を受けるマイクロホンを有する
ことができる。この装置は、ユーザがマイクロホンに発
声すると、テレビジョンのオーディオを止めるようにさ
れることが好ましい。代りに、マイクロホンは、座る場
所の壁に取り付けるような、ユーザにとって好都合でア
クセス可能な位置にも取り付けられる。
スクリーン表示と関連させて発声者確認又は発声者識別
機能を提供するように用いられる。発声者確認機能は、
クレジットカードの使用等のために安全機能を提供する
ため、音声を記憶音響パターンと照合する。発声者識別
機能は、誰が話しているかを分析し、特定の発声者が具
体的なビデオスクリーン表示操作にそれ以上アクセスで
きないようにできる。ここで記述した音声制御システム
の音声認識部は、特定のユーザの発声を認識し、対応す
るデータリンクテキストを各発声と関係させるように訓
練される。また、本発明におけるビデオスクリーン表示
は、コンピュータモニタ、テレビジョンスクリーン、自
動窓口機スクリーン及び電話機スクリーン等の表示であ
ることが好ましい。
より容易に理解できる。図2は、インターネットのワー
ルドワイドウェブ(WWW)網130に音声制御を提供
する本発明の実施例を示しているブロック図である。
ログラムであり、ワールドワイドウェブ網130にアク
セスするサーバである。ウェブブラウザは周知であり、
例えば、モザイク(Mosaic:商標)、ネットスケイプ
(Netscape:商標)のようなブラウザは、本発明ととも
に使用するのに好ましいウェブブラウザである。ウェブ
ブラウザ132は、WWWシステム130を読むのに用
いられるドキュメントフォーマットであるハイパーテキ
ストマークアップ言語(HTML)により表示する。W
WW130の各HTMLページは、データリンク、「ア
ンカー」テキスト又は「ホットスポット」と呼ばれる特
別な指令を含み、これらにより、マウス応答性又は音声
応答性である他のHTMLページ又はWWW130の要
素へのリンクが表現される。周知のように、HTML
は、山括弧「<>」の中に英数字の識別子を入れて式を
典型的には表現し、これは、フォント、グラフィック、
見出し及び他のウェブサイトへのリンクを定める。
ブ網130の特定のHTMLページ上のデータリンクに
対応する音声を認識する。ここに記述された方法に従っ
て、音声認識部134により認識される語の範囲は、ユ
ーザが音声を用いてスクリーンからスクリーンへとナビ
ゲーションする(網をブラウズする)につれて変化す
る。従って、本発明は、キーボード又はマウス無しでW
WW網130をブラウズする能力をインターネットユー
ザに提供する。事前に記憶され、事前に定められた言語
ではなく、ユーザの特定のページの選択に対応するよう
なデータリンクの、識別及び解釈をするにつれて、音声
認識部によって認識可能な語の範囲が変化するので、本
システムは、ワールドワイドウェブ網の全データリンク
に対してのメモリ容量は必要としない。
プロセスをより詳細に記述してある。ウェブブラウザ1
32がWWW網130からHTMLのページを受けた後
は、HTMLパーサ136は新しいHTMLページを読
み込み、解釈するために、ウェブブラウザ132とコモ
ンクライアントインタフェース(CCI)137接続を
設ける。新しいHTMLページは、異なるスクリーン表
示又はスクリーン表示の異なった部分のことである。
ユニフォームリソースロケーター(URL:統一的資源
配置情報)及びテキスト文字列に分けることにより、H
TMLページを解釈し、処理する。テキスト文字列が使
われ、音声認識部のために自然言語を提供する文法指定
言語(GSL)コードを作られる。このGSLは、文法
コンパイラ140に送られ、これは、(A)音声認識部
によって認識可能な言語を拘束又は制限する有限状態文
法を提供し、(B)意味エバリュエータ138の意味パ
ーサ部分のためにコード、好ましくはYacc及びLe
xコードを作り、そして(C)音声認識部134への転
写のための音声シーケンス、即ち「音素」を生成するた
めに、テキスト/音声システム(TTS)142を通し
て処理されるデータリンクテキストに対応する語彙(ボ
キャブラリ)を提供する。
グされた関数が、URLから形成され、次にHTMLパ
ーサ136から従来のCプログラム言語のオブジェクト
コードリンカであるCリンカ144まで送られる。この
Cでコーディングされた関数は次に、意味エバリュエー
タ138に送られる。Cリンカ144は、新しいHTM
Lページを表す新しい文脈(コンテキスト)を作るため
に、意味パーサコードをURLセレクタコードと結合す
る。この新しい文脈は、古い文脈又は元の意味エバリュ
エータと置き換わり、音声認識部134からテキストを
受ける。ここで、本発明はCプログラム言語に制限され
なく、実際に他のいかなるプログラム言語でもよい。ア
プリケーション配布の効率性、セキュリティ、パフォー
マンス等を考慮し、ソースコードはリンク、コンパイ
ル、ジェネレート等がされた後に、ユーザの各環境にロ
ードされ実行されてもよい。機械語コードまでにコンパ
イル、リンク等されなくても各環境上のシステムで実行
できるような中間コードにコンパイルされてもよい。こ
の場合、この各環境上のシステムはその中間コードをサ
ポートしていれば、機種に依存しない複数の種類のマシ
ンで再コンパイルすることなく実行できる。
限状態HTML導出文法は、文法マージャー146によ
って静的ベース文法と結合され、音声認識部134に対
して完全な新しい文法、即ちフル言語モデルを提供され
る。ベース文法は、ウェブブラウザ制御文法であり、ス
クロール、プルダウンメニュー、前方後方への移動等の
ウインドウ操作の要求を扱う。ベース文法は、ユーザが
ウェブブラウザ操作を常にすることができるように、新
しい各HTML導出文法に加えられる。
システム142から音声シーケンスを受ける。音声認識
部134は、意味エバリュエータ138に接続されるこ
とが好ましく、これは、データリンクテキスト文字列を
URLと関係させて、WWW網130から特定のHTM
Lページを得る。音声認識部134及び意味エバリュエ
ータ138の間は、UNIXのパイプ接続によることが
好ましい。従って、ユーザは、スクロール、プルダウン
メニュー等のウェブブラウザウインドウ操作を制御する
コマンドを発声できる。代りに、ユーザは、データリン
クに対応するコマンドを発声でき、このデータリンクは
ウェブブラウザ130が対応する新しいHTMLページ
を獲得するように指示する。ウェブブラウザ130が新
しいHTMLページを獲得した後には、HTMLパーサ
136は、そのページに対してURLセレクタコード及
び文法指定言語(GSL)を作ることによって新しいH
TMLページを処理する。上述のプロセスは繰り返さ
れ、ユーザがキーボード又はマウスなしでWWW網をブ
ラウズすることを可能にする。
マークアップ言語によりドキュメントをフォーマット
し、ウェブサーバ上にそのドキュメントを位置させるこ
とによって、新しい種類の音声制御ワールドワイドウェ
ブページを生み出すことができる。また、システムの操
作時には、ワールドワイドウェブ網のような応用例にお
いては言語モデルは、到来するデータから導出される。
デオスクリーン表示のシステム及び方法は、音声認識部
によって認識可能な音声が、システムのオペレーティン
グプログラムやユーザのシステム操作に従って変化する
ようなシステムにおいて、認識可能な言葉を制限するこ
とによって、必要なメモリ等の記憶装置の容量を減らす
ことができ、容易に音声制御ビデオスクリーン表示シス
テムを提供することによって、ワールドワイドウェブ網
及び対話型テレビジョン表示のような様々なビデオスク
リーン表示を巡る「手を用いない」ナビゲーションを容
易に提供する。
ムを概略的に示すブロック図である。
図1のビデオスクリーン表示システムを示すブロック図
である。
Claims (19)
- 【請求項1】a)ビデオスクリーン表示と関連するデー
タリンク集合を認識する手段(102,104)と、 b)前記データリンクに対応する発声された音を認識
し、前記発声された音を自然言語テキストへと変換する
手段(106)と、 c)前記認識されたデータリンクに応答してビデオスク
リーン表示を変えるために、発声された音を認識する前
記手段(106)から受けた自然言語テキストを評価
し、前記自然言語テキストをプログラミングコマンドに
変換する手段(112)とからなるビデオスクリーン表
示を音声対話型にするシステム。 - 【請求項2】前記ビデオスクリーン表示が、コンピュー
タモニタ、テレビジョンスクリーン、自動窓口機スクリ
ーン及び電話機スクリーンの表示からなる群から選択さ
れることを特徴とする請求項1記載のビデオスクリーン
表示を音声対話型にするシステム。 - 【請求項3】前記データリンクが、ソフトウェアのテキ
ストフォーマットの指令を含むことを特徴とする請求項
1記載のビデオスクリーン表示を音声対話型にするシス
テム。 - 【請求項4】発声された音を認識する前記手段(10
6)が、前記システムの位置から遠隔に配置できるマイ
クロホンからの信号を受けることを特徴とする請求項1
記載のビデオスクリーン表示を音声対話型にするシステ
ム。 - 【請求項5】データリンクを認識する前記手段(10
4)が、ワールドワイドウェブ網にアクセスするための
ソフトウェアからのデータリンクを解釈することを特徴
とする請求項1記載のビデオスクリーン表示を音声対話
型にするシステム。 - 【請求項6】データリンクを認識する前記手段(10
2)が、前記ビデオスクリーン表示上に表示される少な
くとも1つのドキュメントのデータリンクを解釈するこ
とを特徴とする請求項1記載のビデオスクリーン表示を
音声対話型にするシステム。 - 【請求項7】データリンクを認識する前記手段(10
2)が、メモリに記憶される少なくとも1つのドキュメ
ントのデータリンクを解釈することを特徴とする請求項
1記載のビデオスクリーン表示を音声対話型にするシス
テム。 - 【請求項8】自然言語テキストを評価する前記手段(1
12)により作られた前記プログラミングコマンドが、
前記ビデオスクリーン上への表示のためのドキュメント
にアクセスするように該システムに指示することを特徴
とする請求項1記載のビデオスクリーン表示を音声対話
型にするシステム。 - 【請求項9】a)認識されたデータリンクを生成するた
めに、ビデオスクリーン表示の少なくとも一部を表す信
号と関係するデータリンク集合を認識する手段(13
6)と、 b)前記ビデオスクリーン表示の前記データリンクに対
応する文法を提供する手段(110,140)と、 c)前記ビデオスクリーン表示の前記少なくとも一部の
ための前記データリンク集合から、前記認識されたデー
タリンクと関係する文法を受ける手段(116,14
6)と、及び d)前記認識されたデータリンクと関係する新しいビデ
オスクリーン表示を表す信号を送る手段(134)であ
って、この送る手段が前記文法に反応することとからな
るデータ接続からのビデオスクリーン表示のページにア
クセスする装置。 - 【請求項10】データリンク集合を認識する前記手段及
び前記データリンクに対応する文法を提供する前記手段
が、コンパイラ、インタプリタ及びエバリュエータから
なる群から選択されることを特徴とする請求項9記載の
データ接続からのビデオスクリーン表示のページにアク
セスする装置。 - 【請求項11】前記ビデオスクリーン表示が、コンピュ
ータモニタ、テレビジョンスクリーン、自動窓口機スク
リーン及び電話機スクリーンの表示からなる群から選択
されることを特徴とする請求項9記載のデータ接続から
のビデオスクリーン表示のページにアクセスする装置。 - 【請求項12】前記データリンクが、ソフトウェアのテ
キストフォーマットの指令を含むことを特徴とする請求
項9記載のデータ接続からのビデオスクリーン表示のペ
ージにアクセスする装置。 - 【請求項13】データリンク集合を認識する前記手段
(136)が、ワールドワイドウェブ網(130)にア
クセスするためのソフトウェア(132)のデータリン
クを解釈することを特徴とする請求項9記載のデータ接
続からのビデオスクリーン表示のページにアクセスする
装置。 - 【請求項14】データリンク集合を認識する前記手段
が、前記ビデオスクリーン表示上に表示されたドキュメ
ントのデータリンクを解釈することを特徴とする請求項
9記載のデータ接続からのビデオスクリーン表示のペー
ジにアクセスする装置。 - 【請求項15】データリンク集合を認識する前記手段
が、メモリに記憶された少なくとも1つのドキュメント
のデータリンクを解釈することを特徴とする請求項9記
載のデータ接続からのビデオスクリーン表示のページに
アクセスする装置。 - 【請求項16】a)認識されたデータリンクを生成する
ために、ビデオスクリーン表示の少なくとも一部を表す
データリンク集合を認識するステップ(136)と、 b)前記ビデオスクリーン表示の前記データリンクに対
応する文法を作るステップ(140)と、 c)前記ビデオスクリーン表示の前記少なくとも一部に
対する前記データリンク集合からの前記認識されたデー
タリンクと関連づけられた文法を受けるステップ(14
6)と、及び d)前記認識されたデータリンクと関連づけられた新し
いビデオスクリーン表示を表す信号を送るステップ(1
34)とからなるビデオスクリーン表示のページにデー
タ接続からアクセスする方法。 - 【請求項17】データリンク集合を認識する前記ステッ
プが、ワールドワイドウェブ網にアクセスして、前記ワ
ールドワイドウェブ網の少なくとも1つのドキュメント
のデータリンクを解釈することを含むことを特徴とする
請求項16記載のビデオスクリーン表示のページにデー
タ接続からアクセスする方法。 - 【請求項18】データリンク集合を認識する前記ステッ
プが、ビデオスクリーン上に表示されるデータリンクを
解釈することを含むことを特徴とする請求項16記載の
ビデオスクリーン表示のページにデータ接続からアクセ
スする方法。 - 【請求項19】データリンク集合を認識する前記ステッ
プが、メモリに記憶される少なくとも1つのドキュメン
トのデータリンクを解釈することを含むことを特徴とす
る請求項16記載のビデオスクリーン表示のページにデ
ータ接続からアクセスする方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US08/460,955 US5890123A (en) | 1995-06-05 | 1995-06-05 | System and method for voice controlled video screen display |
US460955 | 1995-06-05 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH08335160A true JPH08335160A (ja) | 1996-12-17 |
JP3432076B2 JP3432076B2 (ja) | 2003-07-28 |
Family
ID=23830693
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP14125496A Expired - Fee Related JP3432076B2 (ja) | 1995-06-05 | 1996-06-04 | 音声対話型ビデオスクリーン表示システム |
Country Status (6)
Country | Link |
---|---|
US (1) | US5890123A (ja) |
EP (1) | EP0747881B1 (ja) |
JP (1) | JP3432076B2 (ja) |
CA (1) | CA2177865C (ja) |
DE (1) | DE69618082T2 (ja) |
ES (1) | ES2166427T3 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000137596A (ja) * | 1998-10-06 | 2000-05-16 | Lucent Technol Inc | 対話型音声応答システム |
JP2001255885A (ja) * | 2000-03-13 | 2001-09-21 | Oki Electric Ind Co Ltd | 音声ブラウザシステム |
JP2003525477A (ja) * | 1998-10-02 | 2003-08-26 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 汎用階層オブジェクトを介する効率的なボイス・ナビゲーションのための構造スケルトン |
Families Citing this family (124)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6009464A (en) * | 1995-09-20 | 1999-12-28 | Sun Microsystems, Inc. | Method and apparatus for enabling application programs to communicate with network clients and servers |
US5953392A (en) * | 1996-03-01 | 1999-09-14 | Netphonic Communications, Inc. | Method and apparatus for telephonically accessing and navigating the internet |
EP2184864A3 (en) | 1996-04-26 | 2011-12-14 | AT & T Corp. | Method and apparatus for data transmission using multiple transmit antennas |
US6996609B2 (en) | 1996-05-01 | 2006-02-07 | G&H Nevada Tek | Method and apparatus for accessing a wide area network |
US6188985B1 (en) * | 1997-01-06 | 2001-02-13 | Texas Instruments Incorporated | Wireless voice-activated device for control of a processor-based host system |
US6775264B1 (en) | 1997-03-03 | 2004-08-10 | Webley Systems, Inc. | Computer, internet and telecommunications based network |
US6996533B2 (en) * | 1997-03-21 | 2006-02-07 | Fujitsu Limited | Information processing system |
US6856960B1 (en) * | 1997-04-14 | 2005-02-15 | At & T Corp. | System and method for providing remote automatic speech recognition and text-to-speech services via a packet network |
US6078886A (en) * | 1997-04-14 | 2000-06-20 | At&T Corporation | System and method for providing remote automatic speech recognition services via a packet network |
US8209184B1 (en) | 1997-04-14 | 2012-06-26 | At&T Intellectual Property Ii, L.P. | System and method of providing generated speech via a network |
DE69712485T2 (de) | 1997-10-23 | 2002-12-12 | Sony Int Europe Gmbh | Sprachschnittstelle für ein Hausnetzwerk |
DE19751290A1 (de) * | 1997-11-19 | 1999-05-20 | X Ist Realtime Technologies Gm | Einheit und Verfahren zum Transformieren von akustischen Signalen |
US6282512B1 (en) * | 1998-02-05 | 2001-08-28 | Texas Instruments Incorporated | Enhancement of markup language pages to support spoken queries |
JP4197195B2 (ja) * | 1998-02-27 | 2008-12-17 | ヒューレット・パッカード・カンパニー | 音声情報の提供方法 |
US6115686A (en) * | 1998-04-02 | 2000-09-05 | Industrial Technology Research Institute | Hyper text mark up language document to speech converter |
US6499013B1 (en) * | 1998-09-09 | 2002-12-24 | One Voice Technologies, Inc. | Interactive user interface using speech recognition and natural language processing |
AU1025399A (en) * | 1998-09-22 | 2000-04-10 | Nokia Networks Oy | Method and system of configuring a speech recognition system |
EP1119845A1 (en) * | 1998-10-05 | 2001-08-01 | Lernout & Hauspie Speech Products N.V. | Speech controlled computer user interface |
US6185535B1 (en) * | 1998-10-16 | 2001-02-06 | Telefonaktiebolaget Lm Ericsson (Publ) | Voice control of a user interface to service applications |
US6163794A (en) * | 1998-10-23 | 2000-12-19 | General Magic | Network system extensible by users |
US6320623B1 (en) * | 1998-11-13 | 2001-11-20 | Philips Electronics North America Corporation | Method and device for detecting an event in a program of a video and/ or audio signal and for providing the program to a display upon detection of the event |
FR2786600B1 (fr) * | 1998-11-16 | 2001-04-20 | France Telecom | Procede de recherche par le contenu de documents textuels utilisant la reconnaissance vocale |
JP2000181676A (ja) | 1998-12-11 | 2000-06-30 | Nintendo Co Ltd | 画像処理装置 |
US6128482A (en) * | 1998-12-22 | 2000-10-03 | General Motors Corporation | Providing mobile application services with download of speaker independent voice model |
US6757718B1 (en) | 1999-01-05 | 2004-06-29 | Sri International | Mobile navigation of network-based electronic information using spoken input |
US6513063B1 (en) | 1999-01-05 | 2003-01-28 | Sri International | Accessing network-based electronic information through scripted online interfaces using spoken input |
US7036128B1 (en) | 1999-01-05 | 2006-04-25 | Sri International Offices | Using a community of distributed electronic agents to support a highly mobile, ambient computing environment |
US6851115B1 (en) | 1999-01-05 | 2005-02-01 | Sri International | Software-based architecture for communication and cooperation among distributed electronic agents |
US6742021B1 (en) | 1999-01-05 | 2004-05-25 | Sri International, Inc. | Navigating network-based electronic information using spoken input with multimodal error feedback |
US6523061B1 (en) | 1999-01-05 | 2003-02-18 | Sri International, Inc. | System, method, and article of manufacture for agent-based navigation in a speech-based data navigation system |
US6480819B1 (en) * | 1999-02-25 | 2002-11-12 | Matsushita Electric Industrial Co., Ltd. | Automatic search of audio channels by matching viewer-spoken words against closed-caption/audio content for interactive television |
DE19910236A1 (de) * | 1999-03-09 | 2000-09-21 | Philips Corp Intellectual Pty | Verfahren zur Spracherkennung |
US20050091057A1 (en) * | 1999-04-12 | 2005-04-28 | General Magic, Inc. | Voice application development methodology |
US20050261907A1 (en) | 1999-04-12 | 2005-11-24 | Ben Franklin Patent Holding Llc | Voice integration platform |
US6408272B1 (en) | 1999-04-12 | 2002-06-18 | General Magic, Inc. | Distributed voice user interface |
DE69942663D1 (de) * | 1999-04-13 | 2010-09-23 | Sony Deutschland Gmbh | Zusammenfügen von Sprachschnittstellen zur gleichzeitigen Benützung von Vorrichtungen und Anwendungen |
US6434523B1 (en) * | 1999-04-23 | 2002-08-13 | Nuance Communications | Creating and editing grammars for speech recognition graphically |
SE9902229L (sv) * | 1999-06-07 | 2001-02-05 | Ericsson Telefon Ab L M | Apparatus and method of controlling a voice controlled operation |
US6330537B1 (en) * | 1999-08-26 | 2001-12-11 | Matsushita Electric Industrial Co., Ltd. | Automatic filtering of TV contents using speech recognition and natural language |
US6513006B2 (en) * | 1999-08-26 | 2003-01-28 | Matsushita Electronic Industrial Co., Ltd. | Automatic control of household activity using speech recognition and natural language |
US6324512B1 (en) * | 1999-08-26 | 2001-11-27 | Matsushita Electric Industrial Co., Ltd. | System and method for allowing family members to access TV contents and program media recorder over telephone or internet |
US6601026B2 (en) * | 1999-09-17 | 2003-07-29 | Discern Communications, Inc. | Information retrieval by natural language querying |
US7925610B2 (en) * | 1999-09-22 | 2011-04-12 | Google Inc. | Determining a meaning of a knowledge item using document-based information |
US6434547B1 (en) | 1999-10-28 | 2002-08-13 | Qenm.Com | Data capture and verification system |
JP2003514261A (ja) * | 1999-11-09 | 2003-04-15 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | インターネットページのハイパーリンクを作動させる音声認識方法 |
US6978475B1 (en) * | 1999-11-24 | 2005-12-20 | Ecable, Llc | Method and apparatus for internet TV |
US6424945B1 (en) | 1999-12-15 | 2002-07-23 | Nokia Corporation | Voice packet data network browsing for mobile terminals system and method using a dual-mode wireless connection |
AU2001234833A1 (en) * | 2000-02-04 | 2001-08-14 | Webley Systems, Inc. | Robust voice and device browser system including unified bundle of telephone andnetwork services |
US6721705B2 (en) | 2000-02-04 | 2004-04-13 | Webley Systems, Inc. | Robust voice browser system and voice activated device controller |
US7516190B2 (en) | 2000-02-04 | 2009-04-07 | Parus Holdings, Inc. | Personal voice-based information retrieval system |
WO2001059759A1 (en) * | 2000-02-10 | 2001-08-16 | Randolphrand.Com Llp | Recorder adapted to interface with internet browser |
US6718308B1 (en) | 2000-02-22 | 2004-04-06 | Daniel L. Nolting | Media presentation system controlled by voice to text commands |
AU2001244906A1 (en) * | 2000-03-17 | 2001-09-24 | Susanna Merenyi | On line oral text reader system |
GB2362017A (en) * | 2000-03-29 | 2001-11-07 | John Pepin | Network access |
US7096185B2 (en) * | 2000-03-31 | 2006-08-22 | United Video Properties, Inc. | User speech interfaces for interactive media guidance applications |
US6865533B2 (en) * | 2000-04-21 | 2005-03-08 | Lessac Technology Inc. | Text to speech |
US7447299B1 (en) | 2000-05-02 | 2008-11-04 | Microsoft Corporation | Voice and telephone keypad based data entry for interacting with voice information services |
US7047196B2 (en) | 2000-06-08 | 2006-05-16 | Agiletv Corporation | System and method of voice recognition near a wireline node of a network supporting cable television and/or video delivery |
US6823311B2 (en) * | 2000-06-29 | 2004-11-23 | Fujitsu Limited | Data processing system for vocalizing web content |
US20060143007A1 (en) * | 2000-07-24 | 2006-06-29 | Koh V E | User interaction with voice information services |
US7623648B1 (en) | 2004-12-01 | 2009-11-24 | Tellme Networks, Inc. | Method and system of generating reference variations for directory assistance data |
US20020023142A1 (en) * | 2000-08-21 | 2002-02-21 | Michaelis A. John | Methods and apparatus for retrieving a web site based on broadcast radio or television programming |
US7406657B1 (en) | 2000-09-22 | 2008-07-29 | International Business Machines Corporation | Audible presentation and verbal interaction of HTML-like form constructs |
US6745163B1 (en) | 2000-09-27 | 2004-06-01 | International Business Machines Corporation | Method and system for synchronizing audio and visual presentation in a multi-modal content renderer |
AU2001294222A1 (en) * | 2000-10-11 | 2002-04-22 | Canon Kabushiki Kaisha | Information processing device, information processing method, and storage medium |
US6820056B1 (en) | 2000-11-21 | 2004-11-16 | International Business Machines Corporation | Recognizing non-verbal sound commands in an interactive computer controlled speech word recognition display system |
US6728681B2 (en) * | 2001-01-05 | 2004-04-27 | Charles L. Whitham | Interactive multimedia book |
US8095370B2 (en) * | 2001-02-16 | 2012-01-10 | Agiletv Corporation | Dual compression voice recordation non-repudiation system |
US7610547B2 (en) * | 2001-05-04 | 2009-10-27 | Microsoft Corporation | Markup language extensions for web enabled recognition |
US7409349B2 (en) * | 2001-05-04 | 2008-08-05 | Microsoft Corporation | Servers for web enabled speech recognition |
US7506022B2 (en) * | 2001-05-04 | 2009-03-17 | Microsoft.Corporation | Web enabled recognition architecture |
US7701437B2 (en) * | 2001-07-03 | 2010-04-20 | Koninklijke Philips Electronics N.V. | Interactive display and method of displaying a message |
EP1450351A4 (en) * | 2001-09-27 | 2006-05-17 | Matsushita Electric Ind Co Ltd | DIALOGUE DEVICE, FATHER DIALOGUE DEVICE, DIALOGUE THREAD DEVICE, DIALOGUE CONTROL METHOD, AND DIALOGUE CONTROL PROGRAM |
US8229753B2 (en) * | 2001-10-21 | 2012-07-24 | Microsoft Corporation | Web server controls for web enabled recognition and/or audible prompting |
US7711570B2 (en) * | 2001-10-21 | 2010-05-04 | Microsoft Corporation | Application abstraction with dialog purpose |
US6910911B2 (en) | 2002-06-27 | 2005-06-28 | Vocollect, Inc. | Break-away electrical connector |
US20040128136A1 (en) * | 2002-09-20 | 2004-07-01 | Irani Pourang Polad | Internet voice browser |
US7461352B2 (en) * | 2003-02-10 | 2008-12-02 | Ronald Mark Katsuranis | Voice activated system and methods to enable a computer user working in a first graphical application window to display and control on-screen help, internet, and other information content in a second graphical application window |
US20040244031A1 (en) * | 2003-02-26 | 2004-12-02 | Peter Martinez | System and method for a network of interactive televisions |
US7260535B2 (en) * | 2003-04-28 | 2007-08-21 | Microsoft Corporation | Web server controls for web enabled recognition and/or audible prompting for call controls |
US20040230637A1 (en) * | 2003-04-29 | 2004-11-18 | Microsoft Corporation | Application controls for speech enabled recognition |
US7421393B1 (en) * | 2004-03-01 | 2008-09-02 | At&T Corp. | System for developing a dialog manager using modular spoken-dialog components |
US20040250220A1 (en) * | 2003-06-09 | 2004-12-09 | Mika Kalenius | System, apparatus, and method for navigation in a hypertext document |
US20050010418A1 (en) * | 2003-07-10 | 2005-01-13 | Vocollect, Inc. | Method and system for intelligent prompt control in a multimodal software application |
US20050010892A1 (en) * | 2003-07-11 | 2005-01-13 | Vocollect, Inc. | Method and system for integrating multi-modal data capture device inputs with multi-modal output capabilities |
US20050171781A1 (en) * | 2004-01-08 | 2005-08-04 | Poploskie Jon M. | Speech information system |
US8160883B2 (en) * | 2004-01-10 | 2012-04-17 | Microsoft Corporation | Focus tracking in dialogs |
US7552055B2 (en) | 2004-01-10 | 2009-06-23 | Microsoft Corporation | Dialog component re-use in recognition systems |
US7412393B1 (en) * | 2004-03-01 | 2008-08-12 | At&T Corp. | Method for developing a dialog manager using modular spoken-dialog components |
JP3824168B2 (ja) * | 2004-11-08 | 2006-09-20 | 松下電器産業株式会社 | ディジタル映像再生装置 |
US7962842B2 (en) * | 2005-05-30 | 2011-06-14 | International Business Machines Corporation | Method and systems for accessing data by spelling discrimination letters of link names |
US20070233495A1 (en) * | 2006-03-29 | 2007-10-04 | International Business Machines Corporation | Partially automated technology for converting a graphical interface to a speech-enabled interface |
EP2118881A1 (en) * | 2007-02-13 | 2009-11-18 | Ntera Limited | Voltage feedback circuit for active matrix reflective display devices |
JP5002283B2 (ja) * | 2007-02-20 | 2012-08-15 | キヤノン株式会社 | 情報処理装置および情報処理方法 |
USD626949S1 (en) | 2008-02-20 | 2010-11-09 | Vocollect Healthcare Systems, Inc. | Body-worn mobile device |
US20090216534A1 (en) * | 2008-02-22 | 2009-08-27 | Prakash Somasundaram | Voice-activated emergency medical services communication and documentation system |
US9497322B2 (en) * | 2008-10-16 | 2016-11-15 | Troy Barnes | Remote control of a web browser |
US8386261B2 (en) | 2008-11-14 | 2013-02-26 | Vocollect Healthcare Systems, Inc. | Training/coaching system for a voice-enabled work environment |
US8406388B2 (en) | 2011-07-18 | 2013-03-26 | Zvi Or-Bach | Systems and methods for visual presentation and selection of IVR menu |
US8625756B1 (en) | 2010-02-03 | 2014-01-07 | Tal Lavian | Systems and methods for visual presentation and selection of IVR menu |
US8537989B1 (en) | 2010-02-03 | 2013-09-17 | Tal Lavian | Device and method for providing enhanced telephony |
US8903073B2 (en) | 2011-07-20 | 2014-12-02 | Zvi Or-Bach | Systems and methods for visual presentation and selection of IVR menu |
US8879698B1 (en) | 2010-02-03 | 2014-11-04 | Tal Lavian | Device and method for providing enhanced telephony |
US8594280B1 (en) | 2010-02-03 | 2013-11-26 | Zvi Or-Bach | Systems and methods for visual presentation and selection of IVR menu |
US8548131B1 (en) | 2010-02-03 | 2013-10-01 | Tal Lavian | Systems and methods for communicating with an interactive voice response system |
US8572303B2 (en) | 2010-02-03 | 2013-10-29 | Tal Lavian | Portable universal communication device |
US8548135B1 (en) | 2010-02-03 | 2013-10-01 | Tal Lavian | Systems and methods for visual presentation and selection of IVR menu |
US8553859B1 (en) | 2010-02-03 | 2013-10-08 | Tal Lavian | Device and method for providing enhanced telephony |
US8681951B1 (en) | 2010-02-03 | 2014-03-25 | Tal Lavian | Systems and methods for visual presentation and selection of IVR menu |
US9001819B1 (en) | 2010-02-18 | 2015-04-07 | Zvi Or-Bach | Systems and methods for visual presentation and selection of IVR menu |
US8687777B1 (en) | 2010-02-03 | 2014-04-01 | Tal Lavian | Systems and methods for visual presentation and selection of IVR menu |
US8659397B2 (en) | 2010-07-22 | 2014-02-25 | Vocollect, Inc. | Method and system for correctly identifying specific RFID tags |
USD643400S1 (en) | 2010-08-19 | 2011-08-16 | Vocollect Healthcare Systems, Inc. | Body-worn mobile device |
USD643013S1 (en) | 2010-08-20 | 2011-08-09 | Vocollect Healthcare Systems, Inc. | Body-worn mobile device |
US9600135B2 (en) | 2010-09-10 | 2017-03-21 | Vocollect, Inc. | Multimodal user notification system to assist in data capture |
KR20130016644A (ko) * | 2011-08-08 | 2013-02-18 | 삼성전자주식회사 | 음성인식장치, 음성인식서버, 음성인식시스템 및 음성인식방법 |
US8954334B2 (en) * | 2011-10-15 | 2015-02-10 | Zanavox | Voice-activated pulser |
US8867708B1 (en) | 2012-03-02 | 2014-10-21 | Tal Lavian | Systems and methods for visual presentation and selection of IVR menu |
US8731148B1 (en) | 2012-03-02 | 2014-05-20 | Tal Lavian | Systems and methods for visual presentation and selection of IVR menu |
US9020824B1 (en) * | 2012-03-09 | 2015-04-28 | Google Inc. | Using natural language processing to generate dynamic content |
CN103902193A (zh) * | 2012-12-30 | 2014-07-02 | 青岛海尔软件有限公司 | 利用语音操作电脑进行幻灯片切换的系统及方法 |
KR102281341B1 (ko) * | 2015-01-26 | 2021-07-23 | 엘지전자 주식회사 | 싱크 디바이스 및 그 제어 방법 |
CN105957530B (zh) | 2016-04-28 | 2020-01-03 | 海信集团有限公司 | 一种语音控制方法、装置和终端设备 |
CN110459211B (zh) | 2018-05-07 | 2023-06-23 | 阿里巴巴集团控股有限公司 | 人机对话方法、客户端、电子设备及存储介质 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0016314A1 (en) * | 1979-02-05 | 1980-10-01 | Best, Robert MacAndrew | Method and apparatus for voice dialogue between a video picture and a human |
JPS58195957A (ja) * | 1982-05-11 | 1983-11-15 | Casio Comput Co Ltd | 音声によるプログラム実行方式 |
US4704696A (en) * | 1984-01-26 | 1987-11-03 | Texas Instruments Incorporated | Method and apparatus for voice control of a computer |
US4726065A (en) * | 1984-01-26 | 1988-02-16 | Horst Froessl | Image manipulation by speech signals |
US4776016A (en) * | 1985-11-21 | 1988-10-04 | Position Orientation Systems, Inc. | Voice control system |
US5303148A (en) * | 1987-11-27 | 1994-04-12 | Picker International, Inc. | Voice actuated volume image controller and display controller |
DE3837511A1 (de) * | 1988-11-04 | 1990-05-10 | Philips Patentverwaltung | Kraftfahrzeugscheinwerferlampe und verfahren zu ihrer herstellung |
JPH03203794A (ja) * | 1989-12-29 | 1991-09-05 | Pioneer Electron Corp | 音声リモートコントロール装置 |
EP0557444A1 (en) * | 1990-11-14 | 1993-09-01 | Best, Robert MacAndrew | Talking video games |
JPH05111579A (ja) * | 1991-09-09 | 1993-05-07 | Robert M Best | ビデオゲーム方法 |
DE4135582A1 (de) * | 1991-10-29 | 1993-05-06 | Metallgesellschaft Ag, 6000 Frankfurt, De | Wirbelbettkuehler fuer eine anlage zum thermischen behandeln koerniger feststoffe in der wirbelschicht |
US5519809A (en) * | 1992-10-27 | 1996-05-21 | Technology International Incorporated | System and method for displaying geographical information |
EP0645757B1 (en) * | 1993-09-23 | 2000-04-05 | Xerox Corporation | Semantic co-occurrence filtering for speech recognition and signal transcription applications |
US5510981A (en) * | 1993-10-28 | 1996-04-23 | International Business Machines Corporation | Language translation apparatus and method using context-based translation models |
US5557539A (en) * | 1994-06-13 | 1996-09-17 | Centigram Communications Corporation | Apparatus and method for testing an interactive voice messaging system |
-
1995
- 1995-06-05 US US08/460,955 patent/US5890123A/en not_active Expired - Lifetime
-
1996
- 1996-05-29 ES ES96303839T patent/ES2166427T3/es not_active Expired - Lifetime
- 1996-05-29 DE DE69618082T patent/DE69618082T2/de not_active Expired - Lifetime
- 1996-05-29 EP EP96303839A patent/EP0747881B1/en not_active Expired - Lifetime
- 1996-05-31 CA CA002177865A patent/CA2177865C/en not_active Expired - Lifetime
- 1996-06-04 JP JP14125496A patent/JP3432076B2/ja not_active Expired - Fee Related
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003525477A (ja) * | 1998-10-02 | 2003-08-26 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 汎用階層オブジェクトを介する効率的なボイス・ナビゲーションのための構造スケルトン |
JP2000137596A (ja) * | 1998-10-06 | 2000-05-16 | Lucent Technol Inc | 対話型音声応答システム |
JP2001255885A (ja) * | 2000-03-13 | 2001-09-21 | Oki Electric Ind Co Ltd | 音声ブラウザシステム |
Also Published As
Publication number | Publication date |
---|---|
DE69618082T2 (de) | 2002-07-18 |
US5890123A (en) | 1999-03-30 |
EP0747881A2 (en) | 1996-12-11 |
EP0747881B1 (en) | 2001-12-19 |
CA2177865A1 (en) | 1996-12-06 |
EP0747881A3 (en) | 1998-03-04 |
CA2177865C (en) | 2001-01-30 |
ES2166427T3 (es) | 2002-04-16 |
DE69618082D1 (de) | 2002-01-31 |
JP3432076B2 (ja) | 2003-07-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3432076B2 (ja) | 音声対話型ビデオスクリーン表示システム | |
US6532444B1 (en) | Network interactive user interface using speech recognition and natural language processing | |
CA2436940C (en) | A method and system for voice activating web pages | |
US6434524B1 (en) | Object interactive user interface using speech recognition and natural language processing | |
JP3811280B2 (ja) | ハイパーリンク化された情報との音声化されたインターフェースのためのシステムおよび方法 | |
US7146323B2 (en) | Method and system for gathering information by voice input | |
EP2824596B1 (en) | Speech- Enabled Web Content Searching Using a Multimodal Browser | |
CA2280331C (en) | Web-based platform for interactive voice response (ivr) | |
US6456974B1 (en) | System and method for adding speech recognition capabilities to java | |
US8073692B2 (en) | Enabling speech recognition grammars in web page frames | |
US20040025115A1 (en) | Method, terminal, browser application, and mark-up language for multimodal interaction between a user and a terminal | |
US9349367B2 (en) | Records disambiguation in a multimodal application operating on a multimodal device | |
CA2408584A1 (en) | Natural language and dialogue generation processing | |
KR20030086612A (ko) | 정보 처리 장치와 그 방법, 및 프로그램 | |
House | Spoken-language access to multimedia(SLAM): a multimodal interface to the World-Wide Web | |
JP2002259113A (ja) | 音声マクロ処理装置、その方法、そのコンピュータ・プログラムおよびそのプログラムを記録した記録媒体 | |
EP1209660B1 (en) | Voice navigation in web applications | |
KR20000036801A (ko) | 웹브라우저 상에서의 음성인식 구현방법 | |
EP1881685B1 (en) | A method and system for voice activating web pages | |
Ju | Voice-enabled click and dial system | |
MXPA97009035A (en) | System and method for the sound interface with information hiperenlaz |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080523 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080523 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080523 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090523 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100523 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100523 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110523 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110523 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120523 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120523 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130523 Year of fee payment: 10 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |