JP2001255885A - 音声ブラウザシステム - Google Patents

音声ブラウザシステム

Info

Publication number
JP2001255885A
JP2001255885A JP2000068777A JP2000068777A JP2001255885A JP 2001255885 A JP2001255885 A JP 2001255885A JP 2000068777 A JP2000068777 A JP 2000068777A JP 2000068777 A JP2000068777 A JP 2000068777A JP 2001255885 A JP2001255885 A JP 2001255885A
Authority
JP
Japan
Prior art keywords
data
speech recognition
html
voice
client
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000068777A
Other languages
English (en)
Inventor
Tomohiro Iwanaga
智博 岩永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2000068777A priority Critical patent/JP2001255885A/ja
Publication of JP2001255885A publication Critical patent/JP2001255885A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 低容量のメモリしか持たないシステムでも実
行可能であり、また、CPUに対する負荷の少ない音声
ブラウザシステムを提供することを目的とする。 【解決手段】 クライアントは、サーバーよりHTML
データを取得する手段11と、サーバーからHTMLデ
ータと共に転送されたリンク対応語の音声認識辞書デー
タを抽出する手段12と、音声認識辞書データを用いて
リンク対応語の音声認識を行う音声認識手段15と、音
声認識手段により出力されたリンク情報に基づき対応す
るURL情報を抽出し、該URL情報に対応するHTM
Lデータをサーバに要求する手段11とを有し、サーバ
は、クライアントにより指定されたURL情報からHT
MLデータを取得する手段24と、HTMLデータから
リンク対応語を抽出する手段25と、音声認識辞書デー
タからリンク対応語に対応する音声認識辞書データを抽
出する手段26と、HTMLデータと音声認識辞書デー
タを統合したデータをクライアントに送信する手段24
とを有する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明はコンピュータネッ
トワーク上に存在するサーバーからテキストデータを中
心とする情報を検索し表示するシステムに関し、特に音
声を利用したシステムに関するものである。
【0002】
【従来の技術】従来、コンピュータネットワーク上、特
にインターネットにおいてサーバー/クライアント形式
でテキストや画像、音声などの情報を提供するWWW
(World Wide Web)システムがある。W
WWシステムではHTML(Hyper Text M
arkup Language)と呼ばれるハイパーテ
キスト形式で情報がサーバーからクライアントに送られ
る。クライアントではブラウザと呼ばれる情報閲覧装置
を用いてHTMLで記述されたテキストを閲覧する。読
み込まれたハイパーテキストにはリンクと呼ばれるタグ
が埋め込まれており、リンクから別のハイパーテキスト
を読み込むことができる。
【0003】図9(a)にHTMLデータの例を示す。
図に示されるようなHTMLデータをブラウザで表示す
ると図9(b)のようになる。図9(b)の10がリン
クである。一般的なブラウザではリンクされている部分
は文字の色を変えたり、下線を引くなど他のテキストと
区別できるように表示されている。リンクをマウスなど
のポインティングデバイスで選択すると、リンクされて
いるHTMLデータが読み込まれ、表示される。例え
ば、図9(b)の10のリンクで「ニュース」というリ
ンクを指定する単語(以下、リンク対応語とする)を選
択すると図9(a)のHTMLデータの記述により”n
ews.html”というHTMLデータが読み込まれ
る。
【0004】また、近年、テキスト音声合成技術と音声
認識技術を組み合わせて画面を見なくてもHTMLデー
タにアクセスすることができる音声ブラウザがある。こ
の音声ブラウザでは、HTMLデータのテキストを音声
合成で音声出力し、リンクを音声認識で選択することが
できる。
【0005】
【発明が解決しようとする課題】前述の音声ブラウザで
は画面を見ずに音声のみでHTMLデータを検索するこ
とができる。リンクの選択時に音声認識技術が使用され
るが、リンク対応語はあらゆる単語が想定されるため、
大規模な音声認識用辞書が必要となる。したがって、こ
れまでの音声ブラウザは大容量音声認識辞書が格納でき
る大容量記憶装置を持ったコンピュータなどでしか実現
できなかった。しかしながら、音声認識処理は大容量音
声認識辞書を検索するので処理に時間がかかるという問
題があった。
【0006】また、現在は携帯電話機または携帯端末等
の小型機器でHTMLデータをブラウズする装置が存在
しているが、これらの小型機器に音声ブラウザを搭載す
る場合、記憶装置に限界があるため、大容量の音声認識
用辞書を搭載することができず、リンクの選択には音声
認識が使えないためポインティングデバイスによって選
択するしかない状況にあった。
【0007】一方、近年のノート型パーソナルコンピュ
ータ(ノートPC)においては、大容量の記憶容量もっ
た記憶装置が使えるようになったので大容量音声認識辞
書を使用することが可能であるが、膨大な認識対象語か
らリンク対応語を認識するには多くの処理が必要であ
る。このような処理を高速に実行するためには高性能の
プロセッサを備えた装置が必要であり、一般にこのよう
な装置は高価である。
【0008】本発明は、前記従来の問題点を解決し、低
容量のメモリしか持たないシステムでも実行可能であ
り、また、CPUに対する負荷の少ない音声ブラウザシ
ステムを提供することを目的とする。
【0009】
【課題を解決するための手段】そのために、本発明(請
求項1)は、コンピュータネットワーク上においてサー
バー/クライアント形式でテキストや画像、音声などの
情報を提供するWWWシステムにおける音声ブラウザシ
ステムにおいて、前記クライアントを、サーバーよりH
TMLデータを取得する手段と、サーバーからHTML
データと共に転送されたリンク対応語の音声認識辞書デ
ータを抽出する手段と、該音声認識辞書データを用いて
リンク対応語の音声認識を行う音声認識手段と、該音声
認識手段により出力されたリンク情報に基づき対応する
URL情報を抽出し、該URL情報に対応するHTML
データをサーバに要求する手段とを有する構成とすると
共に、前記サーバを、クライアントにより指定されたU
RL情報からHTMLデータを取得する手段と、該HT
MLデータからリンク対応語を抽出する手段と、音声認
識辞書データからリンク対応語に対応する音声認識辞書
データを抽出する手段と、HTMLデータと音声認識辞
書データを統合したデータをクライアントに送信する手
段とを有する構成とした。
【0010】また、本発明(請求項2)は、コンピュー
タネットワーク上においてサーバー/クライアント形式
でテキストや画像、音声などの情報を提供するWWWシ
ステムにおける音声ブラウザシステムにおいて、前記ク
ライアントを、サーバーよりHTMLデータを取得する
手段と、サーバーからHTMLデータと共に転送された
リンク対応語の音声認識対象語リストを抽出する手段
と、該音声認識対象語リストを分解して単語単位辞書デ
ータを生成する手段と、該単語単位辞書データを用いて
リンク対応語の音声認識を行う音声認識手段と、該音声
認識手段により出力されたリンク情報に基づき対応する
URL情報を抽出し、該URL情報に対応するHTML
データをサーバに要求する手段とを有する構成とすると
共に、前記サーバを、クライアントにより指定されたU
RL情報からHTMLデータを取得する手段と、該HT
MLデータからリンク対応語を抽出する手段と、該リン
ク対応語に対応する音声認識対象語リストを抽出する手
段と、HTMLデータと音声認識対象語リストを統合し
たデータを前記クライアントに送信する手段とを有する
構成とした。
【0011】
【発明の実施の形態】図8は、本発明の実施形態におけ
るネットワークの構成例を示したもので、クライアント
端末22,23およびクライアントからのデータ取得要
求に対する応答その他の処理を行う音声プロキシサーバ
21,クライアントから要求されたURLに対するHT
MLデータを出力するWWWサーバから構成されてい
る。以下、図面を参照して本発明の実施の形態について
詳細に説明する。
【0012】<第1の実施形態> <構成>図1は、第1の実施形態の音声ブラウザシステ
ムにおける装置構成図であり、図1(a)はクライアン
ト端末である音声ブラウザ装置の構成図を示している。
図1(a)において、11はネットワークと通信を行う
ネットワーク通信部、12はネットワークを経由して得
られたHTMLデータを解析するHTML解析部、13
は12で解析されたHTMLデータを表示する表示部、
14はHTMLデータに含まれるテキストを音声合成す
るテキスト音声合成部、15は音声を認識する音声認識
部、16は15で使用するための音声認識辞書、17は
14で音声合成された音声を出力するためのスピーカ
ー、18は音声認識部に音声を入力するためのマイクで
ある。
【0013】図1(b)は音声プロキシ(代理)サーバ
の構成図を示している。図1(b)において、24はネ
ットワークと通信を行うネットワーク通信部、25はク
ライアントから要求があったURLに基づいて読み込ん
だHTMLデータを解析するHTML解析部、26は入
力された単語に対応する音声認識辞書データを抽出する
音声認識辞書抽出部、27は音声認識辞書、28はHT
MLデータに音声認識辞書データを付加する音声認識辞
書データ付きHTMLデータ生成部である。
【0014】<動作>以下、図1,図2、図3を参照し
て動作の説明を行う。クライアント端末である音声ブラ
ウザ装置は、ネットワーク通信部11を介してHTML
データとHTMLデータ中に含まれるリンク対応語の音
声認識用辞書データをネットワーク上から受信する。例
えば、図9(a)のようなHTMLデータの場合、リン
クに対応する言葉として「ニュース」、「天気予報」、
「交通情報」、「その他」があるので、これらのリンク
対応語に対する音声認識辞書データをHTMLデータと
共に受信する。
【0015】HTML解析部12ではネットワーク通信
部11が受信したHTMLデータと音声認識辞書データ
が転送され、HTMLデータを解析し、表示部13にテ
キストデータを送り表示する。またテキスト音声変換部
14にもテキストを転送し、テキストをテキスト音声変
換部14で音声合成し、スピーカー17より出力する。
HTML解析部12に転送された音声認識辞書データは
音声認識辞書16へ転送される。
【0016】マイク18より入力されたリンク対応語の
音声は音声認識部15で音声認識辞書16を参照して音
声認識を行い、リンク対応語が認識されたらHTML解
析部12にリンク情報を送る。HTML解析部12は音
声認識部15より送られたリンク情報に基づいて対応す
るURLを抽出し、をネットワーク通信部11に送り、
URLにより指定されたHTMLデータを転送してもら
うよう要求信号を音声プロキシサーバに送出する(図2
の)。
【0017】クライアントから要求を受けた音声プロキ
シサーバーは指定URLへHTMLデータを要求する
(図2の)。音声プロキシサーバーより要求を受けた
WWWサーバーは音声プロキシサーバーへ指定のHTM
Lデータを送信する(図2の)。
【0018】WWWサーバーよりHTMLデータを受信
した音声プロキシサーバーは内部処理でリンク対応語に
該当する音声認識辞書データを抽出し(図2の)、ク
ライアントから要求されたHTMLデータに音声認識辞
書データを加えてクライアントへ送信する(図2の
)。
【0019】次に音声プロキシサーバー内の動作につい
て図3のフローチャートを使用して説明する。処理(S
7−1)は処理のスタートである。処理(S7−2)で
はクライアントからURLを受信する。処理(S7−
3)では指定されたURLに存在するWWWサーバーよ
りHTMLデータを受信する。処理(S7−4)では受
信したHTMLデータの中からリンク情報を検索し、リ
ンクがなければ処理(S7−11)へ処理を移し、リン
クが存在すれば次の処理(S7−5)へ進む。処理(S
7−5)ではリンク対応語を抽出し、処理(S7−6)
では音声認識辞書と照合する。処理(S7−7)ではリ
ンク対応語の音声認識辞書データを抽出し、処理(S7
−8)ではリンク対応語と音声認識辞書データの統合を
行う。処理(S7−9)では処理(S7−8)で作られ
たデータとHTMLデータを共にクライアントへ送信す
る。
【0020】以上説明したように本実施形態によれば、
HTMLデータ中に含まれるリンク対応語の音声認識辞
書データをHTMLデータと共に受信することにより、
クライアント側で大容量の音声認識辞書を持つ必要がな
いく、小容量の記憶装置を備えるだけでよい。従って、
特に大容量記憶装置を持つことが困難な携帯型端末にお
いても容易に音声ブラウザを実装することが可能にな
る。また、音声認識において認識すべき語をリンク対応
語に絞り込めるので、認識処理が軽くなり、処理速度が
向上する。
【0021】また、本実施形態によれば、HTMLデー
タのリンク対応語に音声認識辞書データを添付していな
い一般のWWWサーバーでも音声プロキシサーバーを通
すことによって音声認識辞書データを添付したHTML
データに変換することが可能である。これによって本実
施形態における音声ブラウザ装置でも容易にインターネ
ット上に存在するWWWサーバーへアクセスすることが
可能になる。
【0022】<第2の実施形態> <構成>図4は、第2の実施形態の音声ブラウザシステ
ムにおける装置構成図であり、図4(a)はクライアン
ト端末である音声ブラウザ装置の構成図を示している。
図4(a)において、31はネットワークと通信を行う
ネットワーク通信部、32はネットワーク経由で受信し
たHTMLデータを解析するHTML解析部、33は3
2で解析されたHTMLデータを表示する表示部、34
はHTMLデータに含まれるテキストを音声合成するテ
キスト音声合成部、35は音声を認識する音韻単位音声
認識部、36は35で使用するための音声認識音韻辞
書、37は34で音声合成された音声を出力するための
スピーカー、38は音声認識部に音声を入力するための
マイクである。
【0023】図4(b)は音声プロキシ(代理)サーバ
の構成図を示している。図4(b)において、41はネ
ットワークと通信を行うネットワーク通信部、42はク
ライアントから要求があったアドレスより読み込んだH
TMLデータを解析するHTML解析部、43は入力さ
れた単語に対応する音声認識対象語リストを抽出する音
声認識対象語抽出部、44はHTMLデータに音声認識
対象語リストを付加する音声認識対象語リスト付きHT
MLデータ生成部、45は音声認識対象語を抽出するた
めに使用する単語辞書である。
【0024】<動作>以下、図4,図5、図6、図7を
参照して動作の説明を行う。クライアント端末である音
声ブラウザ装置はネットワーク通信部31よりHTML
データとHTMLデータ中に含まれるリンク対応語の音
声認識対象語リストを受信する。音声認識対象語リスト
とは認識語の発音を指定する単語のリストである。例え
ば、第9図のようなHTMLデータの場合、リンクに対
応する言葉として「ニュース」、「天気予報」、「交通
情報」、「その他」があるので、これらのリンク対応語
に対する音声認識対象語リストとして「ニュウス」、
「テンキヨホウ」、「コウツウジョウホウ」、「ソノ
タ」をHTMLデータと共に受信する。
【0025】HTML解析部32ではネットワーク通信
部31が受信したHTMLデータと音声認識対象語リス
トを受け取り、HTMLデータを解析し、表示部33に
テキストデータを送り表示する。またテキスト音声変換
部34にもテキストを転送し、テキストをテキスト音声
変換部34で音声合成し、スピーカー37より出力す
る。HTML解析部32に送られた音声認識対象語リス
トは音韻単位音声認識部35へ転送される。
【0026】音韻単位音声認識部35では音声認識音韻
辞書36より音韻辞書データを取りだし、音声認識対象
語リストの単語を音韻単位に分解して単語辞書を生成す
る。
【0027】音韻辞書から単語辞書への合成方法を図5
を用いて説明する。音声認識対象語リストとして「ソノ
タ」が入力された場合、それぞれの「ソ」、「ノ」、
「タ」の音韻データを音韻辞書36より抽出し、図5の
ように合成し、「ソノタ」という単語の単語辞書データ
を生成する。
【0028】マイク38より入力されたリンク対応語の
音声は音声認識部35で音韻辞書より作成された単語辞
書データを参照して音声認識が行われ、リンク対応語が
認識されたらHTML解析部32にリンク情報を送る。
【0029】HTML解析部32は音声認識部35より
送られたリンク情報とリンクしているURL情報をネッ
トワーク通信部31に送り、指定のHTMLデータを転
送してもらうよう要求信号を送出する(図6の)。
【0030】クライアントから要求を受けた音声プロキ
シサーバーは指定URLへHTMLデータを要求する
(図6の)。音声プロキシサーバーより要求を受けた
WWWサーバーは音声プロキシサーバーへ指定のHTM
Lデータを送信する(図6の)。WWWサーバーより
要求したHTMLデータを受けとった音声プロキシサー
バーは内部処理でリンク対応語に該当する音声認識対象
語リストを抽出し(図6の)、要求されたHTMLデ
ータに音声認識対象語リストを加えてクライアントへ送
信する(図6の)。
【0031】次に音声プロキシサーバー内の動作につい
て図7のフローチャートを使用して説明する。処理(S
12−1)は処理のスタートである。処理(S12−
2)ではクライアントからURLを受信する。処理(S
12−3)では指定されたURLに存在するWWWサー
バーよりHTMLデータを受信する。処理(S12−
4)では受信したHTMLデータの中からリンク情報を
検索し、リンクがなければ処理(S12−8)へ処理を
移し、リンクが存在すれば次の処理(S12−5)へ進
む。処理(S12−5)ではリンク対応語を抽出し、処
理(S12−6)では単語辞書より音声認識対象語リス
トを抽出するし、処理(S12−7)ではリンク対応語
と音声認識対象語リストの統合を行う。処理(S12−
8)では処理(S12−7)で作られたデータをHTM
Lデータと共にクライアントへ送信する。
【0032】以上説明したように本実施形態によれば、
HTMLデータ中に含まれるリンク対応語の音声認識対
象語リストと共にHTMLデータを送ることにより、ク
ライアント側では音声認識音韻辞書のみ持ことで単語単
位の音声認識が可能になる。また、音声認識対象語リス
トを端末側で持つことによって認識対象語絞り込むこと
ができるので、音声認識処理を軽減することが可能にな
り、処理速度が向上する。また、第1の実施形態では音
声認識辞書データを送っているのに対して、第2の実施
形態では音声認識対象語リストのみを送っているので、
データ通信量が第1の実施形態に比べ軽減される。
【0033】尚、本発明は前述の実施形態に限定される
ものではなく、本発明の趣旨に基づいて種々変形させる
ことが可能である。例えば、実施形態1、2ではテキス
トを表示する表示装置を備えていたが、表示装置が無く
てもよい。また、実施形態1、2ではインターネットに
接続する例を示していたが、外部接続が無い、閉じたネ
ットワークに接続してもよい。
【0034】また、実施形態1、2ではハイパーテキス
トの形式としてHTMLとしたが、他のハイパーテキス
トの形式でもよい。更に、実施形態2では音声認識対象
語リストと音韻の表記としてカタカナを用いたが、ひら
がな、ローマ字など、発音を表記できるものであれば、
どのような文字や記号を用いてもよい。
【0035】また、実施形態2では音韻単位辞書を用い
た音声認識を使用したが、サブワード単位を用いた音声
認識でもよい。サブワード単位とは単語よりも小さい単
位で音節、音韻、音素などの単位のことを指す。
【0036】
【発明の効果】以上、詳細に説明したように、第1の発
明によれば、コンピュータネットワーク上においてサー
バー/クライアント形式でテキストや画像、音声などの
情報を提供するWWWシステムにおける音声ブラウザシ
ステムにおいて、前記クライアントを、サーバーよりH
TMLデータを取得する手段と、サーバーからHTML
データと共に転送されたリンク対応語の音声認識辞書デ
ータを抽出する手段と、該音声認識辞書データを用いて
リンク対応語の音声認識を行う音声認識手段と、該音声
認識手段により出力されたリンク情報に基づき対応する
URL情報を抽出し、該URL情報に対応するHTML
データをサーバに要求する手段とを有する構成とすると
共に、前記サーバを、クライアントにより指定されたU
RL情報からHTMLデータを取得する手段と、該HT
MLデータからリンク対応語を抽出する手段と、音声認
識辞書データからリンク対応語に対応する音声認識辞書
データを抽出する手段と、HTMLデータと音声認識辞
書データを統合したデータをクライアントに送信する手
段とを有する構成としたので、HTMLデータ中に含ま
れるリンク対応語の音声認識辞書データをHTMLデー
タと共に受信することにより、クライアント側で大容量
の音声認識辞書を持つ必要がないく、小容量の記憶装置
を備えるだけでよい。従って、特に大容量記憶装置を持
つことが困難な携帯型端末においても容易に音声ブラウ
ザを実装することが可能になる。また、音声認識におい
て認識すべき語をリンク対応語に絞り込めるので、認識
処理が軽くなり、処理速度が向上する。
【0037】また、第2の発明によれば、コンピュータ
ネットワーク上においてサーバー/クライアント形式で
テキストや画像、音声などの情報を提供するWWWシス
テムにおける音声ブラウザシステムにおいて、前記クラ
イアントを、サーバーよりHTMLデータを取得する手
段と、サーバーからHTMLデータと共に転送されたリ
ンク対応語の音声認識対象語リストを抽出する手段と、
該音声認識対象語リストを分解して単語単位辞書データ
を生成する手段と、該単語単位辞書データを用いてリン
ク対応語の音声認識を行う音声認識手段と、該音声認識
手段により出力されたリンク情報に基づき対応するUR
L情報を抽出し、該URL情報に対応するHTMLデー
タをサーバに要求する手段とを有する構成とすると共
に、前記サーバを、クライアントにより指定されたUR
L情報からHTMLデータを取得する手段と、該HTM
Lデータからリンク対応語を抽出する手段と、該リンク
対応語に対応する音声認識対象語リストを抽出する手段
と、HTMLデータと音声認識対象語リストを統合した
データを前記クライアントに送信する手段とを有する構
成としたので、HTMLデータ中に含まれるリンク対応
語の音声認識対象語リストと共にHTMLデータを送る
ことにより、クライアント側では音声認識音韻辞書のみ
持ことで単語単位の音声認識が可能になる。また、音声
認識対象語リストを端末側で持つことによって認識対象
語絞り込むことができるので、音声認識処理を軽減する
ことが可能になり、処理速度が向上する。また、音声認
識辞書データに替わって音声認識対象語リストのみを送
っているので、データ通信量が軽減される。
【図面の簡単な説明】
【図1】第1の実施形態の音声ブラウザシステムにおけ
る装置構成図である。
【図2】第1の実施形態の音声ブラウザシステムの動作
フローである。
【図3】第1の実施形態における音声プロキシサーバー
の動作フローチャートである。
【図4】第2の実施形態の音声ブラウザシステムにおけ
る装置構成図である。
【図5】音韻辞書の連結モデルの一例を示す図である。
【図6】第2の実施形態の音声ブラウザシステムの動作
フローである。
【図7】第2の実施形態における音声プロキシサーバー
の動作フローチャートである。
【図8】本発明の実施形態に於けるネットワークの構成
例を示す図である。
【図9】従来技術の説明図である。
【符号の説明】
11、31、 ネットワーク通信部 12、32 HTML解析部 13、33 表示部 14、34 テキスト音声変換部 15 音声認識部 16 音声認識辞書 17、37 スピーカ 24、41 ネットワーク通信部 25、42 HTML解析部(リンク抽出部) 26 音声認識辞書抽出部 27 音声認識辞書 28 音声認識辞書データ付きHTMLデータ生
成部 35 音韻単位音声認識部 36 音声認識音韻辞書 43 音声認識対象語抽出部 44 音声認識対象語リスト付きHTMLデータ
生成部 45 単語辞書
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G10L 15/28 G10L 3/00 551P Fターム(参考) 5B075 KK03 KK07 KK13 KK33 KK37 ND03 ND08 ND14 ND20 ND23 ND36 NK10 NK13 NK24 PQ02 PQ04 UU01 UU05 UU40 5D015 GG00 KK02 KK03 9A001 BB04 FF03 HH17 JJ05 JJ25 JJ26 JJ27

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 コンピュータネットワーク上においてサ
    ーバー/クライアント形式でテキストや画像、音声など
    の情報を提供するWWWシステムにおける音声ブラウザ
    システムであって、 前記クライアントは、 サーバーよりHTMLデータを取得する手段と、 サーバーからHTMLデータと共に転送されたリンク対
    応語の音声認識辞書データを抽出する手段と、 該音声認識辞書データを用いてリンク対応語の音声認識
    を行う音声認識手段と、 該音声認識手段により出力されたリンク情報に基づき対
    応するURL情報を抽出し、該URL情報に対応するH
    TMLデータをサーバに要求する手段と、を有し、 前記サーバは、 クライアントにより指定されたURL情報からHTML
    データを取得する手段と、 該HTMLデータからリンク対応語を抽出する手段と、 音声認識辞書データからリンク対応語に対応する音声認
    識辞書データを抽出する手段と、 HTMLデータと音声認識辞書データを統合したデータ
    をクライアントに送信する手段と、を有することを特徴
    とする音声ブラウザシステム。
  2. 【請求項2】 コンピュータネットワーク上においてサ
    ーバー/クライアント形式でテキストや画像、音声など
    の情報を提供するWWWシステムにおける音声ブラウザ
    システムであって、 前記クライアントは、 サーバーよりHTMLデータを取得する手段と、 サーバーからHTMLデータと共に転送されたリンク対
    応語の音声認識対象語リストを抽出する手段と、 該音声認識対象語リストを分解して単語単位辞書データ
    を生成する手段と、 該単語単位辞書データを用いてリンク対応語の音声認識
    を行う音声認識手段と、 該音声認識手段により出力されたリンク情報に基づき対
    応するURL情報を抽出し、該URL情報に対応するH
    TMLデータをサーバに要求する手段と、を有し、 前記サーバは、 クライアントにより指定されたURL情報からHTML
    データを取得する手段と、 該HTMLデータからリンク対応語を抽出する手段と、 該リンク対応語に対応する音声認識対象語リストを抽出
    する手段と、 HTMLデータと音声認識対象語リストを統合したデー
    タを前記クライアントに送信する手段と、を有すること
    を特徴とする音声ブラウザシステム。
JP2000068777A 2000-03-13 2000-03-13 音声ブラウザシステム Pending JP2001255885A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000068777A JP2001255885A (ja) 2000-03-13 2000-03-13 音声ブラウザシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000068777A JP2001255885A (ja) 2000-03-13 2000-03-13 音声ブラウザシステム

Publications (1)

Publication Number Publication Date
JP2001255885A true JP2001255885A (ja) 2001-09-21

Family

ID=18587782

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000068777A Pending JP2001255885A (ja) 2000-03-13 2000-03-13 音声ブラウザシステム

Country Status (1)

Country Link
JP (1) JP2001255885A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009244432A (ja) * 2008-03-29 2009-10-22 Kddi Corp 携帯端末の音声認識装置、方法、プログラム
US8676582B2 (en) 2007-03-14 2014-03-18 Nec Corporation System and method for speech recognition using a reduced user dictionary, and computer readable storage medium therefor

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08335160A (ja) * 1995-06-05 1996-12-17 At & T Ipm Corp ビデオスクリーン表示を音声対話型にするシステム
JPH10207685A (ja) * 1996-12-04 1998-08-07 At & T Corp ハイパーリンク化された情報との音声化されたインターフェースのためのシステムおよび方法
JP2001092845A (ja) * 1999-09-27 2001-04-06 Toshiba Corp 文書取得方法及び記録媒体
JP2001134418A (ja) * 1999-11-08 2001-05-18 Nippon Telegr & Teleph Corp <Ntt> ハイパーテキスト中継方法及び装置
JP2001215023A (ja) * 2000-02-03 2001-08-10 Harman Co Ltd ガスこんろ
JP2001255881A (ja) * 2000-03-13 2001-09-21 Matsushita Electric Ind Co Ltd 自動音声認識/合成ブラウザシステム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08335160A (ja) * 1995-06-05 1996-12-17 At & T Ipm Corp ビデオスクリーン表示を音声対話型にするシステム
JPH10207685A (ja) * 1996-12-04 1998-08-07 At & T Corp ハイパーリンク化された情報との音声化されたインターフェースのためのシステムおよび方法
JP2001092845A (ja) * 1999-09-27 2001-04-06 Toshiba Corp 文書取得方法及び記録媒体
JP2001134418A (ja) * 1999-11-08 2001-05-18 Nippon Telegr & Teleph Corp <Ntt> ハイパーテキスト中継方法及び装置
JP2001215023A (ja) * 2000-02-03 2001-08-10 Harman Co Ltd ガスこんろ
JP2001255881A (ja) * 2000-03-13 2001-09-21 Matsushita Electric Ind Co Ltd 自動音声認識/合成ブラウザシステム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8676582B2 (en) 2007-03-14 2014-03-18 Nec Corporation System and method for speech recognition using a reduced user dictionary, and computer readable storage medium therefor
JP2009244432A (ja) * 2008-03-29 2009-10-22 Kddi Corp 携帯端末の音声認識装置、方法、プログラム

Similar Documents

Publication Publication Date Title
US8073700B2 (en) Retrieval and presentation of network service results for mobile device using a multimodal browser
JP4028375B2 (ja) 言語に無関係な音声ベースのサーチ・システム
TW497044B (en) Wireless voice-activated device for control of a processor-based host system
EP1215656B1 (en) Idiom handling in voice service systems
TW200416567A (en) Multimodal speech-to-speech language translation and display
KR20090090613A (ko) 멀티모달 대화형 이미지 관리 시스템 및 방법
JP3789614B2 (ja) ブラウザシステム、音声プロキシサーバ、リンク項目の読み上げ方法及びリンク項目の読み上げプログラムを格納した記憶媒体
JP6625772B2 (ja) 検索方法及びそれを用いた電子機器
JPH07222248A (ja) 携帯型情報端末における音声情報の利用方式
JPH10124293A (ja) 音声指令可能なコンピュータとそれ用の媒体
JP2005249829A (ja) 音声認識を行うコンピュータネットワークシステム
KR20070119153A (ko) 멀티모달을 위한 브라우저 기반의 무선 단말과, 무선단말을 위한 브라우저 기반의 멀티모달 서버 및 시스템과이의 운용 방법
WO2017135214A1 (ja) 音声翻訳システム、音声翻訳方法、及び音声翻訳プログラム
TWI220205B (en) Device using handheld communication equipment to calculate and process natural language and method thereof
JP2001255885A (ja) 音声ブラウザシステム
WO2017122657A1 (ja) 音声翻訳装置、音声翻訳方法、及び音声翻訳プログラム
JP2001075968A (ja) 情報検索方法及びそれを記録した記録媒体
JPH10326178A (ja) 情報処理装置及びプログラム記憶媒体
KR20010008073A (ko) 음성 인식 및 번역 전용 에이직을 이용한 휴대용 다국어번역 단말장치
KR100652580B1 (ko) 이동단말기의 텍스트/음성 변환 방법
EP1729284A1 (en) Method and systems for a accessing data by spelling discrimination letters of link names
WO2002099786A1 (en) Method and device for multimodal interactive browsing
JP2001255881A (ja) 自動音声認識/合成ブラウザシステム
JPH11272442A (ja) 音声合成装置およびプログラムを記憶した媒体
Habeeb et al. Design module for speech recognition graphical user interface browser to supports the web speech applications

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040120