JP2000215023A - ペ―ジ記述言語表示装置及びペ―ジ記述言語表示プログラムを記録した機械読み取り可能な記録媒体 - Google Patents

ペ―ジ記述言語表示装置及びペ―ジ記述言語表示プログラムを記録した機械読み取り可能な記録媒体

Info

Publication number
JP2000215023A
JP2000215023A JP11012904A JP1290499A JP2000215023A JP 2000215023 A JP2000215023 A JP 2000215023A JP 11012904 A JP11012904 A JP 11012904A JP 1290499 A JP1290499 A JP 1290499A JP 2000215023 A JP2000215023 A JP 2000215023A
Authority
JP
Japan
Prior art keywords
link
description language
page description
information
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP11012904A
Other languages
English (en)
Inventor
Toru Terauchi
亨 寺内
Toshiaki Ikeda
敏明 池田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba AVE Co Ltd
Original Assignee
Toshiba Corp
Toshiba AVE Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba AVE Co Ltd filed Critical Toshiba Corp
Priority to JP11012904A priority Critical patent/JP2000215023A/ja
Publication of JP2000215023A publication Critical patent/JP2000215023A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Computer And Data Communications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】リンク部分の選択やページ記述言語データの切
り替えが、リンク部分が多数ある場合でも音声操作によ
り簡単に且つ高精度に行えるようにする。 【解決手段】言語解析部107はページ記述言語解析部
102でのページ記述言語データ解析結果からリンク情
報を受け取ってリンク文字列を解析し、その文字列の平
仮名語と語彙番号からなる認識辞書108と、その語彙
番号とリンク情報中のリンク先との対応を記述した認識
テーブル109を生成する。音声認識処理部112は入
力音声データを平仮名語に変換して、認識辞書108の
登録語と比較照合することで確度付きの認識候補を取得
する。認識判定部113は、この認識候補の中から確度
が規定値以上の語彙番号を1つ選択して認識テーブル1
09から対応するリンク先を取得し、ページ記述言語入
力制御部101に対してそのリンク先のページ記述言語
データの入力指示を行う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声制御可能なペ
ージ記述言語表示装置及びページ記述言語表示プログラ
ムを記録した機械読み取り可能な記録媒体に関する。
【0002】
【従来の技術】近年、HTML(HyperText
Markup Language)に代表されるページ
記述言語を表示する装置として、WWW(Wor1d
Wide Web)ブラウザと呼ばれる装置が広く普及
している。
【0003】この種のページ記述言語表示装置では、マ
ウスに代表されるポインティングデバイスやキーボード
などの手を使う入力装置で操作するのが一般的である。
【0004】また、この種のページ記述言語表示装置に
おいて、URL(UniformResource L
ocator)に代表されるアドレス情報を指定するに
は、予め登録しておく方法、既に登録してあるページの
リンク情報から辿る方法、またはマウスやキーボードな
どから直接指定する方法が適用可能である。
【0005】
【発明が解決しようとする課題】しかしながら、上記の
ような従来のページ記述言語表示装置では、以下のよう
な問題を有している。
【0006】(1)リンク部分の選択やページ記述言語
データの切り替え操作は、マウスやキーボードなどの手
を使う入力装置を用いて行うことが前提となっているた
め、手が使えない状態においては操作できない。また、
手を使う入力装置が必要であることから、ページ記述言
語表示装置の持ち運びや設置場所確保の点で不利であ
る。
【0007】(2)音声認識機能を持たせることによ
り、手を使う入力装置を使用しての操作に代えて音声に
よる操作を実現することも可能であるが、リンク部分が
多数ある場合などには、リンク部分の選択を効率よく行
うことが難しい。
【0008】(3)URLなどのアドレス情報が不明な
場合は手作業で検索の操作を行う必要がある。
【0009】(4)URLなどのアドレス情報に任意の
語を関連付けて蓄積する場合はキーボードなどの手を使
う入力装置を使用して語を入力する必要がある。
【0010】本発明は上記事情を考慮してなされたもの
でその目的は、リンク部分の選択やページ記述言語デー
タの切り替えが、リンク部分が多数ある場合でも音声操
作により簡単に且つ高精度に行え、操作性の向上を図る
ことができるページ記述言語表示装置及びページ記述言
語表示プログラムを記録した機械読み取り可能な記録媒
体を提供することにある。
【0011】
【課題を解決するための手段】上記の課題を解決するた
めに、本発明は、ページ記述言語データの入力を制御す
るページ記述言語入力制御手段と、入力されたページ記
述言語データを解析するページ記述言語解析手段と、上
記ページ記述言語解析手段の解析結果に基づきページ記
述言語データを表示器に表示する表示制御手段とを備え
たページ記述言語表示装置において、上記ページ記述言
語解析手段の解析結果からリンク部分のリンクを表すリ
ンク文字列とリンク先の情報を含むリンク情報を受け取
って上記リンク文字列を解析し、そのリンク文字列の発
音を表す発音情報を生成して当該発音情報及び対応する
リンク先の情報を記憶手段に記憶するリンク文字列解析
手段と、音声を入力するための音声入力手段と、入力さ
れた音声を上記記憶手段に記憶されている発音情報に基
づき解析して音声認識を行う音声認識処理手段と、この
音声認識処理手段の認識結果に基づき上記記憶手段から
対応するリンク先情報を取得し、当該リンク先情報に従
うページ記述言語データの入力を上記ページ記述言語入
力制御手段に指示する認識判定手段とを備えたことを特
徴とする。
【0012】このような構成においては、ページ記述言
語解析手段の解析結果に含まれるリンク情報を利用し
て、リンク文字列解析手段にて当該リンク情報中のリン
ク文字列が解析されて、そのリンク文字列の発音を表す
発音情報が生成され、その発音情報及び対応する(リン
ク情報中の)リンク先の情報が記憶手段に記憶される。
【0013】ここでユーザが表示状態にあるページ記述
言語データ中の任意のリンク文字列を音声で入力する
と、その音声データが対応する発音情報に音声認識処理
手段にて変換され、その変換された発音情報を記憶手段
内の各リンク文字列の発音情報と比較照合することで入
力音声を認識する認識処理が行われる。この記憶手段内
の各リンク文字列の発音情報は、ページ記述言語解析手
段の解析結果に基づいて表示制御手段により表示器に表
示されるページ記述言語データ中のリンク文字列の発音
を表す発音情報である。つまり上記の構成においては、
表示状態にあるページ記述言語データ中の各リンク部分
のリンク文字列の範囲内で入力音声に対する音声認識処
理が行われる。
【0014】これにより、ユーザが表示状態にあるペー
ジ記述言語データ中の任意のリンク部分のリンク文字列
を音声で入力すると、その入力音声を高精度且つ高速に
認識して、そのリンク文字列を表す発音情報(認識辞書
情報)に対応して記憶手段に記憶されているリンク先情
報を取得して、そのリンク先情報に従うページ記述言語
データの入力制御を行うことができ、音声による操作で
ページ記述言語データの表示を切り替えることが高精度
に且つ高速にできる。
【0015】ここで、上記ページ記述言語解析手段によ
り解析されたリンク情報のうち、表示器の表示領域に表
示されるリンク部分のリンク情報を対象に、表示領域上
の表示位置を解析し、その表示位置を表す語彙の発音情
報をリンク文字列として、当該リンク文字列及び対応す
るリンク先の情報を含む新たなリンク情報を生成する表
示位置解析手段を更に設けると共に、上記リンク文字列
解析手段では、上記ページ記述言語解析手段により解析
されたリンク情報に加えて、この表示位置解析手段によ
り生成されるリンク情報についても(或いは表示位置解
析手段により生成されるリンク情報についてのみ)、そ
のリンク情報に含まれるリンク文字列を解析し、そのリ
ンク文字列の発音を表す発音情報を生成して当該発音情
報及び対応するリンク先の情報を記憶手段に記憶する構
成を適用してもよい。
【0016】このような構成においては、表示状態にあ
るページ記述言語データ中のリンク部分の任意のリンク
文字列について、音声で入力しなくても、単にそのリン
ク文字列の表示位置を表す語彙(「左」「右下」等)を
音声で入力するだけで、その語彙の示す位置に表示され
ているリンク部分を選択して該当するリンク先にページ
記述言語データの表示を切り替えることができる。ここ
では、表示領域上に表示されているリンク部分であれ
ば、リンク文字列に限らず、例えばリンク画像等のリン
ク部分も、その表示位置を表す語彙を音声で入力するだ
けで選択できる。
【0017】また、上記ページ記述言語解析手段の解析
結果から、表示領域内の特徴物とリンク部分との位置関
係を解析し、当該特徴物の特徴及び位置関係を表す語彙
をリンク文字列として、当該リンク文字列及び対応する
リンク先の情報を含む新たなリンク情報を生成する特徴
物位置解析手段を更に設け、この特徴物位置解析手段に
より生成されるリンク情報についても(或いは、この特
徴物位置解析手段により生成されるリンク情報について
のみ)、そのリンク情報に含まれるリンク文字列を解析
し、そのリンク文字列の発音を表す発音情報を生成して
当該発音情報及び対応するリンク先の情報を記憶手段に
記憶する構成を適用してもよい。
【0018】このような構成においては、表示状態にあ
るページ記述言語データ中のリンク部分の任意のリンク
文字列について、音声で入力しなくても、単にそのリン
ク文字列(リンク部分)の近傍に表示されている特徴物
(データ種別、形状、色等の点で特徴のある表示情報)
の特徴(「画像」「表」「赤文字」等)とその特徴物か
らの当該リンク部分の相対位置とを表す語彙(「画像の
左」「表の上」「赤文字の下」等)を音声で入力するだ
けで、当該リンク部分を選択して該当するリンク先にペ
ージ記述言語データの表示を切り替えることができる。
このリンク部分の選択は、リンク文字列に限らず、例え
ばリンク画像等のリンク部分についても同様に行える。
【0019】また、上記認識判定手段により上記音声認
識処理手段の認識結果に対応するリンク先情報が取得で
きなかった場合に、当該認識結果に対応する語彙を検索
キーとして検索を自動実行する自動検索手段を更に設け
るようにしてもよい。ここで、音声認識処理手段の認識
結果に対応するリンク先情報が取得できたか否かを判定
するのに、音声認識処理手段による、入力音声データに
対応する発音情報と記憶手段内の各リンク文字列の発音
情報との比較照合による認識処理で得られる、入力音声
データがそのリンク文字列である確からしさを表す評価
値(確度、或いは類似度)の中に、規定値以上のものが
あるか否かを調べる手法を適用するとよい。
【0020】上記の構成においては、音声認識処理手段
の認識結果に対応するリンク先情報が取得できなかった
場合、つまりユーザが表示状態にあるページ記述言語デ
ータ中のリンク部分とは無関係の情報を音声で入力した
場合には、その入力音声に対する音声認識処理手段の認
識結果、つまり音声認識処理手段にて入力音声データか
ら変換された発音情報(日本語音声であれば、例えば平
仮名)に対応する語彙(日本語であれば漢字仮名混じ
文)を検索キーとして検索が自動実行される。
【0021】したがって、表示状態にあるページ記述言
語データの中に、ユーザの期待する情報がなかった場合
にも、ユーザが必要とするページ記述言語データに関連
する情報を音声で入力するだけで、特別な手入力操作を
必要とせずに自動的に関連する情報を提示することがで
きるようになる。
【0022】また、上記音声入力手段により入力された
音声を連続的に認識可能な連続音声認識処理手段と、こ
の連続音声認識処理手段の連続音声認識結果に基づいて
入力音声の内容を解析する内容解析手段であって、上記
表示器に表示されているページ記述言語データのリンク
部分が音声の入力と並行して選択された場合に、内容解
析結果を表す発音情報を生成して当該発音情報及び上記
選択されたリンク部分のリンク先の情報を前記記憶手段
に追加保存する内容解析手段とを更に設けるようにして
もよい。
【0023】上記の構成においては、ユーザの発声した
音声の内容(会話内容)と選択したリンク部分のリンク
先の情報とを関連付けて記憶手段に保存(蓄積)するこ
と、即ちユーザが選択したリンク先を自分で指定した音
声内容で関連付けて蓄積することができる。このためユ
ーザは以後、自身が選択したリンク先にページ記述言語
データの表示を切り替える操作を、表示中のページ記述
言語データとは無関係に、自分で決めた音声の入力によ
り行うことができる。また、この記憶手段に蓄積されて
いる会話内容とリンク先との対応情報を、いつでも画面
を通して参照することも可能である。
【0024】
【発明の実施の形態】以下、本発明の実施の形態につき
図面を参照して説明する。
【0025】[第1の実施形態]図1は本発明の第1の
実施形態に係るページ記述言語表示装置の構成を主とし
て示すブロック図である。
【0026】同図において、ページ記述言語表示装置1
00は、インターネット11に接続された情報提供サー
バ計算機としてのWWWサーバ12のデータ(ページ記
述言語データ)を表示するための周知の構成である、ペ
ージ記述言語入力制御部101と、ページ記述言語解析
部102と、表示制御部103と、操作入力部104
と、CRTディスプレイ105とを備えている。
【0027】ページ記述言語表示装置100は更に、本
実施形態の特徴である、音声による操作でリンク部分の
選択やページ記述言語データの切り替えを可能とするた
めの音声制御手段を構成する、言語解析部107と、認
識辞書108及び認識テーブル109等を記憶するのに
用いられる認識情報記憶部110と、音声入力部111
と、音声認識処理部112と、認識判定部113とを備
えている。
【0028】ページ記述言語表示装置100内のページ
記述言語入力制御部101では、モデム、ルータなどの
インターネット接続装置13を経由してインターネット
11に接続されているWWWサーバ12と通信を行い、
図2(a)に示すようなHTMLなどのページ記述言語
データを取り込む。このページ記述言語データは、ペー
ジ記述言語解析部102に送られる。
【0029】ページ記述言語解析部102は、ページ記
述言語入力制御部101から送られたページ記述言語デ
ータを解析し、データ内の書式や属性を表す文字列(以
下、書式属性文字列と称する)と通常の文字列とを判別
する。ページ記述言語解析部102はまた、判別した書
式属性文字列について、その意味を解釈し、表示制御部
103に対して表示命令を送る。ページ記述言語解析部
102は必要であれば、更にページ記述言語入力制御部
101に対して入力の指示を行う。
【0030】操作入力部104は、マウス等のポインテ
ィングデバイス、或いはキーボード等、手を使っての入
力操作が行われる入力手段を有している。操作入力部1
04は、ユーザからのマウス、キーボード等を用いた入
力や選択などの操作を受け付け、入力の結果を表示する
命令を表示制御部103に対して送り、必要であれば、
更にページ記述言語入力制御部103に対して入力の指
示を行う。
【0031】表示制御部103は、ページ記述言語解析
部104及び操作入力部104より送られた表示命令を
解釈し、表示手段としてのCRTディスプレイ105に
表示を行う。なお、CRTディスプレイ105に代え
て、液晶ディスプレイ、プラズマディスプレイ等、他の
表示手段を用いることも可能である。
【0032】ページ記述言語データの一例を図2(a)
に、その表示例を図2(b)に示す。ここまでの、ペー
ジ記述言語表示装置100の動作は従来のページ記述言
語表示装置と同様である。
【0033】次に、本実施形態の特徴である、ページ記
述言語表示装置100における音声制御について、図6
及び図7のフローチャートを適宜参照して説明する。ま
ず、WWWサーバ12との通信によりページ記述言語入
力制御部101で取り込んだページ記述言語データは、
ページ記述言語解析部102に送られる。
【0034】ページ記述言語解析部102は、前記した
ようにページ記述言語データを解析して、その解析結果
をもとに表示制御部103に表示命令を送る。同時にペ
ージ記述言語解析部102は、ページ記述言語データの
リンク部分のリンクを表す文字列(リンク文字列)とリ
ンク先からなるリンク情報を言語解析部107に送る。
【0035】ここで、ページ記述言語データのリンク部
分は、図2(a)の例であれば、データ21,22,2
3である。また、当該リンク部分のリンク文字列は、当
該リンク部分が図2(a)のデータ21の例であれば、
図3(a)に示す“新着情報”というデータ32であ
り、リンク先は図3(b)に示す“whatsnew.
html”というデータ31である。したがって、図2
(a)のデータ21に関し、ページ記述言語解析部10
2から言語解析部107には、図3(b)に示すような
リンク文字列とリンク先からなるリンク情報が送られる
ことになる。
【0036】言語解析部107は、ページ記述言語解析
部102から送られたリンク情報を受け取ると、当該リ
ンク情報のうちのリンク文字列を解析する。ここでは言
語解析部107は、リンク文字列を単語単位に分解する
(ステップA1)。
【0037】次に言語解析部107は、各単語毎に、そ
の単語の読み(発音)を表す読み情報(発音情報)とし
ての例えば平仮名の語彙に変換し(ステップA2)、そ
の語彙とその語彙の識別子としての語彙番号からなる認
識辞書108を認識情報記憶部110上に作成する(ス
テップA3)。また言語解析部107は、作成した認識
辞書108上の各語彙の語彙番号と当該語彙のもとにな
ったリンク文字列と対をなす(リンク情報中の)リンク
先との対応を記述した認識テーブル109を認識情報記
憶部110上に作成する(ステップA4)。この認識辞
書108及び認識テーブル109は、CRTディスプレ
イ105に表示されているページ記述言語データが切り
替えられる毎に、作成し直される。
【0038】ページ記述言語データが図2(a)の場合
に言語解析部107で作成される認識辞書108の一例
を図4(a)に、同じく認識テーブル109の一例を図
4(b)に示す。
【0039】さて、ページ記述言語表示装置100に
は、前記したように音声入力部111が設けられてい
る。音声入力部111は、ユーザの発声した音声をマイ
クロフォンなどにより電気信号である音声信号に変換
し、その音声信号をアナログ/ディジタル変換器により
ディジタル信号に変換し、更に符号化して音声データと
して音声認識処理部112に送る。
【0040】音声認識処理部112は、内部に音声認識
のための辞書を持っており、当該辞書に基づいて、音声
データを読み(発音)を表す読み情報(発音情報)とし
ての例えば平仮名語に変換する(ステップB1)。した
がって、ページ記述言語データの表示状態で、ユーザが
その表示データ中の所望のリンク文字列(または当該文
字列内でキーとなる単語部分)を音声で入力すると、音
声認識処理部112では、対応する平仮名語が取得され
る。
【0041】次に音声認識処理部112は、取得した平
仮名語を認識辞書108中の登録語と比較照合すること
で、当該平仮名語に一致または類似した登録語(以下、
認識候補と称する)が認識辞書108に存在するか否か
を判断し、該当する全ての認識候補について、その候補
(語)の語彙番号とその候補が上記平仮名語である確か
らしさを示す確度(類似度)とからなる認識候補情報を
取得する(ステップB2)。そして音声認識処理部11
2は、取得した認識候補情報を認識判定部113に送る
(ステップB3)。
【0042】図5は、図2(b)に示したページ記述言
語データの表示状態で、ユーザが「いべんとじょうほう
(イベント情報)」と発声した場合に、音声認識処理部
112から認識判定部113に送られる認識候補情報
(をなす語彙番号と確度)の例を示す。
【0043】認識判定部113は、音声認識処理部11
2から送られた認識候補情報に基き、確度が規定値以上
の語彙番号を1つ選択する(ステップB4)。ここで、
規定値以上の候補が1つだけの場合には、その候補の語
彙番号をそのまま選択すればよい。これに対し、確度が
規定値以上の候補が複数ある場合の選択については、候
補をCRTディスプレイ105に表示してユーザに選択
させてもよいし、認識判定部113での判定アルゴリズ
ムに予め選択ルールを設定しておき、当該ルールに基づ
いて自動的に選択してもよい。また、確度の規定値は、
認識判定部113での判定アルゴリズム中に予め固定的
に設定されるものであっても、或いはユーザが任意に設
定・変更できるものであっても構わない。
【0044】認識判定部113は確度が規定値以上の語
彙番号を1つ選択すると、その選択した語彙番号に対応
するリンク先を認識テーブル109より取得する(ステ
ップB5)。
【0045】認識判定部113は、認識テーブル109
よりリンク先を取得すると、そのリンク先について表示
制御部103に表示を指示すると同時に、ページ記述言
語入力制御部101に対して当該リンク先のページ記述
言語データの入力指示を行う(ステップB6)。
【0046】この入力指示に応じて、ページ記述言語入
力制御部101は、指示されたリンク先のページ記述言
語データを該当するWWWサーバ12からインターネッ
ト接続装置13を介して取り込む。これによりCRTデ
ィスプレイ105に表示されるページ記述言語データ
が、、ユーザから音声で入力されたリンク文字列に対応
するリンク先のページ記述言語データに切り替えられ
る。
【0047】このように本実施形態のページ記述言語表
示装置100においては、画面表示状態にあるページ記
述言語データ中のリンク文字列をユーザが音声で入力す
ることにより、対応するリンク部分を選択することがで
きる。しかも、入力音声に対する認識処理の範囲が、画
面表示状態にあるページ記述言語データから取得される
リンク文字列に限られるため、認識精度が高く且つ認識
処理速度が高速となる。
【0048】なお、以上に述べた実施形態では、認識情
報記憶部110には、リンク情報中のリンク文字列を解
析して得られる各単語の読み情報(発音情報)としての
平仮名語彙がその語彙の識別子としての語彙番号と対を
なして登録される認識辞書108と、当該認識辞書10
8上の各語彙の語彙番号と当該語彙のもとになったリン
ク文字列と対をなす(リンク情報中の)リンク先との対
応を記述した認識テーブル109とが、独立して記憶さ
れる場合について説明したが、これに限るものではな
い。例えば、リンク情報中のリンク文字列を解析して得
られる各単語の読み情報としての平仮名語彙と、その語
彙の識別子としての語彙番号と、その語彙のもとになっ
たリンク文字列と対をなす(リンク情報中の)リンク先
との組が認識情報記憶部110に記憶される構成であっ
ても構わない。また、平仮名語彙自体を識別子と兼用す
るならば、語彙番号は必ずしも必要としない。
【0049】[第2の実施形態]次に、本発明の第2の
実施形態について図面を参照して説明する。図8は本発
明の第2の実施形態に係るページ記述言語表示装置の構
成を主として示すブロック図であり、図1と同一部分に
は同一符号を付してある。
【0050】図8のページ記述言語表示装置200の特
徴は、図1のページ記述言語表示装置100とは異なっ
て、表示状態にあるページ記述言語データ中のリンク部
分(リンク文字列、リンク画像等)の表示領域内での表
示位置(上中下など)を音声で入力するだけで、対応す
るリンク部分を選択できるようにしたものである。
【0051】そのために、図8のページ記述言語表示装
置200は、図1のページ記述言語表示装置100に、
表示状態にあるページ記述言語データ中のリンク部分が
表示領域上でどのような位置にあるかを解析するための
表示位置解析部201を追加した構成を適用している。
【0052】以下、図8の構成のページ記述言語表示装
置200の動作について、図1のページ記述言語表示装
置100と相違する点を中心に説明する。まず、WWW
サーバ12との通信によりページ記述言語入力制御部1
01で取り込んだページ記述言語データは、ページ記述
言語解析部102に送られる。
【0053】ページ記述言語解析部102は、ページ記
述言語データを解析して、その解析結果をもとに表示制
御部103に表示命令を送る。同時にページ記述言語解
析部102は、解析したページ記述言語データのリンク
部分の情報(リンク情報)を表示位置解析部201に送
る。このリンク情報には、表示領域(表示画面)のサイ
ズ、当該表示領域に表示される(リンク文字列、リンク
画像等の)リンク部分の当該表示領域上での表示位置及
びサイズを含む付加情報が付されている。この点でペー
ジ記述言語表示装置200中のページ記述言語解析部1
02は、図1のページ記述言語表示装置100中のペー
ジ記述言語解析部102とは一部異なるが、便宜的に同
一符号を付してある。
【0054】ページ記述言語解析部102から表示位置
解析部201に送られる(付加情報付きの)リンク情報
の一例を図9に示す。また、この場合のページ記述言語
データの表示例を図10(a)に示す。
【0055】表示位置解析部201は、ページ記述言語
解析部102から送られた(付加情報付きの)リンク情
報を受け取ると、図13のフローチャートに従う表示位
置判断処理を次のように行う。
【0056】まず表示位置解析部201は、受け取った
リンク情報に基づき、(リンク文字列、リンク画像等
の)リンク部分が表示領域上でどのような位置にあるか
を判断する(ステップC1)。
【0057】次に表示位置解析部201は、各リンク部
分について、上記判断した表示位置を表す語(「上」、
「中」、「下」など)を、リンク文字列(疑似リンク文
字列)として、そのリンク文字列とその位置に対応する
リンク先の情報を新たなリンク情報として言語解析部1
07に送る(ステップC2)。この表示位置解析部20
1から言語解析部107に送られるリンク情報の一例を
図10(b)に示す。
【0058】ここで、表示位置解析部201における表
示位置判断処理の詳細について説明する。まず、表示位
置解析部201で適用可能な「リンク部分が表示領域上
でどのような位置にあるかを判断する」処理には様々な
方法があるが、本実施形態では以下に述べる最も簡便な
方法が適用されるものとする。
【0059】表示位置解析部201は、例えば図11
(a)に示すように、表示領域を上中下に3分割し、そ
れぞれのブロックについて「上」、「中」、「下」のよ
うな位置を表す語を割り当てる。また表示位置解析部2
01は、各ブロックの位置(ここでは、ブロック左上端
を示す開始位置)と、当該ブロックのサイズを計算す
る。そして表示位置解析部201は、各ブロックに割り
当てた、当該ブロックの位置を表す各語と当該ブロック
の位置と当該ブロックのサイズからなるブロック情報を
生成して記憶しておく。このブロック情報の一例を図1
2に示す。なお、表示領域の分割は、図11(a)の方
法に限るものではなく、図11(b)のように左中右に
3分割する方法、図11(c)のように縦横にそれぞれ
3等分して合計9個のブロックに分割する方法、更には
それ以上細分化する方法が適用可能である。また、ペー
ジ記述言語データの表示内容に応じて、表示領域分割の
方法がユーザにより選択可能な構成とすることも可能で
ある。
【0060】表示位置解析部201は、ページ記述言語
解析部102から図9に示したような付加情報付きのリ
ンク情報を受け取ると、そのリンク情報中のリンク部分
について、対応する付加情報に基づいて各ブロック内で
の表示面積を計算し、当該表示面積が最大となるブロッ
クを第1候補として、位置を判断する。これにより表示
位置解析部201は、判断した位置を表す語をリンク文
字列(疑似リンク文字列)として、そのリンク文字列と
その位置に対応するリンク先の情報を新たなリンク情報
として言語解析部107に送る。この表示位置解析部2
01から言語解析部107に送られるリンク情報の一例
を図10(b)に示す。
【0061】言語解析部107は、表示位置解析部20
1から送られたリンク情報を受け取ると、前記第1の実
施形態と同様の処理を行う。前記第1の実施形態と相違
する点は、リンク情報がページ記述言語解析部102で
はなくて表示位置解析部201から送られる点と、この
リンク情報中のリンク文字列がリンク部分の表示領域上
の位置を表す語彙である点である。
【0062】即ち言語解析部107は、図6のフローチ
ャートに示すように、表示位置解析部201より受け取
ったリンク情報のうちのリンク文字列(ここでは、リン
ク部分の表示領域上の位置を表す語)を解析し、当該文
字列を単語毎に分解して平仮名の語彙に変換する(ステ
ップA1,A2)。次に言語解析部107は、その語彙
と語彙番号からなる認識辞書108を作成すると共に、
その語彙番号と(リンク情報中の)リンク先の対応を記
述した認識テーブル109を作成する(ステップA3,
A4)。
【0063】表示位置解析部201から言語解析部10
7に送られたリンク情報が図10(b)の場合に当該言
語解析部107で作成される認識辞書108の例を同図
10(c)に、認識テーブル109の例を同図10
(d)に示す。この認識辞書108及び認識テーブル1
09は、CRTディスプレイ105に表示されているペ
ージ記述言語データが切り替えられる毎に、作成し直さ
れるだけでなく、表示中のページ記述言語データが画面
スクロールされ(てスクロールが停止され)る毎に、作
成し直される。
【0064】言語解析部107にて認識辞書108及び
認識テーブル109が作成された後の動作は前記第1の
実施形態と同様である。但し、ユーザは、表示状態にあ
るページ記述言語データ中のリンク文字列ではなくて、
当該ページ記述言語データ中のリンク文字列、リンク画
像等のリンク部分の表示領域内での表示位置(「上」、
「中」、「下」など)を音声で入力する。
【0065】認識辞書108が図10(c)、認識テー
ブル109が図10(d)の場合、ページ記述言語デー
タが図10(a)のように表示されている状態でユーザ
が例えば「うえ(上)」と発声すると、リンク文字列
「新着情報」のリンク先にページ記述言語データを切り
替えることが可能となる。
【0066】なお、表示位置解析部201から言語解析
部107に対し、表示位置解析部201で作成したリン
ク情報に加えて、ページ記述言語解析部102から当該
表示位置解析部201に送られたリンク情報も送って、
言語解析部107での言語解析に伴う認識辞書108と
認識テーブル109の作成に供することにより、前記第
1の実施形態と同様に、リンク文字列を音声で入力する
ことでも対応するリンク部分を選択できる。
【0067】[第3の実施形態]図14は本発明の第3
の実施形態に係るページ記述言語表示装置の構成を主と
して示すブロック図であり、図8と同一部分には同一符
号を付してある。
【0068】図14のページ記述言語表示装置300の
特徴は、図8のページ記述言語表示装置200とは異な
って、表示状態にあるページ記述言語データ中のリンク
部分の絶対的な表示位置だけではなく、そのリンク部分
の近傍に表示されている特徴ある属性(情報種別、色、
形状等)を持つ表示情報、例えば画像、表といった特定
の情報種別(データタイプ)の表示情報や、色付きの
(カラータグを持つ)文字列などの表示情報、つまり特
徴物(特徴表示物)からの相対的な表示位置を音声で入
力するだけでも、対応するリンク部分を選択できるよう
にしたものである。
【0069】そのために、図14のページ記述言語表示
装置300は、図8のページ記述言語表示装置200
に、画面表示されているページ記述言語データ中の各特
徴物の特徴、及びその特徴物と各リンク部分の位置関係
を解析するための特徴物位置解析部301を追加した構
成を適用している。
【0070】以下、図14の構成のページ記述言語表示
装置300の動作について、図8のページ記述言語表示
装置200と相違する点を中心に説明する。まず、WW
Wサーバ12との通信によりページ記述言語入力制御部
101で取り込んだページ記述言語データは、ページ記
述言語解析部102に送られる。
【0071】ページ記述言語解析部102は、ページ記
述言語データを解析して、その解析結果をもとに表示制
御部103に表示命令を送る。同時にページ記述言語解
析部102は、解析したページ記述言語データのリンク
部分の情報、即ちリンク文字列とリンク先の情報に加え
て、表示領域のサイズと、リンク文字列の当該表示領域
上での表示位置及びサイズと、当該表示領域に表示され
るリンク文字列以外の表示情報のデータタイプ(情報種
別)、当該表示情報の表示領域上での表示位置及びサイ
ズとを含む付加情報が付されたリンク情報を特徴物位置
解析部301に送る。この点でページ記述言語表示装置
300中のページ記述言語解析部102は、図8のペー
ジ記述言語表示装置200中のページ記述言語解析部1
02とは一部異なるが、便宜的に同一符号を付してあ
る。
【0072】ページ記述言語解析部102から特徴物位
置解析部301に送られる(付加情報付きの)リンク情
報の一例を図15に示す。また、この場合のページ記述
言語データの表示例を図16(a)に示す。ここでは、
「新着情報」というリンク文字列160の上側には「ト
ピック」という文字列(特徴物)161が赤色で表示さ
れている。また、リンク文字列160の右側には、画像
(特徴物)162が表示され、下側には表(特徴物)1
63が表示されている。
【0073】特徴物位置解析部301は、ページ記述言
語解析部102により送られたページ記述言語データに
対する解析結果としての(付加情報付きの)リンク情報
に基づき、各特徴物と各リンク部分の位置関係を判断
し、図16(b)に示す一例のように、特徴物からの位
置を表す語をリンク文字列として、当該リンク文字列及
び対応するリンク先の情報を新たなリンク情報として言
語解析部107へ送ると共に、ページ記述言語解析部1
02より送られた(付加情報付きの)リンク情報を表示
位置解析部201へ送る。この表示位置解析部201で
の処理(表示位置判断処理)内容は、前記第2の実施形
態と同様であり、各リンク部分について、その表示位置
を表す語をリンク文字列として生成し、そのリンク文字
列及び対応するリンク先の情報を新たなリンク情報とし
て言語解析部107に送る。また、表示位置解析部20
1から言語解析部107には、特徴物位置解析部301
より受け取ったページ記述言語解析部102からのリン
ク情報も送られる。
【0074】ここで、特徴物位置解析部301における
特徴物位置判断処理の詳細について説明する。まず、特
徴物位置解析部301で適用可能な「リンク部分が表示
領域上の特徴物とどのような位置関係にあるかを判断す
る」処理には様々な方法があるが、本実施形態では図1
8のフローチャートに示す手順が適用されるものとす
る。
【0075】特徴物位置解析部301は、ページ記述言
語解析部102により送られたページ記述言語データに
対する解析結果としての(付加情報付きの)リンク情報
に基づき、1つの特徴物(画像、表、或いは色付きの文
字列等の特徴ある表示情報)について、図17(a)、
図17(b)または図17(c)のように、当該特徴物
を基準として表示領域を複数のブロックに分割し、それ
ぞれのブロックについて当該特徴物を基準として
「上」、「下」のような位置を表す語を割り当てる(ス
テップD1〜D3)。
【0076】次に特徴物位置解析部301は、各ブロッ
クの位置及びサイズを計算する(ステップD4)。そし
て特徴物位置解析部301は、該当する特徴物につい
て、その特徴物を基準として分割された複数のブロック
に割り当てた、当該ブロックの位置を表す各語と当該ブ
ロックの位置と当該ブロックのサイズからなるブロック
情報を生成して記憶する(ステップD5)。
【0077】次に特徴物位置解析部301は、ページ記
述言語解析部102から送られた(付加情報付きの)リ
ンク情報に基づき、各リンク部分について、現在選択し
ている特徴物を基準として分割された複数のブロックの
それぞれ内部に表示される部分の表示面積を計算し、リ
ンク部分の表示面積が最大となるブロックを第1候補と
して決定する(ステップD6)。
【0078】そして特徴物位置解析部301は、現在選
択している特徴物の特徴を表す語(「画像」、「表」と
いったデータタイプを表す語や、赤文字といった色を表
す語など)と上記第1候補のブロックの位置を表す語と
を結合して、「赤文字の下」、「画像の左」といった語
を生成し、その語をリンク文字列として、そのリンク文
字列及び対応するリンク先の情報を新たなリンク情報と
して言語解析部107に送る(ステップD7)。特徴物
位置解析部301は、以上の処理(ステップD1〜D
7)を、全ての特徴物について繰り返す(ステップD
8)。
【0079】言語解析部107は、特徴物位置解析部3
01及び表示位置解析部201から送られたリンク情報
を受け取ると、前記第1の実施形態と同様の処理を行
う。即ち言語解析部107は、図6のフローチャートに
示すように、特徴物位置解析部301及び表示位置解析
部201から送られたリンク情報のうちのリンク文字列
を解析し、当該文字列を単語毎に分解して平仮名の語彙
に変換する(ステップA1,A2)。次に言語解析部1
07は、その語彙と語彙番号からなる認識辞書108を
作成すると共に、その語彙番号と(リンク情報中の)リ
ンク先の対応を記述した認識テーブル109を作成する
(ステップA3,A4)。
【0080】特徴物位置解析部301から言語解析部1
07に送られたリンク情報が図16(b)の場合に当該
言語解析部107で作成される認識辞書108の例を同
図16(c)に、認識テーブル109の例を同図16
(d)に示す。この認識辞書108及び認識テーブル1
09は、CRTディスプレイ105に表示されているペ
ージ記述言語データが切り替えられる毎に、作成し直さ
れるだけでなく、表示中のページ記述言語データが画面
スクロールされ(てスクロールが停止され)る毎に、作
成し直される。
【0081】言語解析部107にて認識辞書108及び
認識テーブル109が作成された後の動作は前記第1の
実施形態と同様である。但し、ユーザは、表示状態にあ
るページ記述言語データ中の所望のリンク文字列を選択
指定するのに、そのリンク文字列、或いは当該リンク文
字列の表示領域内での表示位置(「上」、「中」、
「下」など)だけでなく、当該リンク文字列の近傍の特
徴物の特徴と当該特徴物を基準とする目的のリンク文字
列の位置を表す語(「赤文字の下」、「画像の左」な
ど)を音声で入力することができる。ここでは、前記第
2の実施形態と同様に、リンク文字列だけでなく、リン
ク画像等表示領域内の任意のリンク部分が音声で間接的
に指定できる。
【0082】なお、以上の実施形態では、言語解析部1
07に送られるリンク情報が、特徴物位置解析部301
及び表示位置解析部201でそれぞれ生成されるリンク
情報と、ページ記述言語解析部102で解析されるリン
ク情報である場合について説明したが、少なくとも特徴
物位置解析部301で生成されるリンク情報が言語解析
部107に送られるものであればよい。
【0083】また以上の実施形態では、特徴物位置解析
部301が図8中のページ記述言語表示装置200に追
加されたものとして説明したが、図1中のページ記述言
語表示装置100に追加される構成であっても構わな
い。
【0084】[第4の実施形態]次に、本発明の第4の
実施形態について図面を参照して説明する。図19は本
発明の第4の実施形態に係るページ記述言語表示装置の
構成を主として示すブロック図であり、図1と同一部分
には同一符号を付してある。
【0085】図19のページ記述言語表示装置400の
特徴は、図1のページ記述言語表示装置100とは異な
って、音声認識処理部112で得られた認識候補の中に
規定値以上の確度の認識候補が存在しない場合には、音
声認識処理部112で取得された入力音声データの読み
情報(発音情報)としての平仮名語に対応する語彙を検
索キーとして、その語彙に関連する情報を持つページ記
述言語データを自動的に検索して表示するページ記述言
語データを切り替えることができるようにしたものであ
る。
【0086】そのために、図16のページ記述言語表示
装置400は、図1のページ記述言語表示装置100
に、音声認識処理部112で取得された全認識候補の確
度がいずれも規定値未満の場合に、音声認識処理部11
2で取得された入力音声データの読み情報(発音情報)
としての平仮名語を漢字仮名混じり文に変換し、その漢
字仮名混じり文を検索キーとして関連する情報を持つペ
ージ記述言語データを自動的に検索する自動検索部40
1を追加した構成を適用している。
【0087】以下、図19の構成のページ記述言語表示
装置400の動作について、図1のページ記述言語表示
装置100と相違する点を中心に説明する。音声認識処
理部112は、音声入力部111から送られた音声デー
タを、内部に持つ音声認識のための辞書に基づいて平仮
名語に変換する。次に音声認識処理部112は、認識辞
書108を参照して、平仮名語に一致または類似した認
識候補が認識辞書108に存在するか否かを判断し、該
当する全ての認識候補について、その候補(語)の語彙
番号と確度からなる認識候補情報を取得する。そして音
声認識処理部112は、取得した認識候補情報を、対応
する平仮名語と共に認識判定部113に送る。
【0088】認識判定部113は、音声認識処理部11
2から送られた認識候補情報中に、確度が規定値以上の
認識候補情報があるならば、その確度が規定値以上の認
識候補情報から語彙番号を1つ選択し、その語彙番号に
対応するリンク先を認識テーブル109より取得する。
【0089】認識判定部113は、認識テーブル109
よりリンク先を取得すると、そのリンク先について表示
制御部103に表示を指示すると同時に、ページ記述言
語入力制御部101に対して当該リンク先のページ記述
言語データの入力指示を行う。
【0090】この入力指示に応じて、ページ記述言語入
力制御部101は、指示されたリンク先のページ記述言
語データを該当するWWWサーバ12からインターネッ
ト接続装置13を介して取り込む。これによりCRTデ
ィスプレイ105に表示されるページ記述言語データ
が、、ユーザから音声で入力されたリンク文字列に対応
するリンク先のページ記述言語データに切り替えられ
る。
【0091】これに対し、音声認識処理部112から送
られた認識候補情報中の確度が全て規定値未満の場合に
は、認識判定部113は、その認識候補情報と共に音声
認識処理部112から送られた平仮名語、即ち入力音声
データから変換された平仮名語を自動検索部401に送
る。
【0092】自動検索部401は、内部に仮名漢字変換
辞書(図示せず)を持ち、認識判定部113より受け取
った平仮名語を漢字仮名混じり文に変換する。この平仮
名語を漢字仮名混じり文に変換する際に同音異義語があ
る場合は、CRTディスプレイ105を通してユーザに
変換候補を提示し、ユーザに適切な語を選択させるよう
にするとよい。
【0093】自動検索部401は、認識判定部113か
らの平仮名語に対応する漢字仮名混じり文を検索キーと
して、その漢字仮名混じり文に関連する情報を持つペー
ジ記述言語データを検索エンジンに検索させるためのア
ドレス情報としての例えば図20(b)に示すようなU
RLの1つを生成し、ページ記述言語入力制御部101
に対して検索キーに関連する情報を持つページ記述言語
データの入力指示を行う。
【0094】これにより、表示中のページ記述言語デー
タとは無関係に、ユーザにとって興味のある事柄につい
て音声で入力すると、その入力した語を検索キーとして
当該語に関連する情報を持つページ記述言語データを自
動的に検索することができる。
【0095】このとき、検索結果からユーザが所望のペ
ージ記述言語データを選択可能なように、CRTディス
プレイ105上の表示画面を検索画面に切り替えるよう
にしてもよい。また、検索画面への切り替えを行わず
に、装置側の予め定められた手順で検索したページ記述
言語データを表示してもよい。
【0096】なお本実施形態の自動検索部401には、
自動検索に使用可能な複数の検索エンジンのURLが登
録されている。この場合、自動検索に使用する検索エン
ジンを、ユーザの指定により、或いは予めシステムで指
定し、図20(a)のように検索エンジンへの検索キー
受け渡し方法を決めておくとよい。
【0097】なお以上の実施形態では、自動検索部40
1が図1中のページ記述言語表示装置100に追加され
たものとして説明したが、図8中のページ記述言語表示
装置200、或いは図14中のページ記述言語表示装置
300に追加される構成であっても構わない。
【0098】[第5の実施形態]次に、本発明の第5の
実施形態について図面を参照して説明する。図21は本
発明の第5の実施形態に係るページ記述言語表示装置の
構成を主として示すブロック図であり、図1と同一部分
には同一符号を付してある。
【0099】図21のページ記述言語表示装置500の
特徴は、表示状態にあるページ記述言語データからユー
ザが選択したリンク部分のリンク先を、その際のユーザ
が発声した音声の内容(会話内容)と関連付けて蓄積
(保存)できるようにしたものである。
【0100】そのために、図21のページ記述言語表示
装置500は、図1のページ記述言語表示装置100
に、連続音声認識処理部501、文字列バッファ503
及び内容解析部504を追加すると共に、図1中のペー
ジ記述言語解析部102に代えて、ページ記述言語解析
部502を用いた構成を適用している。
【0101】以下、図21の構成のページ記述言語表示
装置500の動作について、図1のページ記述言語表示
装置100と相違する点を中心に説明する。まず、ユー
ザが発声することにより音声入力部111で入力処理さ
れた音声データは、音声認識処理部112と連続音声認
識処理部501に送られる。
【0102】連続音声認識処理部501は、内部に連続
音声認識のための辞書を持っており、連続して発声され
た音声データを認識して漢字仮名混じり文字列に変換す
る。この文字列は、文字列バッファ503に蓄えられ
る。
【0103】ここで、CRTディスプレイ105に表示
されているページ記述言語データのリンク部分が、マウ
ス等を用いたユーザの操作により選択されると、操作入
力部104は、リンクが選択されたことを表す信号をペ
ージ記述言語解析部502に送る。
【0104】するとページ記述言語解析部502は、音
声認識処理部112に対して音声認識を中断するよう指
示すると同時に、選択されたリンク部分のリンク先を内
容解析部504に送る。
【0105】内容解析部504は、ページ記述言語解析
部502から選択されたリンク部分のリンク先が送られ
ると、図22のフローチャートに示すように、当該リン
ク先を受け取り(ステップE1)、ページ記述言語解析
部502から選択操作終了が通知されるのを待つ(ステ
ップE2)。
【0106】一方、ページ記述言語解析部502からの
中断指示を受けた音声認識処理部112は、ページ記述
言語解析部502より再開指示があるまで音声認識処理
を中断する。
【0107】操作入力部104は、ユーザによるリンク
部分の選択操作が終了すると、選択操作が終了したこと
を表す信号をページ記述言語解析部502に送る。する
とページ記述言語解析部502は、音声認識処理部11
2に音声認識の再開を指示すると同時に、内容解析部5
04に選択操作が終了したことを通知する。
【0108】ページ記述言語解析部502より選択操作
終了の通知を受けた内容解析部504は、認識情報記憶
部110内の認識テーブル109を参照して空いている
語彙番号を取得し(ステップE3)、ページ記述言語解
析部502より受け取ったリンク先を、取得した語彙番
号と共に認識テーブル109に追加して保存する(ステ
ップE4)。
【0109】内容解析部504は更に、文字列バッファ
503より連続音声認識結果の文字列を読み出して(ス
テップE5)、この文字列を解析して平仮名文字列に変
換し(ステップE6)、上記取得した語彙番号と共に認
識辞書108に追加して保存する(ステップE7)。
【0110】ここで、文字列バッファ503より読み出
した文字列をそのまま平仮名文字列に変換するのではな
く、当該文字列を解析して要約するといった加工をした
後に平仮名文字列に変換してから、認識辞書108に追
加保存するようにしてもよい。
【0111】この内容解析部504により認識辞書10
8及び認識テーブル109に追加された情報は、言語解
析部107により作成される認識辞書108及び認識テ
ーブル109の他の情報とは異なって、ページ記述言語
データの表示が切り替わっても、書き換えられず保存
(蓄積)される。そのためには、内容解析部504によ
り認識辞書108及び認識テーブル109に追加される
情報には、書き換え(消去)不可を示すフラグ情報を付
しておけばよい。なお、ページ記述言語データの表示が
切り替わる毎に作成(更新)される情報と、内容解析部
504により作成される情報とを、独立の認識辞書10
8及び認識テーブル109を用いて、つまり認識情報記
憶部110内でそれぞれ独立に管理するようにしてもよ
い。
【0112】このように、ユーザによるリンク部分の選
択操作時におけるユーザの会話内容に対応した文字列
(及び語彙番号)を認識辞書108に追加保存すると共
に、ユーザが選択したリンク部分のリンク先(及び語彙
番号)を認識テーブル109に追加保存することによ
り、以後、当該追加された文字列は音声認識処理部11
2での処理で、追加されたリンク先は認識判定部113
での処理で使用される。
【0113】したがって、表示状態にあるページ記述言
語データに無関係に、認識情報記憶部110上の認識辞
書108に追加保存された会話内容を表す文字列を音声
で入力するだけで、認識情報記憶部110上の認識テー
ブル109に追加保存された対応するリンク先のページ
記述言語データの表示に切り替えることができる。ま
た、この追加保存(蓄積)されている会話内容を表す文
字列とリンク先との対応情報を、いつでも画面を通して
参照することも可能である。
【0114】以上の実施形態では、連続音声認識処理部
501、文字列バッファ503及び内容解析部504が
図1中のページ記述言語表示装置100に追加されるも
のとして説明したが、図8中のページ記述言語表示装置
200、図14中のページ記述言語表示装置300、或
いは図19中のページ記述言語表示装置400に追加さ
れる構成であっても構わない。
【0115】なお、前記第1の実施形態で適用した図1
のページ記述言語表示装置100の機能構成、或いは前
記第2の実施形態で適用した図8のページ記述言語表示
装置200の機能構成、或いは前記第3の実施形態で適
用した図14のページ記述言語表示装置300の機能構
成、或いは前記第4の実施形態で適用した図19のペー
ジ記述言語表示装置400の機能構成、或いは前記第5
の実施形態で適用した図21のページ記述言語表示装置
500の機能構成は、コンピュータ(計算機)をその構
成要素である各機能手段(図1中のページ記述言語表示
装置100では、ページ記述言語入力制御部101、ペ
ージ記述言語解析部102、表示制御部103、言語解
析部107、音声認識処理部112及び認識判定部11
3、図8中のページ記述言語表示装置200では、ペー
ジ記述言語入力制御部101、ページ記述言語解析部1
02、表示制御部103、言語解析部107、音声認識
処理部112、認識判定部113及び表示位置解析部2
01、図14中のページ記述言語表示装置300では、
ページ記述言語入力制御部101、ページ記述言語解析
部102、表示制御部103、言語解析部107、音声
認識処理部112、認識判定部113、表示位置解析部
201及び特徴物位置解析部301、図19中のページ
記述言語表示装置400では、ページ記述言語入力制御
部101、ページ記述言語解析部102、表示制御部1
03、言語解析部107、音声認識処理部112、認識
判定部113及び自動検索部401、図21中のページ
記述言語表示装置500では、ページ記述言語入力制御
部101、表示制御部103、言語解析部107、音声
認識処理部112、認識判定部113、連続音声認識処
理部501、ページ記述言語解析部502、文字列バッ
ファ503及び内容解析部504)として機能させるた
めのプログラムを、ROM、CD−ROM、DVD−R
OM、フロッピー(登録商標)ディスク、ハードディス
ク、メモリカード等の機械読み取り可能な記録媒体に記
録し、当該プログラムをコンピュータにより読み取り実
行させることで実現される。このプログラムが、ネット
ワーク等の通信回線を介してダウンロードされるもので
あっても構わない。
【0116】
【発明の効果】以上詳述したように本発明によれば、リ
ンク情報中のリンク文字列を解析して、そのリンク文字
列の発音を表す発音情報を生成し、その発音情報及び対
応するリンク先の情報を記憶手段に記憶しておき、ユー
ザが表示状態にあるページ記述言語データ中の任意のリ
ンク文字列を音声で入力した場合に、記憶手段に記憶さ
れている発音情報の範囲内で認識処理を行って、そのリ
ンク文字列を表す発音情報に対応して記憶手段に記憶さ
れているリンク先情報を取得して、そのリンク先情報に
従うページ記述言語データの入力制御を行うことによ
り、ユーザからの音声による操作でページ記述言語デー
タの表示を切り替えることが高精度に且つ高速に行え
る。
【0117】また本発明によれば、表示領域内に表示さ
れるリンク部分についてその位置を解析し、その表示位
置を表す語彙の発音情報及び対応するリンク先の情報を
記憶手段に記憶して、ユーザが音声を入力した際の音声
認識及び認識結果に基づくリンク先の選択に利用するこ
とにより、ユーザは所望のリンク部分の位置を音声で指
示するだけで、ページ記述言語データの表示を切り替え
ることができる。
【0118】また本発明によれば、表示領域内の特徴物
(特徴部分)とリンク部分の位置関係を解析し、当該特
徴物の特徴と位置関係を表す語彙の発音情報及び対応す
るリンク先の情報を記憶手段に記憶して、ユーザが音声
を入力した際の音声認識及び認識結果に基づくリンク先
の選択に利用することにより、ユーザは表示領域内の特
徴物の特徴と当該特徴物を基準とする所望のリンク部分
の位置を音声で指示するだけで、ページ記述言語データ
の表示を切り替えることができる。
【0119】また本発明によれば、ユーザが記憶手段に
記憶されていない語彙を発声した場合に、その語彙に関
連する情報を持つページ記述言語データを自動的に検索
することができる。
【0120】また本発明によれば、ユーザによるリンク
部分の選択操作時におけるユーザの会話内容に対応した
文字列の発音情報及び選択されたリンク部分のリンク先
の情報を記憶手段に蓄積することにより、ユーザが音声
を入力した際の音声認識及び認識結果に基づくリンク先
の選択に利用でき、ユーザは表示中のページ記述言語デ
ータとは無関係に、記憶手段に蓄積されている文字列を
音声で入力するだけで、記憶手段に蓄積されている対応
するリンク先のページ記述言語データの表示に切り替え
ることができる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態に係るページ記述言語
表示装置の構成を主として示すブロック図。
【図2】ページ記述言語データの一例であるHTMLと
その表示例を示す図。
【図3】上記第1の実施形態においてページ記述言語解
析部102で解析されるHTMLにおけるリンク部分と
ページ記述言語解析部102から言語解析部107に送
られるリンク情報の一例を示す図。
【図4】上記第1の実施形態において言語解析部107
で生成される認識辞書108及び認識テーブル109の
一例を示す図。
【図5】上記第1の実施形態における音声認識処理部1
12での認識処理結果の一例を示す図。
【図6】上記第1の実施形態における言語解析部107
の処理の流れを説明するためのフローチャート。
【図7】上記第1の実施形態における音声認識処理部1
12及び認識判定部113の処理の流れを説明するため
のフローチャート。
【図8】本発明の第2の実施形態に係るページ記述言語
表示装置の構成を主として示すブロック図。
【図9】上記第2の実施形態においてページ記述言語解
析部102から表示位置解析部201に送られる付加情
報付きのリンク情報の一例を示す図。
【図10】上記第2の実施形態におけるページ記述言語
データの表示例と表示位置解析部201から言語解析部
107に送られるリンク情報の一例と当該リンク情報を
もとに言語解析部107で生成される認識辞書108及
び認識テーブル109の一例とを示す図。
【図11】上記第2の実施形態において、表示位置解析
部201でリンク部分の位置を判断するために表示領域
をブロックに分割した例を示す図。
【図12】上記第2の実施形態において表示位置解析部
201で記憶される各ブロックの位置とサイズの計算結
果例を示す図。
【図13】上記第2の実施形態における表示位置解析部
201の処理の流れを説明するためのフローチャート。
【図14】本発明の第3の実施形態に係るページ記述言
語表示装置の構成を主として示すブロック図。
【図15】上記第3の実施形態においてページ記述言語
解析部102から特徴物位置解析部301に送られる付
加情報付きのリンク情報の一例を示す図。
【図16】上記第3の実施形態におけるページ記述言語
データの表示例と特徴物位置解析部301から言語解析
部107に送られるリンク情報の一例と当該リンク情報
をもとに言語解析部107で生成される認識辞書108
及び認識テーブル109の一例とを示す図。
【図17】上記第3の実施形態において特徴物位置解析
部301で特徴物に対するリンク部分の位置を判断する
ために表示領域をブロックに分割した例を示す図。
【図18】上記第3の実施形態における特徴物位置解析
部301の処理の流れを説明するためのフローチャー
ト。
【図19】本発明の第4の実施形態に係るページ記述言
語表示装置の構成を主として示すブロック図。
【図20】上記第4の実施形態において自動検索部40
1が検索URLを生成する際に参照する検索エンジンに
関する情報の一例と、当該自動検索部401が生成する
検索URLの一例を示す図。
【図21】本発明の第5の実施形態に係るページ記述言
語表示装置の構成を主として示すブロック図。
【図22】上記第5の実施形態における内容解析部50
4の処理の流れを説明するためのフローチャート。
【符号の説明】
101…ページ記述言語入力制御部 102,502…ページ記述言語解析部 103…表示制御部 104…操作入力部 105…CRTディスプレイ 107…言語解析部(リンク文字列解析手段) 108…認識辞書 109…認識テーブル 110…認識情報記憶部(記憶手段) 111…音声入力部 112…音声認識処理部 113…認識判定部 201…表示位置解析部 301…特徴物位置解析部 401…自動検索部 501…連続音声認識処理部 503…文字列バッファ 504…内容解析部
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G10L 15/00 G06F 15/403 310Z 15/419 320 G10L 3/00 551A (72)発明者 池田 敏明 東京都港区新橋3丁目3番9号 東芝エ ー・ブイ・イー株式会社内 Fターム(参考) 5B075 KK07 ND16 ND36 PP07 PP13 PP28 PQ02 5B082 EA00 EA01 5B089 GA11 GA21 GB04 HA10 JA21 JB01 JB05 KA03 KB09 KH03 LB10 LB14 5D015 GG03 KK01 KK03 LL05

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 ページ記述言語データの入力を制御する
    ページ記述言語入力制御手段と、入力されたページ記述
    言語データを解析するページ記述言語解析手段と、前記
    ページ記述言語解析手段の解析結果に基づきページ記述
    言語データを表示器に表示する表示制御手段とを備えた
    ページ記述言語表示装置において、 前記ページ記述言語解析手段の解析結果からリンク部分
    のリンクを表すリンク文字列とリンク先の情報を含むリ
    ンク情報を受け取って前記リンク文字列を解析し、その
    リンク文字列の発音を表す発音情報を生成して当該発音
    情報及び対応するリンク先の情報を記憶手段に記憶する
    リンク文字列解析手段と、 音声を入力するための音声入力手段と、 前記音声入力手段により入力された音声を前記記憶手段
    に記憶されている前記発音情報に基づき解析して音声認
    識を行う音声認識処理手段と、 前記音声認識処理手段の認識結果に基づき前記記憶手段
    から対応する前記リンク先情報を取得し、当該リンク先
    情報に従うページ記述言語データの入力を前記ページ記
    述言語入力制御手段に指示する認識判定手段とを具備す
    ることを特徴とするページ記述言語表示装置。
  2. 【請求項2】 前記ページ記述言語解析手段により解析
    されたリンク情報のうち、前記表示器の表示領域に表示
    されるリンク部分のリンク情報を対象に、前記表示領域
    上の表示位置を解析し、その表示位置を表す語彙をリン
    ク文字列として、当該リンク文字列及び対応するリンク
    先の情報を含む新たなリンク情報を生成する表示位置解
    析手段を更に具備し、 前記リンク文字列解析手段は、前記表示位置解析手段に
    より生成されるリンク情報についても、当該リンク情報
    に含まれる前記リンク文字列を解析し、そのリンク文字
    列の発音を表す発音情報を生成して当該発音情報及び対
    応するリンク先の情報を前記記憶手段に記憶するように
    構成されていることを特徴とする請求項1記載のページ
    記述言語表示装置。
  3. 【請求項3】 ページ記述言語データの入力を制御する
    ページ記述言語入力制御手段と、入力されたページ記述
    言語データを解析するページ記述言語解析手段と、前記
    ページ記述言語解析手段の解析結果に基づきページ記述
    言語データを表示器に表示する表示制御手段とを備えた
    ページ記述言語表示装置において、 前記ページ記述言語解析手段により解析されたリンク情
    報のうち、前記表示器の表示領域に表示されるリンク部
    分のリンク情報を対象に、前記表示領域上の表示位置を
    解析し、その表示位置を表す語彙をリンク文字列とし
    て、当該リンク文字列及び対応するリンク先の情報を含
    む新たなリンク情報を生成する表示位置解析手段と、 前記表示位置解析手段により生成されるリンク情報に含
    まれる前記リンク文字列を解析し、そのリンク文字列の
    発音を表す発音情報を生成して当該発音情報及び対応す
    るリンク先の情報を記憶手段に記憶するリンク文字列解
    析手段と、 音声を入力するための音声入力手段と、 前記音声入力手段により入力された音声を前記記憶手段
    に記憶されている前記発音情報に基づき解析して音声認
    識を行う音声認識処理手段と、 前記音声認識処理手段の認識結果に基づき前記記憶手段
    から対応する前記リンク先情報を取得し、当該リンク先
    情報に従うページ記述言語データの入力を前記ページ記
    述言語入力制御手段に指示する認識判定手段とを具備す
    ることを特徴とするページ記述言語表示装置。
  4. 【請求項4】 前記ページ記述言語解析手段の解析結果
    から、表示領域内の特徴物とリンク部分との位置関係を
    解析し、当該特徴物の特徴及び前記位置関係を表す語彙
    をリンク文字列として、当該リンク文字列及び対応する
    リンク先の情報を含む新たなリンク情報を生成する特徴
    物位置解析手段を更に具備し、 前記リンク文字列解析手段は、前記特徴物位置解析手段
    により生成されるリンク情報についても、当該リンク情
    報に含まれる前記リンク文字列を解析し、そのリンク文
    字列の発音を表す発音情報を生成して当該発音情報及び
    対応するリンク先の情報を前記記憶手段に記憶するよう
    に構成されていることを特徴とする請求項1記載のペー
    ジ記述言語表示装置。
  5. 【請求項5】 ページ記述言語データの入力を制御する
    ページ記述言語入力制御手段と、入力されたページ記述
    言語データを解析するページ記述言語解析手段と、前記
    ページ記述言語解析手段の解析結果に基づきページ記述
    言語データを表示器に表示する表示制御手段とを備えた
    ページ記述言語表示装置において、 前記ページ記述言語解析手段の解析結果から、表示領域
    内の特徴物を基準とする当該特徴物とリンク部分の位置
    関係を解析し、当該特徴物の特徴及び位置関係を表す語
    彙をリンク文字列として、当該リンク文字列及び対応す
    るリンク先の情報を含む新たなリンク情報を生成する特
    徴物位置解析手段と、 前記特徴物位置解析手段により生成されるリンク情報に
    含まれる前記リンク文字列を解析し、そのリンク文字列
    の発音を表す発音情報を生成して当該発音情報及び対応
    するリンク先の情報を記憶手段に記憶するリンク文字列
    解析手段と、 音声を入力するための音声入力手段と、 前記音声入力手段により入力された音声を前記記憶手段
    に記憶されている前記発音情報に基づき解析して音声認
    識を行う音声認識処理手段と、 前記音声認識処理手段の認識結果に基づき前記記憶手段
    から対応する前記リンク先情報を取得し、当該リンク先
    情報に従うページ記述言語データの入力を前記ページ記
    述言語入力制御手段に指示する認識判定手段とを具備す
    ることを特徴とするページ記述言語表示装置。
  6. 【請求項6】 前記認識判定手段により前記音声認識処
    理手段の認識結果に対応する前記リンク先情報が取得で
    きなかった場合に、当該認識結果に対応する語彙を検索
    キーとして検索を自動実行する自動検索手段を更に具備
    することを特徴とする請求項1記載のページ記述言語表
    示装置。
  7. 【請求項7】 前記音声入力手段により入力された音声
    を連続的に認識可能な連続音声認識処理手段と、 前記連続音声認識処理手段の連続音声認識結果に基づい
    て入力音声の内容を解析する内容解析手段であって、前
    記表示器に表示されているページ記述言語データのリン
    ク部分が音声の入力と並行して選択された場合に、内容
    解析結果を表す発音情報を生成して当該発音情報及び前
    記選択されたリンク部分のリンク先の情報を前記記憶手
    段に追加保存する内容解析手段とを更に具備することを
    特徴とする請求項1記載のページ記述言語表示装置。
  8. 【請求項8】 計算機を、 ページ記述言語データの入力を制御するページ記述言語
    入力制御手段と、 入力されたページ記述言語データを解析するページ記述
    言語解析手段と、 前記ページ記述言語解析手段の解析結果に基づきページ
    記述言語データを表示器に表示する表示制御手段と、 前記ページ記述言語解析手段の解析結果からリンク部分
    のリンクを表すリンク文字列とリンク先の情報を含むリ
    ンク情報を受け取って前記リンク文字列を解析し、その
    リンク文字列の発音を表す発音情報を生成して当該発音
    情報及び対応するリンク先の情報を記憶手段に記憶する
    リンク文字列解析手段と、 音声入力手段により入力された音声を前記記憶手段に記
    憶されている前記発音情報に基づき解析して音声認識を
    行う音声認識処理手段と、 前記音声認識処理手段の認識結果に基づき前記記憶手段
    から対応する前記リンク先情報を取得し、当該リンク先
    情報に従うページ記述言語データの入力を前記ページ記
    述言語入力制御手段に指示する認識判定手段として機能
    させるためのページ記述言語表示プログラムを記録した
    機械読み取り可能な記録媒体。
JP11012904A 1999-01-21 1999-01-21 ペ―ジ記述言語表示装置及びペ―ジ記述言語表示プログラムを記録した機械読み取り可能な記録媒体 Withdrawn JP2000215023A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11012904A JP2000215023A (ja) 1999-01-21 1999-01-21 ペ―ジ記述言語表示装置及びペ―ジ記述言語表示プログラムを記録した機械読み取り可能な記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11012904A JP2000215023A (ja) 1999-01-21 1999-01-21 ペ―ジ記述言語表示装置及びペ―ジ記述言語表示プログラムを記録した機械読み取り可能な記録媒体

Publications (1)

Publication Number Publication Date
JP2000215023A true JP2000215023A (ja) 2000-08-04

Family

ID=11818367

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11012904A Withdrawn JP2000215023A (ja) 1999-01-21 1999-01-21 ペ―ジ記述言語表示装置及びペ―ジ記述言語表示プログラムを記録した機械読み取り可能な記録媒体

Country Status (1)

Country Link
JP (1) JP2000215023A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002169750A (ja) * 2000-11-30 2002-06-14 Nec Corp ブラウザ搭載装置
JP2002342212A (ja) * 2001-04-27 2002-11-29 Internatl Business Mach Corp <Ibm> 情報アクセス方法、情報アクセスシステムおよびプログラム
JP2009116393A (ja) * 2007-11-01 2009-05-28 Sky Kk ファイル管理システムおよびファイル管理プログラム
JP2022116343A (ja) * 2016-05-19 2022-08-09 パロ アルト リサーチ センター インコーポレイテッド 自然言語ウェブブラウザ

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002169750A (ja) * 2000-11-30 2002-06-14 Nec Corp ブラウザ搭載装置
JP2002342212A (ja) * 2001-04-27 2002-11-29 Internatl Business Mach Corp <Ibm> 情報アクセス方法、情報アクセスシステムおよびプログラム
JP2009116393A (ja) * 2007-11-01 2009-05-28 Sky Kk ファイル管理システムおよびファイル管理プログラム
JP4651122B2 (ja) * 2007-11-01 2011-03-16 Sky株式会社 ファイル管理システムおよびファイル管理プログラム
JP2022116343A (ja) * 2016-05-19 2022-08-09 パロ アルト リサーチ センター インコーポレイテッド 自然言語ウェブブラウザ
JP7485485B2 (ja) 2016-05-19 2024-05-16 パロ アルト リサーチ センター,エルエルシー 自然言語ウェブブラウザ

Similar Documents

Publication Publication Date Title
US6510412B1 (en) Method and apparatus for information processing, and medium for provision of information
US11328708B2 (en) Speech error-correction method, device and storage medium
US8407039B2 (en) Method and apparatus of translating language using voice recognition
JP3476008B2 (ja) 音声情報の登録方法、認識文字列の特定方法、音声認識装置、音声情報の登録のためのソフトウエア・プロダクトを格納した記憶媒体、及び認識文字列の特定のためのソフトウエア・プロダクトを格納した記憶媒体
US9484034B2 (en) Voice conversation support apparatus, voice conversation support method, and computer readable medium
JP3476007B2 (ja) 認識単語登録方法、音声認識方法、音声認識装置、認識単語登録のためのソフトウエア・プロダクトを格納した記憶媒体、音声認識のためのソフトウエア・プロダクトを格納した記憶媒体
JPH1125098A (ja) 情報処理装置、リンク先ファイルの取得方法および記憶媒体
US20070016420A1 (en) Dictionary lookup for mobile devices using spelling recognition
JP5688677B2 (ja) 音声入力支援装置
JPH07222248A (ja) 携帯型情報端末における音声情報の利用方式
JP2000075887A (ja) パターン認識装置、方法及びシステム
JP3927800B2 (ja) 音声認識装置及び方法、プログラム、並びに記憶媒体
CN113924573A (zh) 翻译装置
JP2000215023A (ja) ペ―ジ記述言語表示装置及びペ―ジ記述言語表示プログラムを記録した機械読み取り可能な記録媒体
JP2000076040A (ja) 音声入力ネットワーク端末装置
JP2003162293A (ja) 音声認識装置及び方法
JP2010231149A (ja) 音声認識に仮名漢字変換システムを用いた端末、方法及びプログラム
JP4220151B2 (ja) 音声対話装置
KR100919227B1 (ko) 네비게이션 시스템에 이용되는 음성 인식 방법 및 장치
JP2000056795A (ja) 音声認識装置
JP4622861B2 (ja) 音声入力システム、音声入力方法、および、音声入力用プログラム
JP2002014751A (ja) オンラインヘルプシステム
JP2004118720A (ja) 翻訳装置、翻訳方法及び翻訳プログラム
JP2001109740A (ja) 中国語文書作成装置及び中国語文書作成方法
JP2006078829A (ja) 音声認識装置および音声認識方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20051104

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20060809

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20060814