JPH1125098A

JPH1125098A - 情報処理装置、リンク先ファイルの取得方法および記憶媒体

Info

Publication number: JPH1125098A
Application number: JP9167299A
Authority: JP
Inventors: Saeko Murakami; 佐枝子村上; Kazuto Nakamichi; 一人中道; Takashi Fukushima; 隆司福島
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 1997-06-24
Filing date: 1997-06-24
Publication date: 1999-01-29
Also published as: US6286014B1

Abstract

(57)【要約】【課題】音声入力でリンクファイルの選択を可能にす
る。【解決手段】ＨＴＭＬ文書の中のリンクファイルの説
明文から特定の単語を選択し、ＨＴＭＬ文書の表示の中
で強調表示する。強調表示の単語について音声で入力さ
れたことをＣＰＵ１が検出すると、ＣＰＵ１はその単語
に該当するリンクファイルに接続する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、情報処理装置、リ
ンク先ファイル取得方法および記憶媒体に関する。

【０００２】

【従来の技術】インターネットなどの通信ネットワーク
では、テキスト、イメージ、音声、映像の混在した文書
を表示するための情報（以下、ハイパーテキストと称
す）をサーバがホームページとして提供し、クライアン
ト側が上記ハイパーテキストをサーバから取り込み、文
書編集して文書形態で表示することが可能となってい
る。このようなハイパーテキストを表示するためのアプ
リケーションプログラムあるいは装置はブラウザと呼ば
れている。ハイパーテキストは、表示すべき文字列およ
びその書式（文字の大きさ等）を定義したり、リンクす
るファイル（テキスト、イメージ、音声等）を説明する
説明文を記載している。このようなハイパーテキストは
たとえば、ＨＴＭＬ（ＨＹＰＥＲＴＥＸＴＭＡＲＫ
ＵＰＬＡＮＧＵＡＧＥ）言語で記載される。

【０００３】クライアント側のブラウザはサーバ側のハ
イパーテキストを取り込むと、ハイパーテキストに記載
されている文字列や説明文をその書式にしたがって表示
する。ユーザがその表示を見て、上記説明文をマウスに
より指示すると、ブラウザはその説明文に関連付けてハ
イパーテキスト内に記載されているリンク先のファイル
名（リンクファイル名と称す）に基づき、ファイルにリ
ンクし、表示画面に表示させる。

【０００４】なお、リンク先のファイルが音声の場合に
はその音声がクライアント側で再生出力される。上記ブ
ラウザは汎用のパーソナルコンピュータ等のコンピュー
タに搭載され、実行される。最近では、音声認識技術の
向上で、キーボードからの文字入力の代わりに、ユーザ
が音声を入力し、汎用コンピュータ側で音声認識を行っ
て、あらかじめ用意した単語の中から１つを選択するこ
とができるようになっている。

【０００５】

【発明が解決しようとする課題】音声による入力は、コ
マンドなど、定型の文字列には有効であり、上述のブラ
ウザでは、フォワード（ＦＯＲＷＡＲＤ、次の表示画面
に進むこと））、バックワード（ＢＡＣＫＷＡＲＤ、前
の表示画面に進むこと））、リロード（ＲＥＬＯＡＤ、
再ロードすること）といったコマンドを音声で入力する
ことが可能になっている。

【０００６】しかしながら、上述のように、リンク先の
ファイルを表示するためには、ユーザはリンク先のファ
イルの説明文をマウスにより指定しなければならず、音
声で指示することはできない。

【０００７】そこで、本発明の目的は、上述の点に鑑み
て、単語による音声入力を可能として、ハイパーテキス
トの作成に際しては何ら制約を与えないブラウザおよび
その音声入力方法ならびに記録媒体を提供することにあ
る。

【０００８】

【課題を解決するための手段】このような目的を達成す
るために、請求項１の発明は、１以上のリンク先ファイ
ルのファイル名と前記１以上のリンク先ファイル名の各
々に関連付けられた１以上の説明文を含む文書を取り込
み、前記１以上の説明文の少なくとも一部をディスプレ
イに表示し、前記１以上の説明文のいずれかが選択され
た場合に、該選択された説明文に関連するファイル名の
ファイルを取得する情報処理装置において、前記１以上
の説明文の各々において強調表示すべき単語を特定する
第１の手段と、当該特定された単語に強調表示変換を加
える第２の手段と、入力された音声情報を取得する第３
の手段と、前記特定された単語から、前記入力された音
声情報に対応する単語を選択する第４の手段と、前記選
択された単語を含む説明文に関連するリンク先ファイル
名を取得する第５の手段とを具えたことを特徴とする。

【０００９】本願明細書の特許請求の範囲において、強
調表示変換とは文字列の色や書体、大きさ等の文字属性
を変換する方法やかぎかっこやダブルコーテーション等
を、文字列の前後に挿入する方法や、その文字列の読み
がなや発音記号等をその文字列の近傍や予め定められた
箇所に表示する方法を含む概念である。

【００１０】請求項２の発明は、請求項１に記載の情報
処理装置において、前記第１の手段は、前記説明文に含
まれる複数の単語の文字数を比較し、最多の文字数を有
する単語を前記強調表示すべき単語と特定することを特
徴とする。

【００１１】請求項３の発明は、請求項１〜請求項２に
記載の情報処理装置において、前記第２の手段は、前記
第１の手段により特定された単語の読みを該単語の表示
に関連づけて表示することにより強調表示変換すること
を特徴とする。

【００１２】請求項４の発明は、請求項１〜請求項２に
記載の情報処理装置において、前記表示制御手段は前記
第１の単語検出手段により検出された単語を他の表示と
は異なる色で表示することにより強調表示することを特
徴とする。

【００１３】請求項５の発明は、１以上のリンク先ファ
イルのファイル名と前記１以上のリンク先ファイル名の
各々に関連付けられた１以上の説明文を含む文書を取り
込み、前記１以上の説明文の少なくとも一部をディスプ
レイに表示し、前記１以上の説明文のいずれかが選択さ
れた場合に、該選択された説明文に関連するファイル名
のファイルを取得する方法において、前記１以上の説明
文の各々において強調表示すべき単語を特定する第１の
ステップと、当該特定された単語に強調表示変換を加え
る第２のステップと、入力された音声情報を取得する第
３のステップと、前記特定された単語から、前記入力さ
れた音声情報に対応する単語を選択する第４のステップ
と、前記選択された単語を含む説明文に関連するリンク
先ファイル名を取得する第５のステップとを具えたこと
を特徴とする。

【００１４】請求項６の発明は、データ処理システムに
おいて稼働し、１以上のリンク先ファイルのファイル名
と前記１以上のリンク先ファイル名の各々に関連付けら
れた１以上の説明文を含む文書を取り込み、前記１以上
の説明文の少なくとも一部をディスプレイに表示し、前
記１以上の説明文のいずれかが選択された場合に、該選
択された説明文に関連するファイルを取得するためのプ
ログラムを格納する記憶媒体であって、該プログラム
は、前記１以上の説明文の各々において強調表示すべき
単語を特定することを前記データ処理システムに指示す
るプログラムコード手段と、当該特定された単語に強調
表示変換を加えることを前記データ処理システムに指示
するプログラムコード手段と、入力された音声情報を取
得し、前記特定された単語から、前記入力された音声情
報に対応する単語を選択することを前記データ処理シス
テムに指示するプログラムコード手段と、前記選択され
た単語を含む説明文に関連するリンク先ファイルを取得
することを前記データ処理システムに指示するプログラ
ムコード手段とを含むことを特徴とする。

【００１５】

【発明の実施の形態】以下、図面を参照して本発明の実
施の形態を詳細に説明する。

【００１６】図１は本発明に関わるブラウザを搭載した
汎用パーソナルコンピュータのシステム構成を示す。図
１のシステムはクライアントとして動作する。以下に述
べる構成部がバスに対して接続されている。ＣＰＵ１は
システムメモリ２に格納されたシステムプログラムにし
たがって、装置全体の制御を実行するほか、ブラウザお
よびブラウザで指示されたアプリケーションプログラム
を実行する。システムメモリ２はＲＯＭおよびＲＡＭ等
から構成される。ＲＯＭには基本フォントや電源立ち上
げ用のシステムプログラムが格納されている。

【００１７】ＲＡＭにはＨＤＤ（ハードディスク記憶装
置）６から読み取られたシステム実行用のシステムプロ
グラムやＣＰＵ１の各種の演算における入出力データが
格納される。システムメモリ２の中にはディスプレイ３
に表示するイメージを専用的に格納するメモリも含まれ
る。ディスプレイ３に表示するデータは一定周期でＣＰ
Ｕ１もしくはＤＭＡ（ダイレクトメモリアクセスコント
ローラ、不図示）により読み取られ、ディスプレイ３に
送られ、表示される。

【００１８】キーボード４からはＣＰＵ１に対するコマ
ンド、文字、数値等を入力する。ポインティングデバイ
ス５にはたとえば、マウスを使用することが可能であ
り、ディスプレイ３の表示画面上の位置指定を行う。こ
の位置指定を受けて、ＣＰＵ１はＧＵＩ（グラフィカル
・ユーザ・インタフェース）に基づき、所定のコマンド
を実行する。

【００１９】ＨＤＤ６にはＯＳ（オペレーティングシス
テム）のようなシステムプログラムおよび後述のアプリ
ケーションプログラムを保存目的のために記憶する。Ｈ
ＤＤ６にはさらに、本発明に係わる音声入力処理で使用
する辞書類（後述）も格納されている。

【００２０】ＦＤＤ（フロッピーディスク記憶装置）７
はフロッピーディスクを受け付け、ＣＰＵ１の制御の下
にフロッピーディスクに対して情報の読み書きを行う。
本発明に係わるブラウザ用のプログラムが記録されたフ
ロッピーディスクを受け付け、ＨＤＤ６にインストール
することが可能である。ＦＤＤ７の代わりにＣＤＲＯＭ
ドライブを使用することも可能である。ＲＳ２３２Ｃの
ような通信インタフェース８はモデム９と接続し、モデ
ム９、公衆電話回線１０を介して、サーバと接続する。

【００２１】音声入力インタフェース１１はマイクロホ
ン１２から入力されたアナログ音声信号をデジタル形態
の音声信号に変換してＣＰＵ１に引き渡す。その他、
スピーカおよびその出力インタフェースなどの音声出力
手段（不図示）がバスに接続されている。

【００２２】音声入力に係るプログラムおよび辞書につ
いて図２を参照して説明する。以下に説明するファイル
はＨＤＤ６内に保存される。

【００２３】図２において、ブラウザ２１はＨＴＭＬ文
書を表示するためのアプリケーションプログラムであ
り、図３に示す音声入力用のプログラムを内部に有す
る。音声入力以外の処理のためのプログラム内容、たと
えば、不図示のＴＣＰ／ＩＰのような通信プログラムを
制御して、サーバからＨＴＭＬ文書を取り込む通信処
理、ＨＴＭＬ文書に定義されているリンクファイル、す
なわちテキスト、イメージ等を取り込み、ディスプレイ
３に表示する処理を実行するためのプログラム内容は従
来のブラウザと同一である。

【００２４】単語辞書２２はかな漢字混じりの単語文字
列（いわゆる表記）、その読みおよび文法情報を多数記
載した辞書である。文法情報としては品詞等、単語の区
切り判定に使用される情報が使用される。

【００２５】標準パターンファイル２３は音声の特徴パ
ターンと音声の識別ラベルとを互いに関連づけたファイ
ルであり、音声認識に使用される。ここで、音声の特徴
パターンとは、たとえば、音声の所定長さ、たとえば、
音韻や音素（音韻を細分化したもの）をフーリエ解析し
て得られる音声特徴を時系列的に並べたもの（音声特徴
系列と呼ばれる）である。音声の識別ラベルは音韻や音
素に与える記号であり、文字コードを使用することもで
きる。このような標準パターンとしては隠れマルコフモ
デルが知られているが、周知のものであれば、どのよう
なものも使用することができる。

【００２６】音声認識プログラム２４は音声認識を行う
ためのプログラムであり、周知のものを使用することが
できる。例えば隠れマルコフモデルを使用する場合に
は、音声認識プログラム２４は入力音声をフーリエ解析
して、特徴パターンに変換する。次に音声認識プログラ
ム２４は音素モデルファイル２３から認識すべき単語の
音素モデルを連結し、その単語のモデルについてユーザ
の入力した音声の特徴列に対して各モデルのスコアを計
算し、最良のものを選択する。ＤＰマッチング等の特徴
パターンの合致判定方法を使用することによっても、本
発明を実施することができる。

【００２７】言語解析プログラム２５は文などを構成す
る文字列の中から単語を抽出する。

【００２８】単語抽出方法としては、かな漢字文への変
換処理等で周知の方法を使用することができる。本実施
の形態では、単語辞書２２に記載されている単語が上記
文字列の中に含まれているかを判定することにより単語
抽出を行う。この際に、単語としては名詞（句を含む）
が選択される。

【００２９】本実施の形態では、ＨＴＭＬ文書の中に記
載されているリンクファイルの説明文の中から単語を自
動抽出し、音声により入力された単語と同一の単語を有
するリンクファイルをユーザが指定したリンクファイル
と判別することにより音声によるリンクファイルの指定
を実現する。

【００３０】次にＨＴＭＬ文書を図３により簡単に説明
する。図３において、＜ＨＴＭＬ＞はＨＴＭＬ文書の開
始を宣言する定義（タグとも呼ばれる）である。ＨＴＭ
Ｌ文書の終了は＜／ＨＴＭＬ＞と定義される。ＨＴＭＬ
文書の開始と終了の間で記載されたハイパーテキストが
出力（表示、音声出力）の対象となる。＜ＢＯＤＹ＞，
＜／ＢＯＤＹ＞は本文の開始、終了を表す定義である。

【００３１】＜Ｐ＞は表示位置を１行だけ下にずらすこ
とを指示する定義である。＜ＵＬ＞，＜／ＵＬ＞は＜Ｌ
Ｉ＞で始まる文字列に●記号を付して項目分けして表示
する範囲を示す。文字列１０１（ニュース速報（５月１
日１６時更新）は表示にのみ提供される。定義群１０２
がリンクファイルに関する定義である。

【００３２】＜Ａｈｒｅｆ＝”ｎｅｗｓ．ｈｔｍｌ”
＞山下線で事故、５万人の足に影響＜／Ａ＞はリンクフ
ァイルおよびその説明文の定義である。ここで、『Ａ
ｈｒｅｆ＝””』がリンク文書があることの定義であ
り、””で囲まれる文字列がリンク先のファイル名を示
す。『山下線で事故、５万人の足に影響』がリンクファ
イルの説明文であり、表示の対象となる。＜／Ａ＞が
説明文の終了を示す。

【００３３】ＨＴＭＬ文書およびリンク先のリンクファ
イルはサーバ側に保存されており、クライアント側のブ
ラウザの要求により引き渡される。

【００３４】クライアント側に取り込まれたＨＴＭＬ文
書がブラウザ２１により解析されて従来では図４の符号
２００でに示すように表示される。文字列２０１が図４
のＨＴＭＬ文書の中の文字列１０１に対応する。文字列
群２０２はリンクファイルの説明文であり、図４の定義
群１０２に対応する。通常、表示のみの文字列の色と、
リンクファイルの説明文の色とは異なるようにデフォル
ト値で定められている。ちなみに従来ではマウスにより
説明文のいずれかを指定すると、その説明文に対応する
リンクファイルがサーバから読み出されて、クライアン
トのディスプレイ３に表示される。本実施の形態では、
従来と表示形態が一部異なる。表示の説明は以下の動作
説明で行う。

【００３５】音声入力に関わるブラウザ２１の処理動作
を図７〜図９のフローチャートを参照して説明する。図
７〜図９に示す処理手順は、実際にはＣＰＵ１が実行可
能なプログラムコードで記載されているが、説明の便宜
上、図７〜図９では処理内容を可能な限り、周知の処理
に分解して機能表現している。

【００３６】なお、予め、クライアント側では、公衆電
話回線１０を介してインタネット等、サーバを有する通
信ネットワークに接続し、ブラウザ２１を起動している
ものとする。

【００３７】図７においてユーザは、キーボード４から
ＨＴＭＬ文書（ホームページ）の存在する通信アドレス
（ＵＲＬと呼ばれることがある）入力する。これにより
ＣＰＵ１は指定されたＵＲＬを有するサーバにアクセス
し、指定されたＵＲＬのＨＴＭＬ文書たとえば、図３に
示すＨＴＭＬ文書を通信インタフェース８を介して取り
込み、システムメモリ２内に一時記憶する（ステップＳ
１０〜Ｓ３０）。

【００３８】ＣＰＵ１は一時記憶されたＨＴＭＬ文書を
検索してリンクファイルの説明文から単語を抽出する。
単語抽出処理は図８を使用して後述する。本実施の形態
では、リンクファイルの定義毎に１つの単語が抽出さ
れ、システムメモリ２内の専用領域（以下、抽出単語領
域と称する）に記憶される。また、リンクファイルの定
義の中に記載されているリンクファイル名、および単語
の読みも抽出された単語に関連付けられて図６に示すよ
うに記憶される（ステップＳ４０）。

【００３９】次にＣＰＵ１はＨＴＭＬ文書の表示を行
う。この表示例を図５（Ａ）で符号３００により示す。
この時、ＨＴＭＬ文書の中の上記抽出した単語と同じ単
語には図５の符号３０３で示すように抽出単語領域に記
載されている読み４００が付加されて強調表示される。
また、表示のみの文字列３０１は黒色で、リンクファイ
ルの説明文３０２は青色で表示される（ステップＳ５
０）。

【００４０】ユーザは青色で表示された文字列の中の読
みが付されている文字列をマイクロホン１２から音声入
力する。音声の入力があったことがステップＳ８０でＣ
ＰＵ１において検出されると、ＣＰＵ１は音声により入
力された文字列に対応のリンクファイルを識別し、リン
ク処理を行う。このときリンク先のファイルの名前がｈ
ｔｍｌなど、ＨＴＭＬ文書であることを示す識別子を持
つ場合には、手順をステップＳ３０に戻し、リンク先の
ＨＴＭＬ文書について、上述の単語抽出処理、音声によ
るリンクファイルの指定が実行される（ステップＳ８０
→Ｓ９０→Ｓ１１０→Ｓ３０）。

【００４１】一方、ＪＥＰＧやＧＩＦなどのイメージフ
ァイルであることを示す示す識別子をリンクファイル名
が持つ場合には、ＣＰＵ１はそのリンク先からファイル
を取り込み、ディスプレイ３に表示する（ステップＳ８
０→Ｓ９０→Ｓ１１０→Ｓ１２０）。なお、リンクファ
イルが音声ファイルの場合には音声出力されることは言
うまでもない。

【００４２】従来と同様の処理、たとえば、表示されて
いる文書の保存等の処理は、ステップＳ６０〜Ｓ８０→
Ｓ１００→Ｓ６０）のループ処理において実行される。

【００４３】ユーザがホームページのアクセス先を変更
した場合には、その変更（新たなＵＲＬの入力）がステ
ップＳ７０で検出され、手順がステップＳ２０に戻る。
これにより、新たなＨＴＭＬ文書について、上述の音声
入力のための前処理、すなわち、単語抽出処理が行われ
る。

【００４４】ユーザがキーボード４あるいはポインティ
ングデバイス（マウス）５により処理の終了を指示する
と、この指示がステップＳ６０で検出されて図７の処理
手順が終了する。

【００４５】図７のステップＳ４０の単語抽出処理の詳
細手順を図８に示す。

【００４６】上述したようにリンクファイルに関する説
明文は、＜Ａ．．．．”＞から始まり＜／Ａ＞で終了す
る。したがって、コンピュータが有し、文書処理でよく
知られる単語検索機能を使用して、＜Ａ．．．．”＞の
文字列および＜／Ａ＞の文字列の位置を検出し、検出さ
れた２つの文字位置で挟まれる文字列をＣＰＵ１により
検出する（ステップＳ２２０）。

【００４７】検出された文字列はシステムメモリ２内に
一時記憶される。次にＣＰＵ１は単語辞書２２の先頭の
単語を読み出し、読み出した単語と同じ単語が抽出した
文字列の中にあるか否かを判定する。同じ文字列がある
場合には、その文字列をシステムメモリ２内に一時記憶
する。なお、同じ文字列が検出されても、文法情報が名
詞句ではないものは除外される。以下、単語辞書２２の
記載順に単語の有無判定を繰り返し実行して、リンクフ
ァイルの説明文の中に含まれている名詞句の単語をピッ
クアップする。図３のＨＴＭＬ文書の最初の説明文につ
いて上述の処理を施すと、「山下線」、「事故」「５万
人」．．．が得られる。このとき単語辞書２２に記載さ
れている読みも共にシステムメモリ２一時記憶される
（ステップＳ２３０）。

【００４８】なお、この際に、連続する名詞、たとえ
ば、「５万」「人」は１つの名詞句に統合される。

【００４９】次に、ＣＰＵ１は抽出された１以上の単語
の中から、強調表示（読みを付加）する単語を予め定め
た順位付け基準に基づき決定する。

【００５０】本実施の形態では、読みを示す文字（カタ
カナ、ひらがな等）の文字数が一番多い単語が強調表示
する文字として決定される。最多の文字数の単語が複数
となった場合には、たとえば、説明文の先頭にもっとも
近い単語が強調表示する単語として決定され、上述した
抽出単語領域に読みと共に記憶される（ステップＳ２４
０）。

【００５１】以下、ＨＴＭＬ文書内のリンクファイルの
説明文が順次に検出され、検出された説明文から強調表
示する単語が決定される（ステップＳ２１０〜Ｓ２４０
のループ処理）。

【００５２】単語抽出領域への記憶に際しては、これま
でに抽出した単語（強調表示すべき単語）と新たに抽出
し単語が重複しないかの判定が行われ、重複する場合に
は、同一の説明文の中に存在し、順位が次の単語が強調
すべき単語に変更される（ステップＳ２５０）。図３の
ＨＴＭＬ文書例では、リンクファイルの２つの説明文か
らそれぞれ取締役という単語が強調表示すべき単語とし
て抽出されるが、後の説明文から抽出された単語が前の
説明文から抽出された単語と重複するので、後の説明文
で強調表示する単語として、第２番目の順位となる「死
去」という単語が決定される。

【００５３】次に、図７のステップＳ９０のリンクファ
イル識別処理について図９を参照して説明する。

【００５４】入力された音声信号（デジタル形態）はシ
ステムメモリ２に一時記憶された後、音素単位の特徴が
抽出される（ステップＳ３１０→Ｓ３２０）。抽出され
た特徴を、各単語モデルに適用し、尤度を計算して。最
も得点の高い単語を認識単語として特定する。なお、本
発明の好適な実施例においては、この得点が閾値に達し
ない場合にはユーザに再度の入力を促している。たとえ
ば、ユーザが音声で「やましたせん」を入力すると、文
字列「やましたせん」「そうりだいじん」「とりしまり
やく」「しきょ」についての各単語モデルが作成され、
尤度計算を行い、その結果「やましたせん」に対応した
単語モデルが選択される。このようにしてＣＰＵ１は抽
出単語領域内の複数単語の読み（図６参照）と作成され
た文字列とを相互に比較し、一致する文字列を検出す
る。この場合には、「やましたせん」が一致する。この
ため、対応のリンクファイル名として、図５の「ｎｅｗ
ｓ１．ｈｔｍｌ」が得られる。（ステップＳ３３０〜Ｓ
３４０）。

【００５５】以上、説明したように、クライアント側の
ブラウザでは、取り込んだＨＴＭＬ文書の中のリンクフ
ァイルの各説明文の中から代表的な単語を強調表示す
る。ユーザが所望の単語を音声で入力すると、ブラウザ
は、入力された単語に関連するリンクファイルにリンク
して、そのリンクファイルを読み出し表示する。ユーザ
は、従来のようにマウスによる説明文の指示操作もしく
は音声による説明文全文入力を行う必要がない。

【００５６】本実施の形態の他に次の例を実施できる。

【００５７】１）上述の実施形態では、ＨＴＭＬ文書の
中から抽出した単語の読みと音声認識結果から得られる
発声内容を示す文字列とを比較しているが、音声認識結
果をかな漢字混じり単語に変化して、上記ＨＴＭＬ文書
から抽出したかな漢字混じり単語と比較することも可能
である。ただし、日本語は同音異義語が多いので、上述
実施形態のように読みと発声内容との比較の方が一致精
度が高くなる。

【００５８】２）上述の実施形態では音声入力可能な単
語には読みの表記を付すことより強調表示している（図
５の（Ａ）参照）。この表示は、読みの表記が表示され
るので、原文のＨＴＭＬ文書と表示形態が異なってしま
う。原文と同一の表示形態としたい場合には、音声入力
すべき単語を図５（Ｂ）の表示４００に示すように、表
示のみの文字列４０１の色（黒色）、リンクファイルの
説明文４０２の色（青色）とは異なる色（紫色）で強調
表示するとよい。強調表示の方法としては、太字やボー
ルド体のように書体を異ならせる方法、文字サイズを異
ならせる方法を使用することもできる。

【００５９】３）上述の実施形態ではリンク先のファイ
ルは同一サーバ内に格納されていると説明したが、同一
サーバに限ることはなく、他のサーバに格納されている
ファイルでもよい。また、リンクするファイルはクライ
アント自身に格納されているファイルでもよい。

【００６０】４）リンクファイルの説明文の中の強調表
示する単語の選別基準としては、以下の基準を使用する
ことができる。

【００６１】（ａ）単語辞書２２の各単語に予め使用頻
度の程度を示す数値を記載しておく。使用頻度は、新聞
等の中に現れる頻度を使用するとよい。この使用頻度を
順位付けに使用する。

【００６２】また、音声認識プログラムが単なる文字や
単語入力用に使用される場合には、単語変換の使用頻度
を計数し、その計数結果を頻度情報とすることができ
る。

【００６３】（ｂ）日本語の場合は主語が最初に現れる
ことが多いので、説明文中の単語位置を順位付けに使用
する。

【００６４】５）上述の実施形態では、リンクファイル
の説明文１つにつき強調表示する単語を１つ選択した
が、これに限ることはなく、単語複数を選択してもよ
い。この場合には、順位の高い複数単語を選択する方法
と、複数の文からなる説明文の中の１文（。記号や．記
号で終了する文字列）毎に最上位の単語を選択する方法
がある。

【００６５】６）上述の実施形態では汎用のパーソナル
コンピュータでブラウザを実現する例を示したが、他の
情報処理機器についても本発明を実現することができ
る。

【００６６】

【発明の効果】以上、説明したように、請求項１、５、
６の発明によれば、リンクしたいファイルの説明文の表
示の中に、音声入力すべき単語が案内表示されるので、
ユーザはその単語を音声で入力することにより、リンク
したいファイルを指示することができる。また、文書
（ＨＴＭＬ文書）を作成するサーバ側のユーザは、音声
入力のための記載の制約がないので、ポインティングデ
バイスの指示、音声入力による指示の区別なく、記載内
容を決定できる。また、既存の文書に対しても音声によ
るリンクファイルの選択が可能となる。

【００６７】請求項２の発明では、リンクファイルの説
明文の中に複数の単語が存在しても、単語の文字数を比
較することで強調表示する単語を自動的に決定すること
ができる。

【００６８】請求項３の発明では、強調の単語に読みが
付加されているので、漢字が単語の中に含まれていて
も、ユーザが発声内容を間違えることがない。

【００６９】請求項４の発明では、音声入力すべき単語
を異なる色で強調することで、サーバ側が提供する文書
の文字列配置を忠実に反映しつつ、音声入力すべき単語
を案内することができる。

【図面の簡単な説明】

【図１】本発明実施形態のシステム構成を示すブロック
図である。

【図２】ＨＤＤ６に搭載されるファイルの内容を示す説
明図である。

【図３】ＨＴＭＬ文書の一例を示す説明図である。

【図４】図３のＨＴＭＬ文書の従来の表示内容を示す説
明図である。

【図５】図３のＨＴＭＬ文書の本実施の形態の表示内容
を示す説明図である。

【図６】リンクファイルの説明文の中から抽出された単
語および関連情報の内容を示す説明図である。

【図７】ＣＰＵ１が実行する処理手順を示すフローチャ
ートである。

【図８】ＣＰＵ１が実行する処理手順を示すフローチャ
ートである。

【図９】ＣＰＵ１が実行する処理手順を示すフローチャ
ートである。

【符号の説明】

１ＣＰＵ２システムメモリ３ディスプレイ４キーボード５ポインティングデバイス６ＨＤＤ７ＦＤＤ８通信インタフェース９モデム１０公衆電話回線１１音声入力インタフェース１２マイクロホン

───────────────────────────────────────────────────── フロントページの続き (72)発明者中道一人神奈川県大和市下鶴間1623番地14 日本アイ・ビー・エム株式会社大和事業所内 (72)発明者福島隆司神奈川県大和市下鶴間1623番地14 日本アイ・ビー・エム株式会社大和事業所内

Claims

【特許請求の範囲】

【請求項１】１以上のリンク先ファイルのファイル名
と前記１以上のリンク先ファイル名の各々に関連付けら
れた１以上の説明文を含む文書を取り込み、前記１以上
の説明文の少なくとも一部をディスプレイに表示し、前
記１以上の説明文のいずれかが選択された場合に、該選
択された説明文に関連するファイル名のファイルを取得
する情報処理装置において、前記１以上の説明文の各々において強調表示すべき単語
を特定する第１の手段と、当該特定された単語に強調表示変換を加える第２の手段
と、入力された音声情報を取得する第３の手段と、前記特定された単語から、前記入力された音声情報に対
応する単語を選択する第４の手段と、前記選択された単語を含む説明文に関連するリンク先フ
ァイル名を取得する第５の手段とを具えたことを特徴と
する情報処理装置。
【請求項２】請求項１に記載の情報処理装置におい
て、前記第１の手段は、前記説明文に含まれる複数の単
語の文字数を比較し、最多の文字数を有する単語を前記
強調表示すべき単語と特定することを特徴とする情報処
理装置。
【請求項３】請求項１〜請求項２に記載の情報処理装
置において、前記第２の手段は、前記第１の手段により
特定された単語の読みを該単語の表示に関連づけて表示
することにより強調表示変換することを特徴とする情報
処理装置。
【請求項４】請求項１〜請求項２に記載の情報処理装
置において、前記表示制御手段は前記第１の単語検出手
段により検出された単語を他の表示とは異なる色で表示
することにより強調表示することを特徴とする情報処理
装置。
【請求項５】１以上のリンク先ファイルのファイル名
と前記１以上のリンク先ファイル名の各々に関連付けら
れた１以上の説明文を含む文書を取り込み、前記１以上
の説明文の少なくとも一部をディスプレイに表示し、前
記１以上の説明文のいずれかが選択された場合に、該選
択された説明文に関連するファイル名のファイルを取得
する方法において、前記１以上の説明文の各々において強調表示すべき単語
を特定する第１のステップと、当該特定された単語に強調表示変換を加える第２のステ
ップと、入力された音声情報を取得する第３のステップと、前記特定された単語から、前記入力された音声情報に対
応する単語を選択する第４のステップと、前記選択された単語を含む説明文に関連するリンク先フ
ァイル名を取得する第５のステップとを具えたことを特
徴とするリンク先ファイルの取得方法。
【請求項６】データ処理システムにおいて稼働し、１
以上のリンク先ファイルのファイル名と前記１以上のリ
ンク先ファイル名の各々に関連付けられた１以上の説明
文を含む文書を取り込み、前記１以上の説明文の少なく
とも一部をディスプレイに表示し、前記１以上の説明文
のいずれかが選択された場合に、該選択された説明文に
関連するファイルを取得するためのプログラムを格納す
る記憶媒体であって、該プログラムは、前記１以上の説明文の各々において強調表示すべき単語
を特定することを前記データ処理システムに指示するプ
ログラムコード手段と、当該特定された単語に強調表示変換を加えることを前記
データ処理システムに指示するプログラムコード手段
と、入力された音声情報を取得し、前記特定された単語か
ら、前記入力された音声情報に対応する単語を選択する
ことを前記データ処理システムに指示するプログラムコ
ード手段と、前記選択された単語を含む説明文に関連するリンク先フ
ァイルを取得することを前記データ処理システムに指示
するプログラムコード手段とを含むことを特徴とする記
憶媒体。