JPH1125098A - 情報処理装置、リンク先ファイルの取得方法および記憶媒体 - Google Patents

情報処理装置、リンク先ファイルの取得方法および記憶媒体

Info

Publication number
JPH1125098A
JPH1125098A JP9167299A JP16729997A JPH1125098A JP H1125098 A JPH1125098 A JP H1125098A JP 9167299 A JP9167299 A JP 9167299A JP 16729997 A JP16729997 A JP 16729997A JP H1125098 A JPH1125098 A JP H1125098A
Authority
JP
Japan
Prior art keywords
word
file
link destination
display
specified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9167299A
Other languages
English (en)
Inventor
Saeko Murakami
佐枝子 村上
Kazuto Nakamichi
一人 中道
Takashi Fukushima
隆司 福島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP9167299A priority Critical patent/JPH1125098A/ja
Priority to US09/098,058 priority patent/US6286014B1/en
Publication of JPH1125098A publication Critical patent/JPH1125098A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • G06F16/94Hypermedia
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99942Manipulating data structure, e.g. compression, compaction, compilation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99943Generating database or data structure, e.g. via user interface
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99944Object-oriented database structure
    • Y10S707/99945Object-oriented database structure processing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99951File or database maintenance
    • Y10S707/99952Coherency, e.g. same view to multiple users
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99951File or database maintenance
    • Y10S707/99952Coherency, e.g. same view to multiple users
    • Y10S707/99953Recoverability

Abstract

(57)【要約】 【課題】 音声入力でリンクファイルの選択を可能にす
る。 【解決手段】 HTML文書の中のリンクファイルの説
明文から特定の単語を選択し、HTML文書の表示の中
で強調表示する。強調表示の単語について音声で入力さ
れたことをCPU1が検出すると、CPU1はその単語
に該当するリンクファイルに接続する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、情報処理装置、リ
ンク先ファイル取得方法および記憶媒体に関する。
【0002】
【従来の技術】インターネットなどの通信ネットワーク
では、テキスト、イメージ、音声、映像の混在した文書
を表示するための情報(以下、ハイパーテキストと称
す)をサーバがホームページとして提供し、クライアン
ト側が上記ハイパーテキストをサーバから取り込み、文
書編集して文書形態で表示することが可能となってい
る。このようなハイパーテキストを表示するためのアプ
リケーションプログラムあるいは装置はブラウザと呼ば
れている。ハイパーテキストは、表示すべき文字列およ
びその書式(文字の大きさ等)を定義したり、リンクす
るファイル(テキスト、イメージ、音声等)を説明する
説明文を記載している。このようなハイパーテキストは
たとえば、HTML(HYPER TEXT MARK
UP LANGUAGE)言語で記載される。
【0003】クライアント側のブラウザはサーバ側のハ
イパーテキストを取り込むと、ハイパーテキストに記載
されている文字列や説明文をその書式にしたがって表示
する。ユーザがその表示を見て、上記説明文をマウスに
より指示すると、ブラウザはその説明文に関連付けてハ
イパーテキスト内に記載されているリンク先のファイル
名(リンクファイル名と称す)に基づき、ファイルにリ
ンクし、表示画面に表示させる。
【0004】なお、リンク先のファイルが音声の場合に
はその音声がクライアント側で再生出力される。上記ブ
ラウザは汎用のパーソナルコンピュータ等のコンピュー
タに搭載され、実行される。最近では、音声認識技術の
向上で、キーボードからの文字入力の代わりに、ユーザ
が音声を入力し、汎用コンピュータ側で音声認識を行っ
て、あらかじめ用意した単語の中から1つを選択するこ
とができるようになっている。
【0005】
【発明が解決しようとする課題】音声による入力は、コ
マンドなど、定型の文字列には有効であり、上述のブラ
ウザでは、フォワード(FORWARD、次の表示画面
に進むこと))、バックワード(BACKWARD、前
の表示画面に進むこと))、リロード(RELOAD、
再ロードすること)といったコマンドを音声で入力する
ことが可能になっている。
【0006】しかしながら、上述のように、リンク先の
ファイルを表示するためには、ユーザはリンク先のファ
イルの説明文をマウスにより指定しなければならず、音
声で指示することはできない。
【0007】そこで、本発明の目的は、上述の点に鑑み
て、単語による音声入力を可能として、ハイパーテキス
トの作成に際しては何ら制約を与えないブラウザおよび
その音声入力方法ならびに記録媒体を提供することにあ
る。
【0008】
【課題を解決するための手段】このような目的を達成す
るために、請求項1の発明は、1以上のリンク先ファイ
ルのファイル名と前記1以上のリンク先ファイル名の各
々に関連付けられた1以上の説明文を含む文書を取り込
み、前記1以上の説明文の少なくとも一部をディスプレ
イに表示し、前記1以上の説明文のいずれかが選択され
た場合に、該選択された説明文に関連するファイル名の
ファイルを取得する情報処理装置において、前記1以上
の説明文の各々において強調表示すべき単語を特定する
第1の手段と、当該特定された単語に強調表示変換を加
える第2の手段と、入力された音声情報を取得する第3
の手段と、前記特定された単語から、前記入力された音
声情報に対応する単語を選択する第4の手段と、前記選
択された単語を含む説明文に関連するリンク先ファイル
名を取得する第5の手段とを具えたことを特徴とする。
【0009】本願明細書の特許請求の範囲において、強
調表示変換とは文字列の色や書体、大きさ等の文字属性
を変換する方法やかぎかっこやダブルコーテーション等
を、文字列の前後に挿入する方法や、その文字列の読み
がなや発音記号等をその文字列の近傍や予め定められた
箇所に表示する方法を含む概念である。
【0010】請求項2の発明は、請求項1に記載の情報
処理装置において、前記第1の手段は、前記説明文に含
まれる複数の単語の文字数を比較し、最多の文字数を有
する単語を前記強調表示すべき単語と特定することを特
徴とする。
【0011】請求項3の発明は、請求項1〜請求項2に
記載の情報処理装置において、前記第2の手段は、前記
第1の手段により特定された単語の読みを該単語の表示
に関連づけて表示することにより強調表示変換すること
を特徴とする。
【0012】請求項4の発明は、請求項1〜請求項2に
記載の情報処理装置において、前記表示制御手段は前記
第1の単語検出手段により検出された単語を他の表示と
は異なる色で表示することにより強調表示することを特
徴とする。
【0013】請求項5の発明は、1以上のリンク先ファ
イルのファイル名と前記1以上のリンク先ファイル名の
各々に関連付けられた1以上の説明文を含む文書を取り
込み、前記1以上の説明文の少なくとも一部をディスプ
レイに表示し、前記1以上の説明文のいずれかが選択さ
れた場合に、該選択された説明文に関連するファイル名
のファイルを取得する方法において、前記1以上の説明
文の各々において強調表示すべき単語を特定する第1の
ステップと、当該特定された単語に強調表示変換を加え
る第2のステップと、入力された音声情報を取得する第
3のステップと、前記特定された単語から、前記入力さ
れた音声情報に対応する単語を選択する第4のステップ
と、前記選択された単語を含む説明文に関連するリンク
先ファイル名を取得する第5のステップとを具えたこと
を特徴とする。
【0014】請求項6の発明は、データ処理システムに
おいて稼働し、1以上のリンク先ファイルのファイル名
と前記1以上のリンク先ファイル名の各々に関連付けら
れた1以上の説明文を含む文書を取り込み、前記1以上
の説明文の少なくとも一部をディスプレイに表示し、前
記1以上の説明文のいずれかが選択された場合に、該選
択された説明文に関連するファイルを取得するためのプ
ログラムを格納する記憶媒体であって、該プログラム
は、前記1以上の説明文の各々において強調表示すべき
単語を特定することを前記データ処理システムに指示す
るプログラムコード手段と、当該特定された単語に強調
表示変換を加えることを前記データ処理システムに指示
するプログラムコード手段と、入力された音声情報を取
得し、前記特定された単語から、前記入力された音声情
報に対応する単語を選択することを前記データ処理シス
テムに指示するプログラムコード手段と、前記選択され
た単語を含む説明文に関連するリンク先ファイルを取得
することを前記データ処理システムに指示するプログラ
ムコード手段とを含むことを特徴とする。
【0015】
【発明の実施の形態】以下、図面を参照して本発明の実
施の形態を詳細に説明する。
【0016】図1は本発明に関わるブラウザを搭載した
汎用パーソナルコンピュータのシステム構成を示す。図
1のシステムはクライアントとして動作する。以下に述
べる構成部がバスに対して接続されている。CPU1は
システムメモリ2に格納されたシステムプログラムにし
たがって、装置全体の制御を実行するほか、ブラウザお
よびブラウザで指示されたアプリケーションプログラム
を実行する。システムメモリ2はROMおよびRAM等
から構成される。ROMには基本フォントや電源立ち上
げ用のシステムプログラムが格納されている。
【0017】RAMにはHDD(ハードディスク記憶装
置)6から読み取られたシステム実行用のシステムプロ
グラムやCPU1の各種の演算における入出力データが
格納される。システムメモリ2の中にはディスプレイ3
に表示するイメージを専用的に格納するメモリも含まれ
る。ディスプレイ3に表示するデータは一定周期でCP
U1もしくはDMA(ダイレクトメモリアクセスコント
ローラ、不図示)により読み取られ、ディスプレイ3に
送られ、表示される。
【0018】キーボード4からはCPU1に対するコマ
ンド、文字、数値等を入力する。ポインティングデバイ
ス5にはたとえば、マウスを使用することが可能であ
り、ディスプレイ3の表示画面上の位置指定を行う。こ
の位置指定を受けて、CPU1はGUI(グラフィカル
・ユーザ・インタフェース)に基づき、所定のコマンド
を実行する。
【0019】HDD6にはOS(オペレーティングシス
テム)のようなシステムプログラムおよび後述のアプリ
ケーションプログラムを保存目的のために記憶する。H
DD6にはさらに、本発明に係わる音声入力処理で使用
する辞書類(後述)も格納されている。
【0020】FDD(フロッピーディスク記憶装置)7
はフロッピーディスクを受け付け、CPU1の制御の下
にフロッピーディスクに対して情報の読み書きを行う。
本発明に係わるブラウザ用のプログラムが記録されたフ
ロッピーディスクを受け付け、HDD6にインストール
することが可能である。FDD7の代わりにCDROM
ドライブを使用することも可能である。RS232Cの
ような通信インタフェース8はモデム9と接続し、モデ
ム9、公衆電話回線10を介して、サーバと接続する。
【0021】音声入力インタフェース11はマイクロホ
ン12から入力されたアナログ音声信号をデジタル形態
の音声信号に変換してCPU1に引き渡す。 その他、
スピーカおよびその出力インタフェースなどの音声出力
手段(不図示)がバスに接続されている。
【0022】音声入力に係るプログラムおよび辞書につ
いて図2を参照して説明する。以下に説明するファイル
はHDD6内に保存される。
【0023】図2において、ブラウザ21はHTML文
書を表示するためのアプリケーションプログラムであ
り、図3に示す音声入力用のプログラムを内部に有す
る。音声入力以外の処理のためのプログラム内容、たと
えば、不図示のTCP/IPのような通信プログラムを
制御して、サーバからHTML文書を取り込む通信処
理、HTML文書に定義されているリンクファイル、す
なわちテキスト、イメージ等を取り込み、ディスプレイ
3に表示する処理を実行するためのプログラム内容は従
来のブラウザと同一である。
【0024】単語辞書22はかな漢字混じりの単語文字
列(いわゆる表記)、その読みおよび文法情報を多数記
載した辞書である。文法情報としては品詞等、単語の区
切り判定に使用される情報が使用される。
【0025】標準パターンファイル23は音声の特徴パ
ターンと音声の識別ラベルとを互いに関連づけたファイ
ルであり、音声認識に使用される。ここで、音声の特徴
パターンとは、たとえば、音声の所定長さ、たとえば、
音韻や音素(音韻を細分化したもの)をフーリエ解析し
て得られる音声特徴を時系列的に並べたもの(音声特徴
系列と呼ばれる)である。音声の識別ラベルは音韻や音
素に与える記号であり、文字コードを使用することもで
きる。このような標準パターンとしては隠れマルコフモ
デルが知られているが、周知のものであれば、どのよう
なものも使用することができる。
【0026】音声認識プログラム24は音声認識を行う
ためのプログラムであり、周知のものを使用することが
できる。例えば隠れマルコフモデルを使用する場合に
は、音声認識プログラム24は入力音声をフーリエ解析
して、特徴パターンに変換する。次に音声認識プログラ
ム24は音素モデルファイル23から認識すべき単語の
音素モデルを連結し、その単語のモデルについてユーザ
の入力した音声の特徴列に対して各モデルのスコアを計
算し、最良のものを選択する。DPマッチング等の特徴
パターンの合致判定方法を使用することによっても、本
発明を実施することができる。
【0027】言語解析プログラム25は文などを構成す
る文字列の中から単語を抽出する。
【0028】単語抽出方法としては、かな漢字文への変
換処理等で周知の方法を使用することができる。本実施
の形態では、単語辞書22に記載されている単語が上記
文字列の中に含まれているかを判定することにより単語
抽出を行う。この際に、単語としては名詞(句を含む)
が選択される。
【0029】本実施の形態では、HTML文書の中に記
載されているリンクファイルの説明文の中から単語を自
動抽出し、音声により入力された単語と同一の単語を有
するリンクファイルをユーザが指定したリンクファイル
と判別することにより音声によるリンクファイルの指定
を実現する。
【0030】次にHTML文書を図3により簡単に説明
する。図3において、<HTML>はHTML文書の開
始を宣言する定義(タグとも呼ばれる)である。HTM
L文書の終了は</HTML>と定義される。HTML
文書の開始と終了の間で記載されたハイパーテキストが
出力(表示、音声出力)の対象となる。<BODY>,
</BODY>は本文の開始、終了を表す定義である。
【0031】<P>は表示位置を1行だけ下にずらすこ
とを指示する定義である。<UL>,</UL>は<L
I>で始まる文字列に●記号を付して項目分けして表示
する範囲を示す。文字列101(ニュース速報(5月1
日16時更新)は表示にのみ提供される。定義群102
がリンクファイルに関する定義である。
【0032】<A href=”news.html”
>山下線で事故、5万人の足に影響</A>はリンクフ
ァイルおよびその説明文の定義である。ここで、『A
href=””』がリンク文書があることの定義であ
り、””で囲まれる文字列がリンク先のファイル名を示
す。『山下線で事故、5万人の足に影響』がリンクファ
イルの説明文であり、表示の対象となる。 </A>が
説明文の終了を示す。
【0033】HTML文書およびリンク先のリンクファ
イルはサーバ側に保存されており、クライアント側のブ
ラウザの要求により引き渡される。
【0034】クライアント側に取り込まれたHTML文
書がブラウザ21により解析されて従来では図4の符号
200でに示すように表示される。文字列201が図4
のHTML文書の中の文字列101に対応する。文字列
群202はリンクファイルの説明文であり、図4の定義
群102に対応する。通常、表示のみの文字列の色と、
リンクファイルの説明文の色とは異なるようにデフォル
ト値で定められている。ちなみに従来ではマウスにより
説明文のいずれかを指定すると、その説明文に対応する
リンクファイルがサーバから読み出されて、クライアン
トのディスプレイ3に表示される。本実施の形態では、
従来と表示形態が一部異なる。表示の説明は以下の動作
説明で行う。
【0035】音声入力に関わるブラウザ21の処理動作
を図7〜図9のフローチャートを参照して説明する。図
7〜図9に示す処理手順は、実際にはCPU1が実行可
能なプログラムコードで記載されているが、説明の便宜
上、図7〜図9では処理内容を可能な限り、周知の処理
に分解して機能表現している。
【0036】なお、予め、クライアント側では、公衆電
話回線10を介してインタネット等、サーバを有する通
信ネットワークに接続し、ブラウザ21を起動している
ものとする。
【0037】図7においてユーザは、キーボード4から
HTML文書(ホームページ)の存在する通信アドレス
(URLと呼ばれることがある)入力する。これにより
CPU1は指定されたURLを有するサーバにアクセス
し、指定されたURLのHTML文書たとえば、図3に
示すHTML文書を通信インタフェース8を介して取り
込み、システムメモリ2内に一時記憶する(ステップS
10〜S30)。
【0038】CPU1は一時記憶されたHTML文書を
検索してリンクファイルの説明文から単語を抽出する。
単語抽出処理は図8を使用して後述する。本実施の形態
では、リンクファイルの定義毎に1つの単語が抽出さ
れ、システムメモリ2内の専用領域(以下、抽出単語領
域と称する)に記憶される。また、リンクファイルの定
義の中に記載されているリンクファイル名、および単語
の読みも抽出された単語に関連付けられて図6に示すよ
うに記憶される(ステップS40)。
【0039】次にCPU1はHTML文書の表示を行
う。この表示例を図5(A)で符号300により示す。
この時、HTML文書の中の上記抽出した単語と同じ単
語には図5の符号303で示すように抽出単語領域に記
載されている読み400が付加されて強調表示される。
また、表示のみの文字列301は黒色で、リンクファイ
ルの説明文302は青色で表示される(ステップS5
0)。
【0040】ユーザは青色で表示された文字列の中の読
みが付されている文字列をマイクロホン12から音声入
力する。音声の入力があったことがステップS80でC
PU1において検出されると、CPU1は音声により入
力された文字列に対応のリンクファイルを識別し、リン
ク処理を行う。このときリンク先のファイルの名前がh
tmlなど、HTML文書であることを示す識別子を持
つ場合には、手順をステップS30に戻し、リンク先の
HTML文書について、上述の単語抽出処理、音声によ
るリンクファイルの指定が実行される(ステップS80
→S90→S110→S30)。
【0041】一方、JEPGやGIFなどのイメージフ
ァイルであることを示す示す識別子をリンクファイル名
が持つ場合には、CPU1はそのリンク先からファイル
を取り込み、ディスプレイ3に表示する(ステップS8
0→S90→S110→S120)。なお、リンクファ
イルが音声ファイルの場合には音声出力されることは言
うまでもない。
【0042】従来と同様の処理、たとえば、表示されて
いる文書の保存等の処理は、ステップS60〜S80→
S100→S60)のループ処理において実行される。
【0043】ユーザがホームページのアクセス先を変更
した場合には、その変更(新たなURLの入力)がステ
ップS70で検出され、手順がステップS20に戻る。
これにより、新たなHTML文書について、上述の音声
入力のための前処理、すなわち、単語抽出処理が行われ
る。
【0044】ユーザがキーボード4あるいはポインティ
ングデバイス(マウス)5により処理の終了を指示する
と、この指示がステップS60で検出されて図7の処理
手順が終了する。
【0045】図7のステップS40の単語抽出処理の詳
細手順を図8に示す。
【0046】上述したようにリンクファイルに関する説
明文は、<A....”>から始まり</A>で終了す
る。したがって、コンピュータが有し、文書処理でよく
知られる単語検索機能を使用して、<A....”>の
文字列および</A>の文字列の位置を検出し、検出さ
れた2つの文字位置で挟まれる文字列をCPU1により
検出する(ステップS220)。
【0047】検出された文字列はシステムメモリ2内に
一時記憶される。次にCPU1は単語辞書22の先頭の
単語を読み出し、読み出した単語と同じ単語が抽出した
文字列の中にあるか否かを判定する。同じ文字列がある
場合には、その文字列をシステムメモリ2内に一時記憶
する。なお、同じ文字列が検出されても、文法情報が名
詞句ではないものは除外される。以下、単語辞書22の
記載順に単語の有無判定を繰り返し実行して、リンクフ
ァイルの説明文の中に含まれている名詞句の単語をピッ
クアップする。図3のHTML文書の最初の説明文につ
いて上述の処理を施すと、「山下線」、「事故」「5万
人」...が得られる。このとき単語辞書22に記載さ
れている読みも共にシステムメモリ2一時記憶される
(ステップS230)。
【0048】なお、この際に、連続する名詞、たとえ
ば、「5万」「人」は1つの名詞句に統合される。
【0049】次に、CPU1は抽出された1以上の単語
の中から、強調表示(読みを付加)する単語を予め定め
た順位付け基準に基づき決定する。
【0050】本実施の形態では、読みを示す文字(カタ
カナ、ひらがな等)の文字数が一番多い単語が強調表示
する文字として決定される。最多の文字数の単語が複数
となった場合には、たとえば、説明文の先頭にもっとも
近い単語が強調表示する単語として決定され、上述した
抽出単語領域に読みと共に記憶される(ステップS24
0)。
【0051】以下、HTML文書内のリンクファイルの
説明文が順次に検出され、検出された説明文から強調表
示する単語が決定される(ステップS210〜S240
のループ処理)。
【0052】単語抽出領域への記憶に際しては、これま
でに抽出した単語(強調表示すべき単語)と新たに抽出
し単語が重複しないかの判定が行われ、重複する場合に
は、同一の説明文の中に存在し、順位が次の単語が強調
すべき単語に変更される(ステップS250)。図3の
HTML文書例では、リンクファイルの2つの説明文か
らそれぞれ取締役という単語が強調表示すべき単語とし
て抽出されるが、後の説明文から抽出された単語が前の
説明文から抽出された単語と重複するので、後の説明文
で強調表示する単語として、第2番目の順位となる「死
去」という単語が決定される。
【0053】次に、図7のステップS90のリンクファ
イル識別処理について図9を参照して説明する。
【0054】入力された音声信号(デジタル形態)はシ
ステムメモリ2に一時記憶された後、音素単位の特徴が
抽出される(ステップS310→S320)。抽出され
た特徴を、各単語モデルに適用し、尤度を計算して。最
も得点の高い単語を認識単語として特定する。なお、本
発明の好適な実施例においては、この得点が閾値に達し
ない場合にはユーザに再度の入力を促している。たとえ
ば、ユーザが音声で「やましたせん」を入力すると、文
字列「やましたせん」「そうりだいじん」「とりしまり
やく」「しきょ」についての各単語モデルが作成され、
尤度計算を行い、その結果「やましたせん」に対応した
単語モデルが選択される。このようにしてCPU1は抽
出単語領域内の複数単語の読み(図6参照)と作成され
た文字列とを相互に比較し、一致する文字列を検出す
る。この場合には、「やましたせん」が一致する。この
ため、対応のリンクファイル名として、図5の「new
s1.html」が得られる。(ステップS330〜S
340)。
【0055】以上、説明したように、クライアント側の
ブラウザでは、取り込んだHTML文書の中のリンクフ
ァイルの各説明文の中から代表的な単語を強調表示す
る。ユーザが所望の単語を音声で入力すると、ブラウザ
は、入力された単語に関連するリンクファイルにリンク
して、そのリンクファイルを読み出し表示する。ユーザ
は、従来のようにマウスによる説明文の指示操作もしく
は音声による説明文全文入力を行う必要がない。
【0056】本実施の形態の他に次の例を実施できる。
【0057】1)上述の実施形態では、HTML文書の
中から抽出した単語の読みと音声認識結果から得られる
発声内容を示す文字列とを比較しているが、音声認識結
果をかな漢字混じり単語に変化して、上記HTML文書
から抽出したかな漢字混じり単語と比較することも可能
である。ただし、日本語は同音異義語が多いので、上述
実施形態のように読みと発声内容との比較の方が一致精
度が高くなる。
【0058】2)上述の実施形態では音声入力可能な単
語には読みの表記を付すことより強調表示している(図
5の(A)参照)。この表示は、読みの表記が表示され
るので、原文のHTML文書と表示形態が異なってしま
う。原文と同一の表示形態としたい場合には、音声入力
すべき単語を図5(B)の表示400に示すように、表
示のみの文字列401の色(黒色)、リンクファイルの
説明文402の色(青色)とは異なる色(紫色)で強調
表示するとよい。強調表示の方法としては、太字やボー
ルド体のように書体を異ならせる方法、文字サイズを異
ならせる方法を使用することもできる。
【0059】3)上述の実施形態ではリンク先のファイ
ルは同一サーバ内に格納されていると説明したが、同一
サーバに限ることはなく、他のサーバに格納されている
ファイルでもよい。また、リンクするファイルはクライ
アント自身に格納されているファイルでもよい。
【0060】4)リンクファイルの説明文の中の強調表
示する単語の選別基準としては、以下の基準を使用する
ことができる。
【0061】(a)単語辞書22の各単語に予め使用頻
度の程度を示す数値を記載しておく。使用頻度は、新聞
等の中に現れる頻度を使用するとよい。この使用頻度を
順位付けに使用する。
【0062】また、音声認識プログラムが単なる文字や
単語入力用に使用される場合には、単語変換の使用頻度
を計数し、その計数結果を頻度情報とすることができ
る。
【0063】(b)日本語の場合は主語が最初に現れる
ことが多いので、説明文中の単語位置を順位付けに使用
する。
【0064】5)上述の実施形態では、リンクファイル
の説明文1つにつき強調表示する単語を1つ選択した
が、これに限ることはなく、単語複数を選択してもよ
い。この場合には、順位の高い複数単語を選択する方法
と、複数の文からなる説明文の中の1文(。記号や.記
号で終了する文字列)毎に最上位の単語を選択する方法
がある。
【0065】6)上述の実施形態では汎用のパーソナル
コンピュータでブラウザを実現する例を示したが、他の
情報処理機器についても本発明を実現することができ
る。
【0066】
【発明の効果】以上、説明したように、請求項1、5、
6の発明によれば、リンクしたいファイルの説明文の表
示の中に、音声入力すべき単語が案内表示されるので、
ユーザはその単語を音声で入力することにより、リンク
したいファイルを指示することができる。また、文書
(HTML文書)を作成するサーバ側のユーザは、音声
入力のための記載の制約がないので、ポインティングデ
バイスの指示、音声入力による指示の区別なく、記載内
容を決定できる。また、既存の文書に対しても音声によ
るリンクファイルの選択が可能となる。
【0067】請求項2の発明では、リンクファイルの説
明文の中に複数の単語が存在しても、単語の文字数を比
較することで強調表示する単語を自動的に決定すること
ができる。
【0068】請求項3の発明では、強調の単語に読みが
付加されているので、漢字が単語の中に含まれていて
も、ユーザが発声内容を間違えることがない。
【0069】請求項4の発明では、音声入力すべき単語
を異なる色で強調することで、サーバ側が提供する文書
の文字列配置を忠実に反映しつつ、音声入力すべき単語
を案内することができる。
【図面の簡単な説明】
【図1】本発明実施形態のシステム構成を示すブロック
図である。
【図2】HDD6に搭載されるファイルの内容を示す説
明図である。
【図3】HTML文書の一例を示す説明図である。
【図4】図3のHTML文書の従来の表示内容を示す説
明図である。
【図5】図3のHTML文書の本実施の形態の表示内容
を示す説明図である。
【図6】リンクファイルの説明文の中から抽出された単
語および関連情報の内容を示す説明図である。
【図7】CPU1が実行する処理手順を示すフローチャ
ートである。
【図8】CPU1が実行する処理手順を示すフローチャ
ートである。
【図9】CPU1が実行する処理手順を示すフローチャ
ートである。
【符号の説明】
1 CPU 2 システムメモリ 3 ディスプレイ 4 キーボード 5 ポインティングデバイス 6 HDD 7 FDD 8 通信インタフェース 9 モデム 10 公衆電話回線 11 音声入力インタフェース 12 マイクロホン
───────────────────────────────────────────────────── フロントページの続き (72)発明者 中道 一人 神奈川県大和市下鶴間1623番地14 日本ア イ・ビー・エム株式会社 大和事業所内 (72)発明者 福島 隆司 神奈川県大和市下鶴間1623番地14 日本ア イ・ビー・エム株式会社 大和事業所内

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 1以上のリンク先ファイルのファイル名
    と前記1以上のリンク先ファイル名の各々に関連付けら
    れた1以上の説明文を含む文書を取り込み、前記1以上
    の説明文の少なくとも一部をディスプレイに表示し、前
    記1以上の説明文のいずれかが選択された場合に、該選
    択された説明文に関連するファイル名のファイルを取得
    する情報処理装置において、 前記1以上の説明文の各々において強調表示すべき単語
    を特定する第1の手段と、 当該特定された単語に強調表示変換を加える第2の手段
    と、 入力された音声情報を取得する第3の手段と、 前記特定された単語から、前記入力された音声情報に対
    応する単語を選択する第4の手段と、 前記選択された単語を含む説明文に関連するリンク先フ
    ァイル名を取得する第5の手段とを具えたことを特徴と
    する情報処理装置。
  2. 【請求項2】 請求項1に記載の情報処理装置におい
    て、前記第1の手段は、前記説明文に含まれる複数の単
    語の文字数を比較し、最多の文字数を有する単語を前記
    強調表示すべき単語と特定することを特徴とする情報処
    理装置。
  3. 【請求項3】 請求項1〜請求項2に記載の情報処理装
    置において、前記第2の手段は、前記第1の手段により
    特定された単語の読みを該単語の表示に関連づけて表示
    することにより強調表示変換することを特徴とする情報
    処理装置。
  4. 【請求項4】 請求項1〜請求項2に記載の情報処理装
    置において、前記表示制御手段は前記第1の単語検出手
    段により検出された単語を他の表示とは異なる色で表示
    することにより強調表示することを特徴とする情報処理
    装置。
  5. 【請求項5】 1以上のリンク先ファイルのファイル名
    と前記1以上のリンク先ファイル名の各々に関連付けら
    れた1以上の説明文を含む文書を取り込み、前記1以上
    の説明文の少なくとも一部をディスプレイに表示し、前
    記1以上の説明文のいずれかが選択された場合に、該選
    択された説明文に関連するファイル名のファイルを取得
    する方法において、 前記1以上の説明文の各々において強調表示すべき単語
    を特定する第1のステップと、 当該特定された単語に強調表示変換を加える第2のステ
    ップと、 入力された音声情報を取得する第3のステップと、 前記特定された単語から、前記入力された音声情報に対
    応する単語を選択する第4のステップと、 前記選択された単語を含む説明文に関連するリンク先フ
    ァイル名を取得する第5のステップとを具えたことを特
    徴とするリンク先ファイルの取得方法。
  6. 【請求項6】 データ処理システムにおいて稼働し、1
    以上のリンク先ファイルのファイル名と前記1以上のリ
    ンク先ファイル名の各々に関連付けられた1以上の説明
    文を含む文書を取り込み、前記1以上の説明文の少なく
    とも一部をディスプレイに表示し、前記1以上の説明文
    のいずれかが選択された場合に、該選択された説明文に
    関連するファイルを取得するためのプログラムを格納す
    る記憶媒体であって、 該プログラムは、 前記1以上の説明文の各々において強調表示すべき単語
    を特定することを前記データ処理システムに指示するプ
    ログラムコード手段と、 当該特定された単語に強調表示変換を加えることを前記
    データ処理システムに指示するプログラムコード手段
    と、 入力された音声情報を取得し、前記特定された単語か
    ら、前記入力された音声情報に対応する単語を選択する
    ことを前記データ処理システムに指示するプログラムコ
    ード手段と、 前記選択された単語を含む説明文に関連するリンク先フ
    ァイルを取得することを前記データ処理システムに指示
    するプログラムコード手段とを含むことを特徴とする記
    憶媒体。
JP9167299A 1997-06-24 1997-06-24 情報処理装置、リンク先ファイルの取得方法および記憶媒体 Pending JPH1125098A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP9167299A JPH1125098A (ja) 1997-06-24 1997-06-24 情報処理装置、リンク先ファイルの取得方法および記憶媒体
US09/098,058 US6286014B1 (en) 1997-06-24 1998-06-16 Method and apparatus for acquiring a file to be linked

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9167299A JPH1125098A (ja) 1997-06-24 1997-06-24 情報処理装置、リンク先ファイルの取得方法および記憶媒体

Publications (1)

Publication Number Publication Date
JPH1125098A true JPH1125098A (ja) 1999-01-29

Family

ID=15847188

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9167299A Pending JPH1125098A (ja) 1997-06-24 1997-06-24 情報処理装置、リンク先ファイルの取得方法および記憶媒体

Country Status (2)

Country Link
US (1) US6286014B1 (ja)
JP (1) JPH1125098A (ja)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001092845A (ja) * 1999-09-27 2001-04-06 Toshiba Corp 文書取得方法及び記録媒体
JP2002041556A (ja) * 2000-07-31 2002-02-08 Nippon Telegr & Teleph Corp <Ntt> 音声ブラウジングのためのハイパーテキスト中継方法及び装置並びに記録媒体
JP2002342212A (ja) * 2001-04-27 2002-11-29 Internatl Business Mach Corp <Ibm> 情報アクセス方法、情報アクセスシステムおよびプログラム
US6539424B1 (en) 1999-11-12 2003-03-25 International Business Machines Corporation Restricting deep hyperlinking on the World Wide Web
JP2003514261A (ja) * 1999-11-09 2003-04-15 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ インターネットページのハイパーリンクを作動させる音声認識方法
EP1312077A1 (en) * 2000-06-23 2003-05-21 Minebea Co., Ltd Input device for voice recognition and articulation using keystroke data.
JP2003521762A (ja) * 1999-07-02 2003-07-15 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ユーザ・プロファイルに基づいた音声のurl上へのマッピング
JP2004505361A (ja) * 2000-07-21 2004-02-19 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 通信システム
US6941368B1 (en) 2000-05-31 2005-09-06 International Business Machines Corporation Protecting resource URLs from being served without a base web page
WO2006093003A1 (ja) * 2005-02-28 2006-09-08 Pioneer Corporation 辞書データ生成装置及び電子機器
JP2007004280A (ja) * 2005-06-21 2007-01-11 Mitsubishi Electric Corp コンテンツ情報提供装置
JP2007122450A (ja) * 2005-10-28 2007-05-17 Nippon Telegr & Teleph Corp <Ntt> 自動情報取得装置および自動情報取得方法
JP2012256047A (ja) * 2011-06-07 2012-12-27 Samsung Electronics Co Ltd ディスプレイ装置およびそのリンク実行方法、並びに、音声認識方法
DE112014007207B4 (de) 2014-11-25 2019-12-24 Mitsubishi Electric Corporation Informations-Präsentationssystem

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6704727B1 (en) * 2000-01-31 2004-03-09 Overture Services, Inc. Method and system for generating a set of search terms
JP4821039B2 (ja) * 2000-10-24 2011-11-24 日本電気株式会社 地名情報抽出装置、その抽出方法及び記録媒体
US7155664B1 (en) * 2000-11-14 2006-12-26 Cypress Semiconductor, Corp. Extracting comment keywords from distinct design files to produce documentation
US7400785B2 (en) * 2003-08-13 2008-07-15 Hewlett-Packard Development Company, L.P. Systems and methods for associating images
US7434158B2 (en) * 2003-12-10 2008-10-07 International Business Machines Corporation Presenting multimodal web page content on sequential multimode devices
US7707501B2 (en) * 2005-08-10 2010-04-27 International Business Machines Corporation Visual marker for speech enabled links
US20100121870A1 (en) * 2008-07-03 2010-05-13 Erland Unruh Methods and systems for processing complex language text, such as japanese text, on a mobile device
WO2012043756A1 (ja) * 2010-09-30 2012-04-05 楽天株式会社 閲覧装置、閲覧方法、プログラムを記録した非一時的なコンピュータ読み取り可能な記録媒体、ならびに、スクリプトプログラム
KR101917648B1 (ko) * 2016-09-08 2018-11-13 주식회사 하이퍼커넥트 단말 및 그 제어 방법
US11393451B1 (en) * 2017-03-29 2022-07-19 Amazon Technologies, Inc. Linked content in voice user interface

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3185505B2 (ja) * 1993-12-24 2001-07-11 株式会社日立製作所 会議録作成支援装置
US5946647A (en) * 1996-02-01 1999-08-31 Apple Computer, Inc. System and method for performing an action on a structure in computer-generated data
US5923736A (en) * 1996-04-02 1999-07-13 National Semiconductor Corporation Hypertext markup language based telephone apparatus
US5908467A (en) * 1996-05-31 1999-06-01 International Business Machines Corporation System and method for displaying file parameters
JPH1078952A (ja) * 1996-07-29 1998-03-24 Internatl Business Mach Corp <Ibm> 音声合成方法、音声合成装置、ハイパーテキストの制御方法及び制御装置
US5983351A (en) * 1996-10-16 1999-11-09 Intellectual Protocols, L.L.C. Web site copyright registration system and method
US5875429A (en) * 1997-05-20 1999-02-23 Applied Voice Recognition, Inc. Method and apparatus for editing documents through voice recognition
US5958016A (en) * 1997-07-13 1999-09-28 Bell Atlantic Network Services, Inc. Internet-web link for access to intelligent network service control

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003521762A (ja) * 1999-07-02 2003-07-15 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ユーザ・プロファイルに基づいた音声のurl上へのマッピング
JP2001092845A (ja) * 1999-09-27 2001-04-06 Toshiba Corp 文書取得方法及び記録媒体
JP2003514261A (ja) * 1999-11-09 2003-04-15 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ インターネットページのハイパーリンクを作動させる音声認識方法
US6539424B1 (en) 1999-11-12 2003-03-25 International Business Machines Corporation Restricting deep hyperlinking on the World Wide Web
US6941368B1 (en) 2000-05-31 2005-09-06 International Business Machines Corporation Protecting resource URLs from being served without a base web page
JP2004509385A (ja) * 2000-06-23 2004-03-25 ミネベア株式会社 キー入力データを用いた音声認識及び明瞭度のための入力デバイス。
EP1312077A1 (en) * 2000-06-23 2003-05-21 Minebea Co., Ltd Input device for voice recognition and articulation using keystroke data.
EP1312077A4 (en) * 2000-06-23 2005-08-17 Minebea Co Ltd ENTRY DEVICE FOR RECOGNIZING VOICE AND JOINT BY HIT DATA
JP2004505361A (ja) * 2000-07-21 2004-02-19 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 通信システム
JP2002041556A (ja) * 2000-07-31 2002-02-08 Nippon Telegr & Teleph Corp <Ntt> 音声ブラウジングのためのハイパーテキスト中継方法及び装置並びに記録媒体
JP2002342212A (ja) * 2001-04-27 2002-11-29 Internatl Business Mach Corp <Ibm> 情報アクセス方法、情報アクセスシステムおよびプログラム
WO2006093003A1 (ja) * 2005-02-28 2006-09-08 Pioneer Corporation 辞書データ生成装置及び電子機器
JP2007004280A (ja) * 2005-06-21 2007-01-11 Mitsubishi Electric Corp コンテンツ情報提供装置
JP4675691B2 (ja) * 2005-06-21 2011-04-27 三菱電機株式会社 コンテンツ情報提供装置
JP2007122450A (ja) * 2005-10-28 2007-05-17 Nippon Telegr & Teleph Corp <Ntt> 自動情報取得装置および自動情報取得方法
JP2012256047A (ja) * 2011-06-07 2012-12-27 Samsung Electronics Co Ltd ディスプレイ装置およびそのリンク実行方法、並びに、音声認識方法
DE112014007207B4 (de) 2014-11-25 2019-12-24 Mitsubishi Electric Corporation Informations-Präsentationssystem

Also Published As

Publication number Publication date
US6286014B1 (en) 2001-09-04

Similar Documents

Publication Publication Date Title
JPH1125098A (ja) 情報処理装置、リンク先ファイルの取得方法および記憶媒体
KR100287093B1 (ko) 음성 합성 방법, 음성 합성 장치, 하이퍼 텍스트의 제어 방법 및 제어 장치
US4777600A (en) Phonetic data-to-kanji character converter with a syntax analyzer to alter priority order of displayed kanji homonyms
KR100661687B1 (ko) 대화형 음성 응답 애플리케이션 구현 장치 및 방법, 머신 판독가능 매체 및 대화형 음성 응답 시스템
JP3789614B2 (ja) ブラウザシステム、音声プロキシサーバ、リンク項目の読み上げ方法及びリンク項目の読み上げプログラムを格納した記憶媒体
JP3143345B2 (ja) 文字列検索装置
JP2000242638A (ja) 文字処理装置および方法
JP2002197118A (ja) 情報アクセス方法、情報アクセスシステムおよび記録媒体
JPH10124293A (ja) 音声指令可能なコンピュータとそれ用の媒体
JP3094896B2 (ja) 文章読み上げ方式
JPH08287088A (ja) 情報検索方法及びその装置
JP2004240859A (ja) 言い換えシステム
JP4756764B2 (ja) プログラム及び情報処理装置並びに情報処理方法
JP2838984B2 (ja) 汎用参照装置
JPH09325787A (ja) 音声合成方法、音声合成装置、文章への音声コマンド組み込み方法、及び装置
JP4043176B2 (ja) 自然言語処理装置
JPH11272673A (ja) 文書処理方法および文書処理装置ならびに文書処理のためのコンピュータプログラムを記録した記録媒体
JP2008191879A (ja) 情報表示装置、情報表示装置の表示方法、情報表示プログラム、および情報表示プログラムを記録した記録媒体
JP3537260B2 (ja) リンク付文書検索表示システム
JPH09258763A (ja) 音声合成装置
JPH1145269A (ja) 文書管理支援システムおよびそのシステムとしてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP3253311B2 (ja) 言語処理装置および言語処理方法
JPH11184854A (ja) 電子辞書
JPH09185629A (ja) 機械翻訳方法
JPH11296525A (ja) データベースの作成方法とデータベース作成装置及びそのデータベースを利用した情報検索方法と情報検索装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060310

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080612

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080617

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080807

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090304