JP2001075968A - 情報検索方法及びそれを記録した記録媒体 - Google Patents

情報検索方法及びそれを記録した記録媒体

Info

Publication number
JP2001075968A
JP2001075968A JP24553599A JP24553599A JP2001075968A JP 2001075968 A JP2001075968 A JP 2001075968A JP 24553599 A JP24553599 A JP 24553599A JP 24553599 A JP24553599 A JP 24553599A JP 2001075968 A JP2001075968 A JP 2001075968A
Authority
JP
Japan
Prior art keywords
information
recognition
user
server
recognition result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP24553599A
Other languages
English (en)
Inventor
Akihiko Sugikawa
明彦 杉川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP24553599A priority Critical patent/JP2001075968A/ja
Publication of JP2001075968A publication Critical patent/JP2001075968A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 利用者が情報処理装置に与える指示の手間を
大きく削減し、使用方法が容易で、かつ、所望の情報を
取得するまでの時間を大幅に削減する、音声制御による
情報検索方法を記録した記録媒体を提供する。 【解決手段】 演算手段1、表示手段2、記憶手段3、
通信手段6、キーボード4、指示手段5、音声入力手段
7から構成される情報処理装置上で動作するプログラム
として実現され、複数の音声認識結果から得られたアク
セス用のコードデータと、テンプレートとを用いてサー
バのアクセス命令を作成し、直接目的のWebページに
アクセスすることで、サーバへのアクセス回数も1回だ
けとなる。この結果、目的のWebページに至る経路情
報を知らなくても所望の情報を入手することができる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、例えば、Webサ
ーバの提供する情報へのアクセスを実現するための情報
検索方法及びそれを記録した記録媒体に関する。
【0002】
【従来の技術】近年、インターネット上に、時刻表、番
組表、天気、ニュースなどさまざまな情報が提供されて
いる。利用者は、携帯型の情報処理装置上で、情報アク
セス用のアプリケーションであるブラウザを使用して、
任意の場所から必要な情報にアクセス可能となった。利
用者はなんらかの情報を知りたい場合には、最初にポー
タルと呼ばれる起点となるWebページにアクセスし、
前記Webページから関連するページを順次指示するこ
とで目的の情報を得ることができる。
【0003】一般的にブラウザは、受信したHTML
(Hyper Text Markup Langua
ge)文書を解析し、表示用データを作成し画面に提示
する。このとき画面サイズが文書サイズより小さい場合
は、文書の一部分のみ表示し、利用者は必要に応じて表
示画面のスクロールを指示する。Webページによって
は、1つのページに多くの情報を含んでいる場合があ
り、利用者は目的とする情報を知るためには、前記当す
る場所までページをスクロールする必要がある。特に携
帯型の情報処理装置では、表示画面が小さいために移動
量は大きくなる問題が生じる。
【0004】一方、近年、携帯型情報処理装置の普及に
より、多くの利用者がオフィスや自宅以外の様々な場所
で利用する機会が増えている。これまでのように机の前
でイスに座りながらキーボードやマウスで操作するスタ
イルだけではなく、場所・用途に適応した入力方法が必
要になってきている。
【0005】音声入力は、ハードウェアの進歩と共に実
用化され始めており、メニュー選択や、文書入力手段と
して利用されている。最近では音声制御で、WWW(W
orld Wide Web)上のWebページにアク
セスする方法も実現されている。例えば、予め登録され
たキーワード発話により、そのキーワードに対応したW
ebページへのアクセスを実現した音声制御ブラウザが
利用されている。この方法では、ポータルと呼ばれる他
のWebページへのリンクを集めたWebページには、
音声でアクセスできるが、そこからリンク先のページへ
の移動は、利用者がマウスやキーボードなどの他の手段
で指示する必要がある。
【0006】このような問題に対処するために、アンカ
ーと呼ばれるリンク先を示す文章そのものを発話する方
法(特開平10−124293号)、あるいは、アンカ
ー内の文章から選択したキーワードを発話する方法(特
開平11−25098号)など、音声の指示だけで関連
するWebページへの移動を実現する方法が提案されて
いる。
【0007】上記提案では、受信後したHTMLで記述
された文書を解析し、TAGと呼ばれる識別子を手がか
りに、アンカー文とリンク先情報(URL)を取得し、
メモリに対応関係を一時的に記録し、音声辞書には、ア
ンカー文の読みデータ、あるいはアンカー文から抽出し
たキーワードの読みデータを登録する。音声認識エンジ
ンが利用者の発話を認識すると、システムは認識結果に
対応するリンク先情報(URL)を取得し、ブラウザに
そのURLのWebページをアクセスする命令を与え
る。ブラウザはWebページ取得後、システムは再びH
TML文章を解析することで更なる移動を実現する。
【0008】このように音声だけで、目的とするWeb
ページまでアクセス可能となったが、サーバが提供する
情報が多い場合には、そのWebページの構成を把握し
ていないと、目的のWebページへの到達までに試行錯
誤を繰り返すこことなる。また、目的のWebページま
での到達方法を把握していても、何回もの指示を必要と
する。それゆえ、必要とする情報の取得には手間や時間
がかかり、利用者の利便性を損ねている。
【0009】特に、Webページを順番にたどっていく
場合など、通信回線の状況に遅延時間は左右されやす
く、またWebページのデータ量が大きい場合には、数
分から十数分のアクセス時間が必要となる。
【0010】音声認識技術は、完全ではなく、時には特
定キーワードの認識ができない場合がある。そのような
場合のため何らかの代替手段は必要である。また、予め
認識対象をエンジンに登録しておく必要があり、対象と
する件数が多い場合には、認識に要するメモリサイズや
遅延時間など、携帯情報処理装置を考慮すると実用上の
課題が生じる。
【0011】条件を変更して同じサーバに再度検索する
場合には、一旦検索条件を設定するぺージに戻り、再度
入力を行う必要があり、これも利用者の利便性を損ねて
いる。従来、複数の種類のデータを音声で入力する場合
には、銀行のATMように予め決められた手順に従って
入力を行う必要があり、システム主導で対話が進んでい
く。
【0012】それに対して、図14のようなデータ入力
画面を利用者に提示し、利用者にデータ入力を行うスロ
ットを選択させ、そのスロットに関連した認識辞書を準
備して、データ入力を行う方法が考えられる。この方法
ではスロットに関連したデータしか認識しないため、他
のスロット向けの単語を誤認識することはない。また、
誤認識が生じた場合でも、正しく認識するまで再度発話
するだけで良い。しかしこの方法では、指示手段でスロ
ットを指定する手間が生じる。
【0013】
【発明が解決しようとする課題】以上説明したように従
来の音声制御ブラウザでは、必要な情報の所得までに要
する手間や時間が多いという問題があった。
【0014】本発明は、利用者が情報処理装置に与える
指示の手間を大きく削減し、使用方法が容易で、かつ、
所望の情報を取得するまでの時間を大幅に削減する、音
声制御による情報検索方法及びそれを記録した記録媒体
を提供することを目的とする。
【0015】
【課題を解決するための手段】請求項1の発明は、電気
通信回線を通じて、ハイパーテキスト方式によってサー
バから提供される複数の表示単位から構成される集合情
報から、利用者が必要とする情報を検索する方法であっ
て、前記利用者が前記必要とする情報に関して発声した
音声の内容を認識する音声認識ステップと、前記音声認
識ステップにおいて認識した認識結果を所定の条件に基
づいて分類する認識結果分類ステップと、前記認識結果
分類ステップにより分類した1つ以上の認識結果を利用
して、前記集合情報から、前記必要とする情報を検索す
るためのアクセス命令を作成するアクセス命令作成ステ
ップと、前記アクセス命令作成ステップにおいて作成し
たアクセス命令を、前記電気通信回線を通じて前記サー
バへ送信する送信ステップと、前記検索した情報を、前
記電気通信回線を通じて前記サーバから受信する受信ス
テップと、前記受信ステップにおいて受信した情報の一
部または全体を出力する出力ステップと、を有すること
を特徴とする情報検索方法である。
【0016】請求項2の発明は、前記受信ステップにお
いて受信した情報から、前記認識結果に関連する情報を
選択する関連情報選択ステップを有することを特徴とす
る請求項1記載の情報検索方法である。
【0017】請求項3の発明は、前記アクセス命令作成
ステップは、前記認識結果分類ステップにより認識した
1つ以上の認識結果を利用して複数のアクセス命令を作
成することを特徴とする請求項1記載の情報検索方法で
ある。
【0018】請求項4の発明は、前記認識結果分類ステ
ップにより分類した認識結果を、その分類に対応させた
状態で前記利用者に表示する表示ステップを有すること
を特徴とする請求項1、2、3記載の情報検索方法であ
る。
【0019】請求項5の発明は、前記状況認識ステップ
で認識する利用者の状況を認識する状況認識ステップを
有し、前記アクセス命令作成ステップは、前記認識結果
分類ステップにより分類した前記1つ以上の音声に基づ
く認識結果と、前記状況認識ステップにおいて認識した
1つ以上の状況に基づく認識結果を利用して前記アクセ
ス命令を作成することを特徴とする請求項1記載の情報
検索方法である。
【0020】請求項6の発明は、前記利用者の状況以外
の他の状態を認識する認識入力ステップと、前記アクセ
ス命令作成ステップは、前記認識結果分類ステップによ
り分類した前記1つ以上の音声に基づく認識結果と、前
記認識入力ステップにおいて認識した他の状態に基づく
認識結果を利用して前記アクセス命令を作成することを
特徴とする請求項1に記載の情報検索方法である。
【0021】請求項7の発明は、電気通信回線を通じ
て、ハイパーテキスト方式によってサーバから提供され
る複数の表示単位から構成される集合情報から、利用者
が必要とする情報を検索する方法を実現するためのプロ
グラムを記録した記録媒体であって、前記利用者が前記
必要とする情報に関して発声した音声の内容を認識する
音声認識機能と、前記音声認識機能において認識した認
識結果を所定の条件に基づいて分類する認識結果分類機
能と、前記認識結果分類機能により分類した1つ以上の
認識結果を利用して、前記集合情報から、前記必要とす
る情報を検索するためのアクセス命令を作成するアクセ
ス命令作成機能と、前記アクセス命令作成機能において
作成したアクセス命令を、前記電気通信回線を通じて前
記サーバへ送信する送信機能と、前記検索した情報を、
前記電気通信回線を通じて前記サーバから受信する受信
機能と、前記受信機能において受信した情報の一部また
は全体を出力する出力機能と、を実現するプログラムを
記録したことを特徴とする情報検索方法の記録媒体であ
る。
【0022】請求項8の発明は、電気通信回線を通じ
て、ハイパーテキスト方式によってサーバから提供され
る複数の表示単位から構成される集合情報から、利用者
が必要とする情報を検索する装置であって、前記利用者
が前記必要とする情報に関して発声した音声の内容を認
識する音声認識手段と、前記音声認識手段において認識
した認識結果を所定の条件に基づいて分類する認識結果
分類手段と、前記認識結果分類手段により分類した1つ
以上の認識結果を利用して、前記集合情報から、前記必
要とする情報を検索するためのアクセス命令を作成する
アクセス命令作成手段と、前記アクセス命令作成手段に
おいて作成したアクセス命令を、前記電気通信回線を通
じて前記サーバへ送信する送信手段と、前記検索した情
報を、前記電気通信回線を通じて前記サーバから受信す
る受信手段と、前記受信手段において受信した情報の一
部または全体を出力する出力手段と、を有することを特
徴とする情報検索装置である。
【0023】請求項1,2,3,4,7,8に係る発明
によれば、利用者は複数のキーワードの発話、あるいは
文章を発話するだけで、ハイパーテキスト方式によって
サーバから提供される複数の表示単位から構成される集
合情報から、利用者が必要とする情報を検索する場合
に,大幅に手間とアクセスまでの遅延時間を減少させる
ことが可能となる。
【0024】また、利用者の望む情報のみ表示すること
で、スクロールなどの手間を省くことが可能となり、小
型の情報処理装置での利便性が良くなる。
【0025】さらに、利用者主導での入力方式を提供す
ることにより利便性を向上しつつ、入力時の手間を削減
している。
【0026】請求項5,6に係る発明によれば、音声以
外の認識手段と組み合わせることで、入力の手間の削減
や音声入力ができない場合でも所望の情報にアクセス可
能となる。
【0027】
【発明の実施の形態】以下、本発明の実施形態を図面に
基づいて説明する。
【0028】第1の実施例 本発明の第1の実施例を、図1から図8を用いて説明す
る。
【0029】図1は、情報処理装置の構成を示すブロッ
ク図の一例であり、演算手段1、表示手段2、記憶手段
3、通信手段6、キーボード4、指示手段5、音声入力
手段7から構成される情報処理装置上で動作するプログ
ラムとして実現する。
【0030】また、CD−ROMやFDなどの記録媒
体、あるいは通信手段6を通じてこの情報処理装置に読
み込まれるものとする。
【0031】記憶手段3、一時的なデータの保持に使用
されるメモリと呼ばれるRAM、永久に保存するための
ハードディスクなどの装置を用いる。RAMには本プロ
グラムや認識用辞書データやリンク管理テーブルなどの
作業用の変数が格納され、ハードディスクは、受信した
HTML文章のキャッシュ、音声認識用の音素データ、
読みデータ辞書などを記録する。
【0032】表示手段2は、表示内容を一時的に記憶す
るビデオメモリ、DA変換部、CRTや液晶表示装置な
どで構成する。
【0033】通信手段6は、ケーブルを使用する有線L
AN、RS232C、セントロニクス、SCSI,US
B,IEEE1394など、あるいはケーブルを使用し
ない、無線LAN、赤外線通信、PHSデータ通信など
で実現する。
【0034】指示手段5は、マウス、トラックボール、
アキュポイント、ペン入力などで実現する。
【0035】音声入力手段7は、マイクや外部アンプと
接続し、入力された音声信号を、AD変換を通じてディ
ジタル信号に変換する。入力されたデータはメモリに格
納する。
【0036】演算手段1は、CPUとも呼ばれ上記の各
手段とバス9を通じて接続されデータの送受信を行う。
【0037】HTML文章を解析し画面に表示を行う処
理は、コンポーネント化されたブラウザモジュールを使
用することにより可能である。例えばマイクロソフト社
のブラウザは容易に他のプログラムからその機能を利用
できる。
【0038】(状況の説明)本実施例が有効に機能する
状況を説明するため、タスクを駅施設の検索と仮定す
る。
【0039】このような情報を提供するWebページと
しては、「駅前探検クラブ(商標、以下同様)」、ht
tp://ekimae.toshiba.co.jp
/などが存在する(平成11年8月17日現在)。利用
者は、このWebページを通じて、利用者が東京駅のタ
クシー乗り場に関する情報を音声指示で取得することと
設定する。
【0040】(従来のアクセス方式)最初に従来方式で
のアクセスを説明する。
【0041】利用者は、駅前探検クラブへのポインター
をブラウザに記録しておき、ホームページやポータルと
呼ばれる起点となるWebページにアクセスする。
【0042】次に利用者はタスクを指定して、2番目に
路線名を指定、さらに駅名を指定、最後に施設を指定す
るというように順番に検索用キーを指定することで、最
終的に所望のWebページにたどりつく。
【0043】前記Webページのサーバは、駅施設に関
するデータベースを所持しており、CGI(Commo
n Gateway Interface)と呼ばれる
技術を用いて、利用者からの問い合わせに対し、データ
ベースを検索し、問い合わせ毎に返答用のWebページ
を作成し、クライアントであるブラウザにHTML文章
を送信する。
【0044】図2は、東京駅のタクシー乗り場を検索す
るため識別子の例であり、図3に示す11から14の4
つの要素で構成される。
【0045】11は、URLと呼ばれる特定のWebペ
ージを示すものである。
【0046】12から14は、CGI用のパラメータで
ある。
【0047】12は、路線を示すコードである。
【0048】13は、駅を示すコードである。
【0049】14は、施設を示すコードである。
【0050】サーバ上のデータベースアクセスプログラ
ムは、これらを検索用のキーとしてデータベースを検索
する。
【0051】上記のサーバへのアクセスの例では、利用
者がWebページを順番にアクセスする毎にCGI用の
コードが付与され、サーバは全てのコードが取得できた
場合に、データベースの検索を行う。このときサーバは
受信したコードの妥当性を検査し、正しければ各々のコ
ードをキーにデータベースを検索し、その結果をクライ
アントに送信する。
【0052】この従来例では、URLにデータベース検
索用のパラメータ付加してを送信しているが、他のパラ
メータ送信方法(例えば、異なるプロトコルを使用す
る)でも同等の効果を有する。
【0053】(本実施例のアクセス方式)図4は、本実
施例に係るフローチャートの一例である。
【0054】本プログラムは、図1の情報処理装置上で
動作する。
【0055】1.ステップ101プログラムは、音声入
力手段7からの定期的割り込みにより、一定量の音声デ
ータを音声入力手段7から読み出し、メモリに記憶す
る。
【0056】2.ステップ102そのメモリに記憶され
たデータを用いて入力された音声データの類似度を計算
する。
【0057】類似度計算は、予め決められた条件を満た
した入力データを音声データとみなし、そのデータにフ
ーリエ変換を行い、周波数信号に変換し、特徴データを
作成する。
【0058】また、辞書に登録した単語と音素モデルか
ら各単語の音素モデルを作成し、入力データの特徴デー
タと複数からなる認識単語データの特徴データとの距離
計算を行い、各単語についてのスコアーを求める。
【0059】計算結果が予め決められた閾値を超える場
合には、最良のスコアが得られた単語を認識結果して出
力する。
【0060】閾値に達しない場合には、エラーを出力す
る。認識結果がエラーの場合には、ステップ101に戻
って音声入力待ちの状態となる。
【0061】認識辞書に登録する内容は、全ての路線
名、全ての駅名、全ての施設名の読みデータである。
【0062】また、各読みデータに対して属性情報を付
与したテーブルを作成し、予め記憶手段3に格納してお
く。
【0063】図5はテーブルへの登録方法である。
【0064】読みデータに対して、表示用データ、種
別、コードの並びになっている。同時にシステム制御用
の単語も登録する。例では、検索開始のトリガーとなる
単語を示す。同様の属性データと関連付けたテーブルを
作成する。テーブルは、左から順に、読みデータ、表示
データ、種別である。
【0065】3.ステップ103 ステップ102で認識が成功したならば、認識結果の単
語、例えば「とうきょう」をキーとし、上述したテーブ
ルを検索する。「とうきょう」のキーからは、表示用の
データ「東京」、入力されたデータの種類「駅」、デー
タベース検索用のコード「0000100」が得られ
る。
【0066】4.ステップ104 得られたデータは、一旦メモリに記録する。
【0067】タスクによっては、検索用のコードは固定
なものだけでなく、日時など動的に変化するものがあ
る。
【0068】例えば、利用者が「明日」と発話したら、
認識エンジンからは「あす」という情報が得られる。こ
のような場合は、当日(仮に99年7月14日と仮定す
る)の情報を利用して、検索用コード990715を作
成するステップを準備する。この場合、上記のテーブル
は、データの種類に演算を、検索用のコードには日付計
算用の演算識別子を入れておく。演算手段1には、検索
用のコードと表示用のデータを作成するサブルーチンを
準備しておく。
【0069】5.ステップ105 次に、プログラムは入力が終了したかどうか、判定す
る。判定方法は、データベースへのアクセス用に必要な
コードが全てそろったか検査する。
【0070】上記の例では、路線コード、駅コード、施
設コードの3つが入力されたか確認する。
【0071】この場合、誤認識の可能性もありうるので
一定期間入力を待ち、その期間内に更なる入力が行われ
ない場合は、これまで入力されたデータを確定したもの
と判断する。
【0072】あるいは認識エンジン辞書にプログラム制
御用のデータを登録しておき、入力された単語が制御命
令を示す単語と一致したら検索開始する方法でも同様の
効果が得られる。
【0073】あるいは、ボタンなどの指示手段5からの
入力をトリガーに用いる方法もある。
【0074】6.ステップ106 アクセス命令作成ステップは、準備してあるテンプレー
トに、確定したコードを挿入しWeb上のサーバへのア
クセス用データを作成する。
【0075】例えば、駅施設情報アクセス用には図6の
ようなURLをテンプレートとして準備しておく。
【0076】前ステップで確定したコードをその種別に
従い、前記テンプレートの前記当する部分、例えば駅を
示すコードであれば「ekiCode=」のあとに確定
したコード「0000100」を挿入する。テンプレー
トはタスクに応じて予め記憶手段3に記録しておき、タ
スクが決定した時点で記憶手段3から取得する。
【0077】タスクの設定は、予め利用者が明示的に指
示する。
【0078】あるいは、入力されたキーワードの種類デ
ータを利用し、自動的に決定する方法も考えられる。
【0079】例えば、路線名、駅名、施設名が入力され
たら駅施設検索であることが決まるように、各々関連付
けたテーブルを記憶手段3に予め準備することで実現で
きる。
【0080】7.ステップ107 アクセス送信命令ステップは、前ステップで作成したU
RLを用いて、通信手段6を通じて情報取得要求を送信
する。
【0081】8.ステップ108 HTML文書受信ステップは、サーバから送られてきた
HTML文書を一旦情報処理装置のメモリやキャッシュ
に保存する。
【0082】9.ステップ109 画面表示ステップは、受信した文書をTAG情報に基づ
き解析し、表示用データを作成し、表示手段2を通じて
利用者に表示する。
【0083】ステップ107からステップ109は、ブ
ラウザと呼ばれるモジュールを利用することにより容易
に実現できる。
【0084】さらに、画面表示(ステップ109)の後
で、利用者は他の施設に関して再度アクセスする場合が
ある。
【0085】ここでは仮に「バス乗り場」と仮定する。
利用者の施設名の発話により、ステップ101からステ
ップ104を通じて、表示用データ、データの種類、検
索用コードがメモリに記憶される。入力終了判定ステッ
プ(ステップ106)では、前回入力された路線デー
タ、駅データと新たに入力された施設データから入力終
了と判定する。
【0086】以上要約すると、複数の音声認識結果から
得られたアクセス用のコードデータと、テンプレートと
を用いてサーバのアクセス命令を作成し、直接目的のW
ebページにアクセスすることで、サーバへのアクセス
回数も1回だけとなる。この結果、目的のWebページ
に至る経路情報を知らなくても所望の情報を入手するこ
とができる。また従来、複数回のアクセスが必要であっ
たが、その回数を1度に低減でき情報所得時の通信遅延
時間を短くすることができる。
【0087】以上説明したように、本実施例により、利
用者は必要な情報を取得する場合には、必要なキーワー
ドを発話するだけでという容易な方法で、かつ入手まで
の遅延時間の少ない音声制御によるWebサーバへのイ
ンタフェースが実現できる。
【0088】(他のアクセス形式)上記の説明では、キ
ーワードを複数回発話する方式を説明したが、音声認技
術の他の方式であるワードスポット方式でも実現でき
る。
【0089】すなわち、利用者の自由発話から検索に関
連する1つ以上のキーワードを抽出し、それらを用いて
前述のステップを実行することとなる。
【0090】このワードスポット方式では、ラティス解
析に計算機資源が必要となるが、反面利用者は会話に近
い形で質問を入力できる利点がある。
【0091】この方法を図7に示すフローチャートを用
いて説明する。上記アクセス方式と重複する部分を除
き、異なるステップのみ説明する。
【0092】1.ステップ111 利用者からの音声が入力される。
【0093】図8は、その利用者から入力された文章を
示すものである。
【0094】2.ステップ112 認識エンジンは、単語辞書に登録された各データの類似
度を計算し、閾値以上の単語に関して、認識結果とスコ
アーや発話時刻情報を属性として出力する。通常このよ
うな単語の集まりをキーワードラティスと呼ぶ。
【0095】3.ステップ113 ワードスポット方式は、けん切りと呼ばれる単語と単語
の切れ目をうまく検出できない場合があり、ラティスの
中には不要な単語が多く含まれている。
【0096】それゆえ、ラティス解析ステップ(ステッ
プ113)では、予め登録された文法的制約、各候補の
スコアー、発話時刻情報を元に利用者の発話を推定す
る。
【0097】4.ステップ114 推定結果が決められた条件を満たしている場合は、推定
した文の中に含まれるキーワードを取得する(ステップ
114)。
【0098】基準に達しない場合は、その旨を利用者に
通知し、再度利用者からの入力を待つ(ステップ11
1)。
【0099】以下のステップ115から118は、前述
したステップ106から109と同じ処理を行うことに
より、自然言語を用いてインターネット上のサーバから
必要な情報が取得できる。
【0100】(変更例1)他の実施例として音声合成を
出力手段に用いることも可能である。
【0101】この場合、表示手段3は必ずしも必要では
なく、与えられた文字データを音声データに変換する音
声合成エンジンモジュールが必要となる。音声合成エン
ジンは、プログラムや、DSPを使用して実現可能であ
る。音声認識及び音声合成を用いるインタフェースは、
ハンズフリーで使用でき、両手がふさがっている状況で
も必要な情報を得ることが可能となる。
【0102】(変更例2)本実施例には、駅施設情報の
アクセスを例にしたが、駅施設に限定されるものではな
く、旅行情報、株価、本、パソコンのパーツ、料理レシ
ピ、医療情報、テレビ番組、ニュース、地図、中古車、
不動産、オークションなど他の多くの分野にも容易に適
用可能である。
【0103】(変更例3)検索エンジンと呼ばれるWe
bページにアクセスすることも考えられる。
【0104】一例としては、入力されたキーワードとA
NDの論理演算を組み合わせて検索式を作り、検索サー
ビスを提供するWebページにアクセスし、検索結果を
取得して提示する。
【0105】あるいは、ラティス解析を行うことによ
り、AND,OR,NOTなどの論理式を組み合わせて
検索することも可能である。
【0106】(変更例4)本実施例では、音声認識手段
を自装置に有する方式を説明したが、音声認識手段をサ
ーバクライアント方式で構成する方法も可能である。
【0107】この場合、自装置の通信手段6を通じてサ
ーバである他の情報処理装置とコネクションを確立し、
入力された音声信号をデジタル化したデータそのもの、
あるいは特徴データに変換した後のデータをサーバに送
信し、認識結果を受信することにより実現する。
【0108】以上のように、変更したい条件のみ発話す
ることで、前記情報を提供するWebページに一度でア
クセスが可能となり、従来の方法と比較して大幅に手順
や時間の短縮が実現できる。
【0109】第2の実施例 本発明の第2の実施例を図9から図11を用いて説明す
る。
【0110】第1の実施例と異なる点のみ説明するもの
とする。
【0111】また、本実施例の効果を示せるように第1
の実施例と同様の状況を想定するが、本説明では、サー
バから送信された情報(ステップ128)に複数の情報
が含まれている場合を仮定する。
【0112】例えば、「タクシー乗り場」のほかに「バ
ス乗り場」が含まれているものとする。
【0113】他の施設に関する情報も含んでいても、本
実施例の説明には影響しないので、ここでは施設の数を
2つとする。
【0114】ステップ121から128は、第1の実施
例のステップ101から108と同様である。
【0115】1.ステップ129 関連情報選択ステップでは、受信した文章を、TAGを
元に解析し、利用者に必要な情報のみ選択する。
【0116】図10は選択した文字情報の例を示す。
【0117】入力データの分類ステップ(ステップ12
3)で得られた、施設を示す情報である「タクシー乗り
場」をキーにして、図10に示す文字情報から、関連す
る情報のみを選択する。
【0118】2.ステップ130 画面表示ステップでは、選択したデータを元に図11に
示す表示用文字データを作成し、表示手段3に出力す
る。
【0119】本例では「京浜東北」線を利用者は指示し
ているが、そのまま解釈すると前記当件数が0件となっ
てしまう。そのような応答は、利用者の立場で考えると
不便なものである。ゆえに前記当するものがない場合、
次候補を提示する様にプログラムを作成しておく。もち
ろん選択したデータに、京浜東北線に係る情報がある場
合は、施設同様に(ステップ123)で取得した表示デ
ータ「京浜東北」を手がかりに、前記当するデータのみ
選択すれば良い。
【0120】以上説明した方法により、利用者の望む情
報のみ表示することで、スクロークなどの手間を省くこ
とが可能となり、小型の情報処理装置、例えば、時計、
携帯電話、カードなどでの利用が可能となる。
【0121】第3の実施例 本発明の第3の実施例を図12のフローチャートを用い
て説明する。
【0122】第1の実施例と異なる点のみ説明するもの
とする。
【0123】また、本実施例の効果を示せるように第1
の実施例と同様の状況を想定するが、本実施例では、必
要な情報に複数回のアクセスが必要なものと仮定する。
【0124】つまり、Webページの中に選択肢がアン
カーとして提示されており、アンカーを順番に選択して
いくことにより、必要なWebページにアクセスできる
ものと仮定する。ここではサービスの例として、路線
名、駅名、施設名を順番に選択して、次々にWebペー
ジを更新するサーバを対象とする。
【0125】1.ステップ131から135 ステップ131からステップ135を通じて、検索に必
要なキーワードはメモリに記録されているものとする。
第3の実施例では図5に示すコードデータは使用せず、
認識結果をもとに、表示データと種別データを対にして
一時的にメモリに記録しておく。
【0126】2.ステップ136 また、指示手段5や音声入力手段7を通じてタスクは、
すでに指定されているものとする。タスクに対応したW
ebページのURLは、予めタスクと対応させて記憶手
段3に記憶させておき、それを検索することにより取得
する。
【0127】3.ステップ137 取得したURLを用いてWebページアクセス命令を送
信する。
【0128】4.ステップ138 次に通信手段6を通じてHTML文章を受信する。
【0129】5.ステップ139 HTML文章が、目的の文章かどうか判定する。
【0130】終了判定は、予め検索に必要なキーワード
をスタックに格納しておき、キーワードを用いてアクセ
ス命令を作成する毎に、スタックから前記キーワードを
削除していき、残りのキーワードを計数することで実現
できる。
【0131】6.ステップ140 受信終了でない場合は、HTML文章解析ステップに進
み、受信したHTML文章を、TAGを手がかりにアン
カーとリンク先識別子(URL)に分類し、その対応表
を作成する。最初の路線名を選択するWebページの場
合は、路線名を示すアンカーと路線に対応した駅を選択
するWebページのURLが対になったデータが作成さ
れる。
【0132】7.ステップ136から140の繰り返し 次にスタックを検査し、種別が路線である情報、この例
では「京浜東北」を取得し、ステップ140で作成した
アンカーとリンク先識別子テーブルを検索し、京浜東北
線の駅を指定するWebページへのURLを取得できる
(ステップ136)。
【0133】以下同様にスタックのキーワードがなくな
るまでステップ136からステップ140を繰り返すこ
とで所望の情報を含むWebページにアクセスできる。
前記ページ取得後は、TAGを解析して画面データを作
成し表示手段に出力する(ステップ141)。
【0134】以上説明した方法により、所望のWebペ
ージへ順番にアクセスする必要がある場合でも。最初に
利用者がキーワードを音声で入力することで容易に所望
の情報を取得することが可能である。
【0135】もちろんラティス解析や音声合成や関連情
報選択ステップとの併用により、第1の実施例や第2の
実施例で述べた効果を得ることが可能となる。
【0136】第4の実施例 本発明の第4の実施例を、図13と図14を用いて説明
する。
【0137】第1、2,3の実施例と異なる点のみ説明
するものとする。また、本実施例の効果を示せるように
第1の実施例と同様の状況を想定する。
【0138】図14は表示方法の一例である。
【0139】図14の左側に示す表示領域20は、入力
されたデータの種別を示す。この例では、上から順に、
タスクの種類、路線名、駅名、施設名を示している。ス
ロット21はデータ入力領域である。
【0140】なお、右側最上部はタスク名を示してお
り、利用者が入力すべき情報でないため、他のスロット
と異なる方式で表示している。
【0141】1.ステップ151から156 ステップ151からステップ156は、入力された音声
データと関連する情報をメモリに記憶する。
【0142】ここで、結果分類ステップ(ステップ15
3)は、認識結果に基づき対応表を調べ、入力されたデ
ータを分類する。
【0143】結果表示ステップ(ステップ154)は、
分類結果に基づきその種別に対応したスロットに表示デ
ータを提示する。
【0144】これにより利用者は、入力に対するシステ
ムからのフィードバックを得ることが可能となり、認識
エンジンが認識エラーを起こした場合でも、再度発話す
ることにより、スロットのデータを更新することが可能
となる。
【0145】以下のステップ157から161は、第2
の実施例のステップ126から130と同様である。
【0146】以上により利用者は入力に対してフィード
バックが得られ、間違って認識された場合には、利用者
は再度発話することにより訂正することができるので、
スロットを指定する必要がなく利便性は向上する。
【0147】また、この方式では銀行のATMのように
システム主導ではなく、利用者が任意のスロットを選択
でき、利用者主導の対話が可能となる。
【0148】さらに、情報検索後に、メモリに記録され
ている前回の入力データをスロットに表示することによ
り、異なる条件で再度アクセスする場合に、利用者は変
更すべき条件を容易に確認することができる。
【0149】第5の実施例 本発明の第5の実施例を説明する。
【0150】第1の実施例から第4の実施例まで、キー
ワードの入力手段として、音声認識手段のみ使用してい
るが、本実施例は、状況認識手段や、他の認識手段の結
果をそのまま、あるいは、演算を施しキーワードを作成
する。
【0151】本実施例は、図1に示す情報処理装置に、
状況認識手段や1つ以上の認識用入力手段をバス9に付
加して実現する。
【0152】状況認識手段としては、GPS,バーコー
ドリーダー、無線TAG、赤外線通信、無線通信、有線
通信などが利用できる。
【0153】認識用入力手段としては、カメラ、磁気セ
ンサ、加速度センサ、圧力センサ、ペンタブレット、節
電位測定装置などが利用できる。認識用入力手段は、物
理的に計測可能な信号に、予め決められた演算を行い、
記憶手段3に記録されている辞書データと比較し、検索
用のコードデータや制御用命令に変換する。
【0154】GPSを利用し緯度経度情報を入手する。
【0155】このデータをそのまま、あるいはデータベ
ースをアクセスすることで地名や建造物、会社名に変換
することで、場所や対象物に関するキーワードを得るこ
とができる。これにより現在地や対象物に関する情報を
入力しなくてもよい。
【0156】また、博物館がWebサーバと同様のサー
バを有して、各展示物の情報を提供をする場合がある。
【0157】利用者が、目の前の展示物を指定する場
合、バーコードリーダを展示物のバーコードに近づけ、
バーコードの値を対象物の識別コードとして用いること
で、容易に対象物を特定することが可能となる。
【0158】あるいは赤外線送受信部を対象に向け、識
別用データを得る。無線の有効範囲に立ち入ると、コネ
クションを設定する方法なども利用できる。
【0159】このような動作にあわせ、利用者は、音声
認識手段で「製作年代」と発話することで、上記のコー
ドと製作年代を示すコードを合わせて、サーバにURL
を送信することで、利用者は容易に目の前の展示物の製
作年代に関しての情報をえることが可能となる。
【0160】さらに、利用者が、対象物の名前を知らな
い場合や、説明プレートの漢字が読めない場合などキー
ワードの発話ができないような状況でも、利用者は関連
情報を取得可能となる。
【0161】画像認識、ジェスチャ認識、手書き文字認
識、節電位認識などを併用することにより、どうしても
音声認識が成功しない場合でも、所望のキーワードを入
力することが可能となる。
【0162】以上説明したように、状況認識手段や、他
の認識手段との併用により、音声認識で明示的にキーワ
ードを入力しなくても、あるいは入力できないような状
況でも、検索用のキーワードが準備でき、それゆえ利用
者のキーワード入力に係る負荷をさらに低減したインタ
フェースの提供が可能となる。
【0163】
【発明の効果】本発明によれば、利用者は複数のキーワ
ードの発話、あるいは文章を発話するだけで、ハイパー
テキスト方式によってサーバから提供される複数の表示
単位から構成される集合情報から、利用者が必要とする
情報を検索する場合に,大幅に手間とアクセスまでの遅
延時間を減少させることが可能となる。
【0164】利用者の望む情報のみ表示することで、ス
クロールなどの手間を省くことが可能となり、小型の情
報処理装置での利便性が良くなる。
【0165】利用者主導での入力方式を提供することに
より利便性を向上しつつ、入力時の手間を削減してい
る。
【0166】音声以外の認識手段と組み合わせること
で、入力の手間の削減や音声入力ができない場合でも所
望の情報にアクセス可能となる。
【図面の簡単な説明】
【図1】本発明の第1の実施例を実現する情報処理装置
のブロック図である。
【図2】サーバアクセス用の識別子の図である。
【図3】識別子の詳細説明図である。
【図4】第1の実施例に係るフローチャートである。
【図5】認識結果と属性の対応を示す図である。
【図6】識別子作成用のテンプレートを示す図である。
【図7】第1の実施例の変更例に係るフローチャートで
ある。
【図8】自然対話の例文とワードスポットによるキーワ
ード認識を示す図である。
【図9】第2の実施例に係るフローチャートである。
【図10】サーバから取得した情報を示す図である。
【図11】応答文を示す図である。
【図12】第3の実施例に係るフローチャートである。
【図13】第4の実施例に係るフローチャートである。
【図14】キーワード入力用の画面を示す図である。
【符号の説明】
1……演算手段 2……表示手段 3……記憶手段 4……キーボード 5……指示手段 6……通信手段 7……音声入力手段 8……サーバ 9……バス 10…URL 11…サーバURL 12…路線コード 13…駅コード 14…施設コード 20…スロットの種別 21…スロットへの入力
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G10L 15/18 G10L 3/00 E 15/24 531W 537J 571Q Fターム(参考) 5B075 KK07 ND20 PP07 PP12 PP30 PQ02 PQ42 QP10 UU40 5B082 GA08 GC04 5D015 AA04 BB01 HH03 HH06 HH13 HH16 LL01 LL05 LL06 LL09 LL12 5D045 AA04 AB01 AB04 AB26

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】電気通信回線を通じて、ハイパーテキスト
    方式によってサーバから提供される複数の表示単位から
    構成される集合情報から、利用者が必要とする情報を検
    索する方法であって、 前記利用者が前記必要とする情報に関して発声した音声
    の内容を認識する音声認識ステップと、 前記音声認識ステップにおいて認識した認識結果を所定
    の条件に基づいて分類する認識結果分類ステップと、 前記認識結果分類ステップにより分類した1つ以上の認
    識結果を利用して、前記集合情報から、前記必要とする
    情報を検索するためのアクセス命令を作成するアクセス
    命令作成ステップと、 前記アクセス命令作成ステップにおいて作成したアクセ
    ス命令を、前記電気通信回線を通じて前記サーバへ送信
    する送信ステップと、 前記検索した情報を、前記電気通信回線を通じて前記サ
    ーバから受信する受信ステップと、 前記受信ステップにおいて受信した情報の一部または全
    体を出力する出力ステップと、 を有することを特徴とする情報検索方法。
  2. 【請求項2】前記受信ステップにおいて受信した情報か
    ら、前記認識結果に関連する情報を選択する関連情報選
    択ステップを有することを特徴とする請求項1記載の情
    報検索方法。
  3. 【請求項3】前記アクセス命令作成ステップは、 前記認識結果分類ステップにより認識した1つ以上の認
    識結果を利用して複数のアクセス命令を作成することを
    特徴とする請求項1記載の情報検索方法。
  4. 【請求項4】前記認識結果分類ステップにより分類した
    認識結果を、その分類に対応させた状態で前記利用者に
    表示する表示ステップを有することを特徴とする請求項
    1、2、3記載の情報検索方法。
  5. 【請求項5】前記利用者の状況を認識する状況認識ステ
    ップを有し、 前記アクセス命令作成ステップは、 前記認識結果分類ステップにより分類した前記1つ以上
    の音声に基づく認識結果と、前記状況認識ステップにお
    いて認識した1つ以上の状況に基づく認識結果を利用し
    て前記アクセス命令を作成することを特徴とする請求項
    1記載の情報検索方法。
  6. 【請求項6】前記状況認識ステップで認識する利用者の
    状況以外の他の状態を認識する認識入力ステップと、 前記アクセス命令作成ステップは、 前記認識結果分類ステップにより分類した前記1つ以上
    の音声に基づく認識結果と、前記認識入力ステップにお
    いて認識した他の状態に基づく認識結果を利用して前記
    アクセス命令を作成することを特徴とする請求項5に記
    載の情報検索方法。
  7. 【請求項7】電気通信回線を通じて、ハイパーテキスト
    方式によってサーバから提供される複数の表示単位から
    構成される集合情報から、利用者が必要とする情報を検
    索する方法を実現するためのプログラムを記録した記録
    媒体であって、 前記利用者が前記必要とする情報に関して発声した音声
    の内容を認識する音声認識機能と、 前記音声認識機能において認識した認識結果を所定の条
    件に基づいて分類する認識結果分類機能と、 前記認識結果分類機能により分類した1つ以上の認識結
    果を利用して、前記集合情報から、前記必要とする情報
    を検索するためのアクセス命令を作成するアクセス命令
    作成機能と、 前記アクセス命令作成機能において作成したアクセス命
    令を、前記電気通信回線を通じて前記サーバへ送信する
    送信機能と、 前記検索した情報を、前記電気通信回線を通じて前記サ
    ーバから受信する受信機能と、 前記受信機能において受信した情報の一部または全体を
    出力する出力機能と、 を実現するプログラムを記録したことを特徴とする情報
    検索方法の記録媒体。
  8. 【請求項8】電気通信回線を通じて、ハイパーテキスト
    方式によってサーバから提供される複数の表示単位から
    構成される集合情報から、利用者が必要とする情報を検
    索する装置であって、 前記利用者が前記必要とする情報に関して発声した音声
    の内容を認識する音声認識手段と、 前記音声認識手段において認識した認識結果を所定の条
    件に基づいて分類する認識結果分類手段と、 前記認識結果分類手段により分類した1つ以上の認識結
    果を利用して、前記集合情報から、前記必要とする情報
    を検索するためのアクセス命令を作成するアクセス命令
    作成手段と、 前記アクセス命令作成手段において作成したアクセス命
    令を、前記電気通信回線を通じて前記サーバへ送信する
    送信手段と、 前記検索した情報を、前記電気通信回線を通じて前記サ
    ーバから受信する受信手段と、 前記受信手段において受信した情報の一部または全体を
    出力する出力手段と、 を有することを特徴とする情報検索装置。
JP24553599A 1999-08-31 1999-08-31 情報検索方法及びそれを記録した記録媒体 Pending JP2001075968A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP24553599A JP2001075968A (ja) 1999-08-31 1999-08-31 情報検索方法及びそれを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP24553599A JP2001075968A (ja) 1999-08-31 1999-08-31 情報検索方法及びそれを記録した記録媒体

Publications (1)

Publication Number Publication Date
JP2001075968A true JP2001075968A (ja) 2001-03-23

Family

ID=17135150

Family Applications (1)

Application Number Title Priority Date Filing Date
JP24553599A Pending JP2001075968A (ja) 1999-08-31 1999-08-31 情報検索方法及びそれを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP2001075968A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005538583A (ja) * 2002-08-20 2005-12-15 テレノール アーアスアー 通信ネットワークを介しサービス、アプリケーション及び/またはコンテンツにアクセスするためのシステム及び方法
JP2005539427A (ja) * 2002-09-16 2005-12-22 フランス テレコム オーディオビジュアルコンテンツを記述するデータを取得する方法、そのためのシステム、ブロードキャストサーバ、記述サーバ、および受信端末
JP2006508448A (ja) * 2002-11-28 2006-03-09 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ワードクラス情報を割り当てる方法
JP2006072539A (ja) * 2004-08-31 2006-03-16 Xing Inc 情報提供方法、情報提供システム、提供装置及びコンピュータプログラム
US7272455B2 (en) 2002-09-20 2007-09-18 Kabushiki Kaisha Toshiba Remote controlling device, program and system with control command changing function
JP2008097082A (ja) * 2006-10-06 2008-04-24 Mitsubishi Electric Corp 音声対話装置
JP2010271769A (ja) * 2009-05-19 2010-12-02 Seiko Epson Corp 画像処理方法及び装置、並びに、そのためのコンピュータプログラム
US9928030B2 (en) 2014-03-28 2018-03-27 Panasonic Intellectual Property Management Co., Ltd. Speech retrieval device, speech retrieval method, and display device

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06274539A (ja) * 1993-03-18 1994-09-30 Fujitsu Ltd 質疑応答システム
JPH10260976A (ja) * 1997-03-18 1998-09-29 Ricoh Co Ltd 音声対話方法
JPH10283362A (ja) * 1997-04-02 1998-10-23 Casio Comput Co Ltd 携帯情報端末及び記憶媒体
JPH11110186A (ja) * 1997-10-02 1999-04-23 Nippon Telegr & Teleph Corp <Ntt> ブラウザシステム、音声プロキシサーバ、リンク項目の読み上げ方法及びリンク項目の読み上げプログラムを格納した記憶媒体

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06274539A (ja) * 1993-03-18 1994-09-30 Fujitsu Ltd 質疑応答システム
JPH10260976A (ja) * 1997-03-18 1998-09-29 Ricoh Co Ltd 音声対話方法
JPH10283362A (ja) * 1997-04-02 1998-10-23 Casio Comput Co Ltd 携帯情報端末及び記憶媒体
JPH11110186A (ja) * 1997-10-02 1999-04-23 Nippon Telegr & Teleph Corp <Ntt> ブラウザシステム、音声プロキシサーバ、リンク項目の読み上げ方法及びリンク項目の読み上げプログラムを格納した記憶媒体

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005538583A (ja) * 2002-08-20 2005-12-15 テレノール アーアスアー 通信ネットワークを介しサービス、アプリケーション及び/またはコンテンツにアクセスするためのシステム及び方法
JP2005539427A (ja) * 2002-09-16 2005-12-22 フランス テレコム オーディオビジュアルコンテンツを記述するデータを取得する方法、そのためのシステム、ブロードキャストサーバ、記述サーバ、および受信端末
US7272455B2 (en) 2002-09-20 2007-09-18 Kabushiki Kaisha Toshiba Remote controlling device, program and system with control command changing function
US9996675B2 (en) 2002-11-28 2018-06-12 Nuance Communications, Inc. Method to assign word class information
JP2006508448A (ja) * 2002-11-28 2006-03-09 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ワードクラス情報を割り当てる方法
US10923219B2 (en) 2002-11-28 2021-02-16 Nuance Communications, Inc. Method to assign word class information
US10515719B2 (en) 2002-11-28 2019-12-24 Nuance Communications, Inc. Method to assign world class information
US8032358B2 (en) 2002-11-28 2011-10-04 Nuance Communications Austria Gmbh Classifying text via topical analysis, for applications to speech recognition
US8612209B2 (en) 2002-11-28 2013-12-17 Nuance Communications, Inc. Classifying text via topical analysis, for applications to speech recognition
US8965753B2 (en) 2002-11-28 2015-02-24 Nuance Communications, Inc. Method to assign word class information
JP2006072539A (ja) * 2004-08-31 2006-03-16 Xing Inc 情報提供方法、情報提供システム、提供装置及びコンピュータプログラム
JP2008097082A (ja) * 2006-10-06 2008-04-24 Mitsubishi Electric Corp 音声対話装置
JP2010271769A (ja) * 2009-05-19 2010-12-02 Seiko Epson Corp 画像処理方法及び装置、並びに、そのためのコンピュータプログラム
US9928030B2 (en) 2014-03-28 2018-03-27 Panasonic Intellectual Property Management Co., Ltd. Speech retrieval device, speech retrieval method, and display device

Similar Documents

Publication Publication Date Title
US8380516B2 (en) Retrieval and presentation of network service results for mobile device using a multimodal browser
US6385586B1 (en) Speech recognition text-based language conversion and text-to-speech in a client-server configuration to enable language translation devices
US7548858B2 (en) System and method for selective audible rendering of data to a user based on user input
US9626959B2 (en) System and method of supporting adaptive misrecognition in conversational speech
US6188985B1 (en) Wireless voice-activated device for control of a processor-based host system
TWI353585B (en) Computer-implemented method,apparatus, and compute
US7593854B2 (en) Method and system for collecting user-interest information regarding a picture
GB2383247A (en) Multi-modal picture allowing verbal interaction between a user and the picture
CN101681365A (zh) 用于分布式语音搜索的方法和装置
MXPA04006532A (es) Uso combinado de un lenguaje de marca por pasos y una herramienta de desarrollo orientada por objetos.
US20050010422A1 (en) Speech processing apparatus and method
JP3862470B2 (ja) データ処理装置及び方法、ブラウザシステム、ブラウザ装置、記録媒体
JPH07222248A (ja) 携帯型情報端末における音声情報の利用方式
KR20100045337A (ko) 번역 결과가 합성된 만화 컨텐츠를 제공하고 이러한 만화 컨텐츠에 대한 정보를 키워드 검색에 노출시키기 위한 방법, 시스템 및 컴퓨터 판독 가능한 기록 매체
JP2002197118A (ja) 情報アクセス方法、情報アクセスシステムおよび記録媒体
JP2001075968A (ja) 情報検索方法及びそれを記録した記録媒体
JP3714159B2 (ja) ブラウザ搭載装置
Agarwal et al. Voice Browsing the Web for Information Access
US20020077814A1 (en) Voice recognition system method and apparatus
JP2002099294A (ja) 情報処理装置
WO2021161856A1 (ja) 情報処理装置及び情報処理方法
WO2002099786A1 (en) Method and device for multimodal interactive browsing
KR20050040983A (ko) 음성을 이용한 웹 브라우징 시스템 및 제어방법
JP2001092845A (ja) 文書取得方法及び記録媒体
JP6298806B2 (ja) 音声翻訳システム及びその制御方法、並びに音声翻訳プログラム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041221

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050217

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050315

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050428

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050719