JP2004515859A - インターネット・アクセス用分散型音声認識 - Google Patents

インターネット・アクセス用分散型音声認識 Download PDF

Info

Publication number
JP2004515859A
JP2004515859A JP2002548614A JP2002548614A JP2004515859A JP 2004515859 A JP2004515859 A JP 2004515859A JP 2002548614 A JP2002548614 A JP 2002548614A JP 2002548614 A JP2002548614 A JP 2002548614A JP 2004515859 A JP2004515859 A JP 2004515859A
Authority
JP
Japan
Prior art keywords
address
target
user
source
request
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002548614A
Other languages
English (en)
Inventor
ディー フリードマン,シオドア
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of JP2004515859A publication Critical patent/JP2004515859A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/2866Architectures; Arrangements
    • H04L67/30Profiles
    • H04L67/306User profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
    • H04M3/4938Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals comprising a voice browser which renders and interprets, e.g. VoiceXML
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/40Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

検索サーバは、情報源に対してユーザ・アドレスを提供し、該ユーザによる該情報源へのアクセスを可能にする。ユーザは、検索サーバにリクエストを送信し、該検索サーバは該リクエストに対応する情報源のアドレス(URL)を識別する。このリクエストは、口頭の要求でもよく、口頭の要求に対応するモデル・データでもよい。また、該検索サーバは、音声認識システムを含んでいてもよい。その後、該検索サーバは、そのユーザのアドレスを該リクエストに応答するための「返信先アドレス(reply−to address)」として用い、該リクエストを識別された情報源へ伝達する。このユーザ・アドレスは、該ユーザが最初のリクエストを送信するのに用いた装置のアドレスでもよく、該ユーザに関連する別の装置のアドレスでもよい。

Description

【0001】
本発明は、通信分野に係り、特に口頭の命令によるインターネット・アクセスを提供することに関する。
【0002】
音声認識システムは、話された言葉やフレーズをテキスト文字列に変換する。音声認識システムは、「ローカル」にあっても、「リモート」にあってもよく、及び/又は、「一体化」されていてもよく、「分散」されていてもよい。リモート・システムは、ユーザのローカル・サイトに構成要素を有すると共に、音声認識システムの大部分はリモート・サイトに設けることが多い。したがって、リモートという語と分散型という語は交換可能に用いられる場合が多い。同様に、オフィス環境におけるネットワークなどのローカル・ネットワークは、アプリケーション・サーバと、サーバをユーザ局に提供するファイル・サーバとを含み得る。このようなアプリケーション・サーバによって提供されるアプリケーションは、音声認識アプリケーションのように完全にアプリケーション・サーバ上に常駐するものであって、通常は「分散型」と考えられる。これを開示するために、「分散型」という語は最も広い概念として用いられ、口頭の命令からのテキスト文字列が備えられたアプリケーション内に統合されていないあらゆる音声認識システムを包含する。一般的に、このような分散型音声認識システムは、音声入力制御アプリケーションから話されたフレーズ又はそれをエンコードしたものを受信し、対応するテキスト文字列を適切なアプリケーション・プログラムへルーティングするために該制御アプリケーションに返す。
【0003】
図1は、従来の汎用音声認識システム100を示す。この音声認識システム100は、コントローラ110と、音声認識器120と、辞書125とを有する。コントローラ110は、音声モデラ112と、テキスト・プロセッサ114とを有する。ユーザがマイク101へ向かって話すと、音声認識モデラ112は入力された声をモデル・データへエンコードする。このモデル・データは、音声認識を実行するのに用いられる特定のスキームに基づく。このモデル・データは、例えば、各音素又は音素群に対するシンボルを含んでもよく、音声認識器120は、このシンボルと、該シンボルとテキストとの間のマッピングを提供する辞書125とに基づいて、語又はフレーズを認識するように構成される。
【0004】
テキスト・プロセッサ114は、音声認識器120からのテキストを処理し、該テキストへの応答として適切なアクションを決定する。例えば、テキストが「Go To Word(ワードへ行け)」であれば、コントローラ110は特定のワード・プロセッサ・アプリケーション140を起動させるのに適したコマンドをシステムに提供する。その後、「Begin Dictation(口述筆記を始めろ)」というテキスト文字列が、「End Dictation(口述筆記を止めろ)」というテキスト文字列が音声認識器120から受信されるまで、コントローラに、すべての後続テキスト文字列を処理せずにアプリケーション140へ渡すようにさせてもよい。
【0005】
音声認識器120は、テキストを音声に関連付ける様々な技術のいずれを用いてもよい。語彙が少ないシステムにおいては、例えば、認識器120は、単に、モデル・データが音声モデラからのモデル・データと最もよく一致するテキストを選択するだけでもよい。語彙の多いシステムにおいては、認識器120は、音声モデラからのモデル・データとかなり一致する実行可能な代替案の中から選択するのに、文法に基づいた規則などの補助情報を用いてもよい。音声をテキストへ変換する技術は、本分野ではよく知られている。音声認識器から提供されるテキストは、話されたフレーズの直接翻訳である必要はないことに注意。例えば、話されたフレーズ「Joeへ電話」は、辞書125から「1−914−555−4321」というテキスト文字列をもたらしてもよい。分散型音声認識システムにおいて、音声認識器120及び辞書125の一部又は全部は、音声モデラ112及びテキスト・プロセッサ114とは別のアプリケーションであってもよい。例えば、ユーザの音声を認識器120へ伝達するのに必要な帯域幅を最小化するために、音声認識器120及び辞書125は、リモート・インターネット・サイトに配置され、音声モデラ112はローカル・サイトに配置されてもよい。
【0006】
ここに参考文献として組み込まれる、Ichiro Hatanoにより1999年8月25日に出願された欧州特許出願EP0982672A2「INFORMATION RETRIEVAL SYSTEM WITH A SEARCH ASSIST SERVER」は、インターネット・サイトなどの複数の情報サーバのそれぞれにアクセスするための識別子のリストを備えた情報取得システムについて開示している。この各情報サーバに関連付けられた識別子リストは、「発音」識別子などのサーバを識別するための様々な手段を含む。ユーザの話したフレーズが特定の情報サーバの発音識別子に対応する場合、該情報サーバの場所(例えば、URL(Universal Resource Locater))が取得される。このURLは、次いで、このURLに位置する情報サーバから情報を取り出すアプリケーションへ提供される。Spridge,Inc.から出ているmySpeechアプリケーションなどの市販のアプリケーションは、インターネット利用可能電話機を通じたモバイル・ウェブ・アクセスを目標とした同様の能力を提供する。
【0007】
図2は、特にインターネット・ウェブ・サイトへのアクセスを容易にするように構成された特殊目的音声処理システムの実施形態の一例を示す。URL検索サーバ220は、インターネット250を通じて、ユーザ局230から入力を受信する。このユーザ局230からの入力は、マイク201からの入力に対応するモデル・データと、検索サーバ220が該ユーザ入力の処理の結果を方向付けるのに用いる「返信先(reply−to)」アドレスと、を含む。このアプリケーションにおいて、ユーザ入力の処理の結果は、「見つかりませんでした(not−found)」というメッセージか、或いは、ユーザ入力に対応するサイトのURLを含むメッセージのいずれかである。ユーザ局230は、提供されたURLを用いて、情報源210と、情報源210がユーザにメッセージを返信するのに用いる前述の「返信先」アドレスとへメッセージを送る。通常、この情報源210からのメッセージは、ウェブ・ページである。ユーザ局230が携帯装置の場合、通常、WAP(Wireless Access Protocol)が用いられることに注意。情報源210からのWAPメッセージは、WML(Wireless Markup Language)を用いてエンコードされた「deck」からの「カード」群である。
【0008】
本発明の目的は、音声認識システムを通じたインターネット・アクセスの効率を向上させることである。本発明の別の目的は、携帯装置を通じたインターネット・アクセスの効率を向上させることである。本発明の別の目的は、インターネット・アクセスの応答時間を向上させることである。
【0009】
上記及び他の目的は、ユーザが情報源にアクセスできるように、ユーザ・アドレスを該情報源へ提供する検索サーバを提供することによって実現される。ユーザは、検索サーバへリクエストを送り、検索サーバは該リクエストに対応する情報源のアドレス(URL)を識別する。リクエストは、口頭によるリクエストでもよく、口頭によるリクエストに対応したモデル・データでもよい。検索サーバは、音声認識システムを含んでもよい。その後、検索サーバは、リクエストを、ユーザ・アドレスをこのリクエストに応答するための「返信先アドレス(reply−to address)」として用いて、識別された情報源へ伝達する。このユーザ・アドレスは、ユーザが最初のリクエストを伝達するのに用いた装置のアドレスでもよく、ユーザに関係ある別の装置のアドレスでもよい。
【0010】
本発明を、添付図面を参照して、例示的に、より詳細に説明する。図面を通じて、同じ参照番号は同様の又は対応する特徴又は機能を示す。
【0011】
図3A及び3Bは、本発明に係る検索システム300、300’の一例のブロック図を示す。理解を容易にするために、送信器、受信器、モデムなどのシステム300、300’の各構成要素間での通信を実行する従来の手段は図示していない。しかし、それらは当業者には明らかである。
【0012】
図3Aの例において、ユーザは、ユーザ局330からURL検索サーバ320へリクエストを送る。検索サーバ320は、このユーザ・リクエストに対応した単一のURLを決定するように構成される。したがって、これは、ユーザが特定の所定のウェブ・サイトへアクセスするためのリクエストとして、「Get Stock Prices(株価の取得)」などのキーワード又はフレーズを用いる音声認識システムにおいて用いられるのに特によく適する。話されたフレーズは、マイク201を通じて、ユーザ局330へ入力される。ユーザ局330は、携帯電話でもよく、パームトップ機器でもよく、ポータブル・コンピュータでもよく、セットトップ・ボックスでもよく、インターネット250などの広域ネットワークへのアクセスを提供することが可能なあらゆる他の装置であってもよい。ネットワーク250へのアクセスは、(図示しない)1又は複数のゲートウェイを通じて行われ得る。
【0013】
音声認識実施形態において、ユーザ局は、話されたリクエストをサーバ320へ伝達するのにより少ない帯域幅で済むように、話されたフレーズをモデル・データへエンコードすることが好ましい。サーバ320は、音声認識器120と、必要に応じて該モデル・データをURLロケータ322が用いる形式へ変換する辞書125と、を有する。例えば、前述のmySpeechアプリケーションにおいて、ユーザは、例えば、
「Get Stock Prices」,http://www.stocksonline/userpage3/
などのテキスト文字列と対応するURLとを入力することによって、ユーザが将来アクセスすることが予想される情報源210それぞれについてアプリケーション・データベース325をセットアップする。前述の欧州特許出願EP0982672A2において、データベースは、各URLに対応するフレーズの音声学のテキスト・エンコーディングを含む。
【0014】
この発明は音声認識によく適するが、音声認識器120が検索サーバ320に配置された分散型音声認識についても、ユーザ局がリクエストをURL場所122へ直接提供し得ることに注意。このリクエストは、例えば、ユーザによって入力されたテキスト文字列でもよく、ユーザ局330の音声認識器の出力でもよい。
【0015】
例えば従来通りのTCP/IPリクエストなどのユーザからのリクエストは、該リクエストの発信元330のアドレス、及び/又は、明示的な「返信先(reply−to)」アドレスを有する。従来の検索サーバは、このアドレスを用いて、識別された情報源URLをユーザ局330へ返信する。
【0016】
本発明によれば、検索サーバ320は、リクエストを直接識別された情報源210へ伝達する。このリクエストは、ユーザ局330のアドレスを、該リクエストの発信元として、及び/又は、明示的な「返信先(reply−to)」アドレスとして、識別する。このように、情報源210がリクエストに応答するとき、返答はユーザ局330へ直接送られる。必要に応じてそれ以降情報源210へ直接アクセスするために、配置されたURLもユーザ局330へ送られてもよい。
【0017】
サーバ320から送られる特定のリクエストは、ウェブ・サイトへアクセスするための固定的リクエストであってもよく、或いは、好ましい実施形態においては、データベース325に含まれ得る各フレーズに対応したリクエスト形式であってもよい。例えば、リクエストには、そのURLのウェブ・ページをダウンロードする従来通りのリクエストもあれば、例えば、オプションの選択や、検索リクエストなどを通じて該ウェブ・サイト内の情報にアクセスするサブコマンドもある。URLに対応したフレーズに加えて、好ましい実施形態におけるデータベース325は、は、記録されたフレーズに関連する他の情報も許容するように構成される。例えば、数、文字などのいくつかのフレーズ、又は、「次」、「戻る」、「ホーム」などの特定のキーワードを、データベース325及びサーバ320に定義し、対応するコマンド又は文字列が最後に参照したURLの情報源210へ直接伝達されるようにしてもよい。
【0018】
図3Bは、本発明の代替的実施形態を示す。ここでは、ユーザに関連する2以上の局330a、330bが存在する。例えば、ユーザ局330a及びマイク210は携帯電話であり、ユーザ局330bはカーナビゲーション・システムであってもよい。好ましい実施形態において、ユーザ局330aは、他方のユーザ局330bのアドレスを、ユーザ・リクエストの発信元、又は明示的な「返信先(reply−to)」アドレスとして提供する。参照を容易にするために、「発信元アドレス」という語は、以下、明示/黙示の返信先アドレスを含むものとして用いられる。URLサーバ320は、この第二のユーザ局330bの発信元アドレスを、配置された情報源210へのリクエストの発信元アドレスとして用いる。この実施形態は、特に、音声入力用に構成されていない装置330b、及び/又は、ダウンロードされたウェブ・ページ又はWAP decksを受信するように構成されていない装置330aによく適している。例えば、ユーザは、データベース325における「Show Downtown(ダウンタウンを示せ)」という文字列を特定の地図の対応するURLアドレスでエンコードしてもよい。ユーザは、局330aがURL検索サーバ320への後続のリクエストに局330bのアドレスを含ませるように、局330aを構成する。ユーザが「Show Downtown」というフレーズを話すと、局330aはこのフレーズに対応するモデル・データを、局330bのアドレスと共に、検索サーバ320へ送信する。その後、検索サーバ320は、局330bのアドレスを含む特定の地図に対するリクエストを対応する情報源210へ伝達し、情報源210はこのマップを局330bへ伝達する。ユーザは、「拡大(zoom in)」、「縮小(zoom out)」、「北へパン(pan north)」などのフレーズをデータベース325へエンコードし、検索サーバ320が、対応するコマンドがあたかも局330bから発せられたかのうように、該コマンドを情報源210へ伝達してもよい。
【0019】
ユーザ局330aがサーバ320へのリクエストに局330bのアドレスを含ませるように局330aを構成する代わりに、データベース325を特定のフレーズに対して予め定められた発信元URL用のフィールドを含むように構成することも可能である。例えば、「Show Downtown Map In Car(ダウンタウンの地図を車に示せ)」というフレーズは、データベース325の「目標URL」フィールドにおける地図のアドレスに対応し得ると共に、「発信元URL」フィールドにおけるユーザのカーナビゲーション・システムのURLアドレスに対応し得る。本発明の原理の利便性を向上させる上記及び他のオプションは当業者には明らかである。
【0020】
図4は、図3の検索サーバ320において実施されるかもしれない、本発明に係る検索システムのフロー図の一例を示す。図4の例示的フロー図は、排他的であることが意図されたものではなく、当業者には明らかなように、代替的処理スキームも上述のオプション及び特徴を実行するのに用いられ得る。
【0021】
410において、声入力に対応したモデル・データが受信され、420において、このモデル・データは音声認識器を通じて、テキスト文字列へ変換される。このモデル・データを含むメッセージは、発信元URLの識別を含む。ループ430〜450は、図3のサーバ320のデータベース325のところで既に述べたように、モデル・データを記録されたデータ・フレーズと比較する。435において、モデル・データが記録されたデータ・フレーズに対応する場合、対応する目標URLが、440において、取得される。前述のように、対応するコマンド又はテキスト文字列などの他の情報が更に取得されてもよい。470において、リクエストが目標URLへ伝達される。このリクエストには、410で受信された発信元アドレスが含まれる。よって、目標URLは、前述のように、元の発信元アドレスへ直接返答することができる。モデル・データが記録されたデータ・フレーズのいずれとも一致しない場合、460において、ユーザに通知される。
【0022】
以上は単に本発明の原理を説明したに過ぎない。したがって、当業者は、ここに明示的に説明又は図示されてはいないが、本発明の原理を実施し、よって以下の請求項の意図及び範囲内にある様々な変形例を考案することができることは明らかである。
【図面の簡単な説明】
【図1】
従来の汎用音声認識システムの一例を示すブロック図である。
【図2】
音声認識システムを含む従来の検索システムの一例を示すブロック図である。
【図3A】
本発明に係る検索システムの一例を示すブロック図である。
【図3B】
本発明に係る検索システムの一例を示すブロック図である。
【図4】
本発明に係る検索システムのフロー図の一例である。

Claims (16)

  1. 発信元装置から目標識別子及び発信元アドレスを受信するように構成された受信器と、
    前記目標識別子に対応した目標アドレスを識別するように構成された目標ロケータと、
    前記目標アドレスへリクエストを伝達するように構成された送信器と、を有する検索装置であって、
    前記リクエストは、前記検索装置の送信器からのリクエストへの返答の意図された受信者として前記発信元アドレスを含むことを特徴とする検索装置。
  2. 請求項1記載の検索装置であって、
    前記目標識別子は声フレーズに対応し、
    前記検索装置は、更に、
    前記目標識別子を処理し、前記目標アドレスを識別するのに用いられる前記目標ロケータへ入力を提供する音声認識器を有することを特徴とする検索装置。
  3. 請求項1記載の検索装置であって、
    前記発信元アドレスは、前記発信元装置のうちの1つに対応し、
    宛先装置は、前記発信元装置とは異なる、ことを特徴とする検索装置。
  4. 請求項1記載の検索装置であって、
    前記送信器及び受信器は、インターネット接続を通じて通信するように構成されることを特徴とする検索装置。
  5. 請求項4記載の検索装置であって、
    前記発信元アドレス及び目標アドレスは、URL(Universal Resource Locater)であることを特徴とする検索装置。
  6. 請求項1記載の検索装置であって、
    前記受信器は、更に、前記発信元装置からの後続の入力を受信するように構成され、
    前記目標ロケータは、更に、前記テキスト文字列を前記目標アドレスへ伝達するように構成される、ことを特徴とする検索装置。
  7. 請求項6記載の検索装置であって、
    前記後続の入力は声フレーズに対応し、
    前記目標ロケータは、更に、前記後続の入力を処理して、前記テキスト文字列を提供する音声認識器を有する、ことを特徴とする検索装置。
  8. ユーザ入力を受信し、
    発信元アドレスと前記ユーザ入力に対応する目標識別子とをロケータ装置へ送信し、
    前記目標識別子に対応する目標発信元へ直接リクエストを開始することなく、該目標発信元からの返答を受信する、ように構成されたアプリケーションを有するユーザ装置。
  9. 請求項8記載のユーザ装置であって、
    前記アプリケーションは、前記ロケータ装置への送信、及び前記目標発信元からの受信、をインターネット接続を通じて行うことを特徴とするユーザ装置。
  10. 請求項8記載のユーザ装置であって、
    前記ユーザ入力は声フレーズに対応し、
    前記アプリケーションは、更に、前記声フレーズを処理して、前記目標識別子を提供するように構成される、ことを特徴とするユーザ装置。
  11. ユーザへサービスを提供する方法であり、
    前記ユーザから目標識別子と関連するアドレスとを受信する工程と、
    前記目標識別子に対応する目標アドレスを識別する工程と、
    前記目標アドレスへリクエストを送信する工程と、を有する方法であって、
    前記リクエストは、前記関連アドレスを該リクエストへの返答の意図された受信者として含むことを特徴とする方法。
  12. 請求項11記載の方法であって、
    前記目標識別子は声フレーズに対応し、
    前記方法は、更に、前記目標識別子を処理して、前記目標アドレスを識別するのに用いられる検索アイテムを提供する工程を有することを特徴とする方法。
  13. 請求項11記載の方法であって、
    前記関連アドレスは、ユーザからの前記目標識別子の発信元装置のうちの1つに対応し、
    宛先装置は前記発信元装置とは異なる、ことを特徴とする方法。
  14. 請求項11記載の方法であって、
    前記受信及び送信工程は、インターネット接続を通じてそれぞれ実行されることを特徴とする方法。
  15. 請求項14記載の方法であって、
    前記発信元アドレス及び目標アドレスは、URL(Universal Resource Locater)であることを特徴とする方法。
  16. 請求項11記載の方法であって、
    ユーザから後続の入力を受信する工程と、
    該後続の入力に対応するテキスト文字列を識別する工程と、
    該テキスト文字列を前記目標アドレスへ送信する工程と、を更に有することを特徴とする方法。
JP2002548614A 2000-12-08 2001-12-05 インターネット・アクセス用分散型音声認識 Pending JP2004515859A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/733,880 US20020072916A1 (en) 2000-12-08 2000-12-08 Distributed speech recognition for internet access
PCT/IB2001/002317 WO2002046959A2 (en) 2000-12-08 2001-12-05 Distributed speech recognition for internet access

Publications (1)

Publication Number Publication Date
JP2004515859A true JP2004515859A (ja) 2004-05-27

Family

ID=24949491

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002548614A Pending JP2004515859A (ja) 2000-12-08 2001-12-05 インターネット・アクセス用分散型音声認識

Country Status (6)

Country Link
US (1) US20020072916A1 (ja)
EP (1) EP1364521A2 (ja)
JP (1) JP2004515859A (ja)
KR (1) KR20020077422A (ja)
CN (1) CN1235387C (ja)
WO (1) WO2002046959A2 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6785647B2 (en) * 2001-04-20 2004-08-31 William R. Hutchison Speech recognition system with network accessible speech processing resources
US8370141B2 (en) * 2006-03-03 2013-02-05 Reagan Inventions, Llc Device, system and method for enabling speech recognition on a portable data device
US7756708B2 (en) 2006-04-03 2010-07-13 Google Inc. Automatic language model update
KR100897554B1 (ko) * 2007-02-21 2009-05-15 삼성전자주식회사 분산 음성인식시스템 및 방법과 분산 음성인식을 위한 단말기
US8099289B2 (en) * 2008-02-13 2012-01-17 Sensory, Inc. Voice interface and search for electronic devices including bluetooth headsets and remote systems
KR20110100652A (ko) * 2008-12-16 2011-09-14 코닌클리케 필립스 일렉트로닉스 엔.브이. 음성 신호 프로세싱
CN104517606A (zh) * 2013-09-30 2015-04-15 腾讯科技(深圳)有限公司 语音识别测试方法及装置
US10375024B2 (en) * 2014-06-20 2019-08-06 Zscaler, Inc. Cloud-based virtual private access systems and methods
CN104462186A (zh) * 2014-10-17 2015-03-25 百度在线网络技术(北京)有限公司 一种语音搜索方法及装置
US10373614B2 (en) 2016-12-08 2019-08-06 Microsoft Technology Licensing, Llc Web portal declarations for smart assistants
US11886823B2 (en) * 2018-02-01 2024-01-30 International Business Machines Corporation Dynamically constructing and configuring a conversational agent learning model

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5915001A (en) * 1996-11-14 1999-06-22 Vois Corporation System and method for providing and using universally accessible voice and speech data files
US20010014868A1 (en) * 1997-12-05 2001-08-16 Frederick Herz System for the automatic determination of customized prices and promotions
EP1062798A1 (en) * 1998-03-10 2000-12-27 Siemens Corporate Research, Inc. A system for browsing the world wide web with a traditional telephone
US6269336B1 (en) * 1998-07-24 2001-07-31 Motorola, Inc. Voice browser for interactive services and methods thereof
US6600736B1 (en) * 1999-03-31 2003-07-29 Lucent Technologies Inc. Method of providing transfer capability on web-based interactive voice response services
US6591261B1 (en) * 1999-06-21 2003-07-08 Zerx, Llc Network search engine and navigation tool and method of determining search results in accordance with search criteria and/or associated sites

Also Published As

Publication number Publication date
WO2002046959A3 (en) 2003-09-04
CN1235387C (zh) 2006-01-04
CN1476714A (zh) 2004-02-18
EP1364521A2 (en) 2003-11-26
KR20020077422A (ko) 2002-10-11
WO2002046959A2 (en) 2002-06-13
US20020072916A1 (en) 2002-06-13

Similar Documents

Publication Publication Date Title
US9761241B2 (en) System and method for providing network coordinated conversational services
EP1125279B1 (en) System and method for providing network coordinated conversational services
US8032383B1 (en) Speech controlled services and devices using internet
KR101027548B1 (ko) 통신 시스템용 보이스 브라우저 다이얼로그 인에이블러
US8838457B2 (en) Using results of unstructured language model based speech recognition to control a system-level function of a mobile communications facility
EP0854417A2 (en) Voice activated control unit
US7392184B2 (en) Arrangement of speaker-independent speech recognition
JP2016095383A (ja) 音声認識クライアント装置及びサーバ型音声認識装置
CA2418234A1 (en) System and method of ubiquitous language translation for wireless devices
JP2002528804A (ja) サービスアプリケーションに対するユーザインタフェースの音声制御
JP2004515859A (ja) インターネット・アクセス用分散型音声認識
CN108881507B (zh) 一种包括语音浏览器和区块链语音dns单元的系统
US20020077814A1 (en) Voice recognition system method and apparatus
CN111524508A (zh) 语音对话系统以及语音对话实现方法
US20020026319A1 (en) Service mediating apparatus
JP4049456B2 (ja) 音声情報利用システム
KR20060096654A (ko) 멀티모달 플랫폼을 이용한 모바일 서비스 시스템 및 그 방법
KR100432373B1 (ko) 독립적 음성처리를 위한 음성인식 시스템
KR100986443B1 (ko) 보이스 엑스엠엘 문서에서 음성인식 그래마없이 음성인식및 녹음을 수행하는 방법
KR20050077442A (ko) 보이스 엑스엠엘 문서에서 음성인식 파라미터 설정 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041202

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080115

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080415

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080520

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080815

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20080926

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20081031