JP5154643B2 - 広告及び/又はウェブページを識別するための音声認識 - Google Patents

広告及び/又はウェブページを識別するための音声認識 Download PDF

Info

Publication number
JP5154643B2
JP5154643B2 JP2010508916A JP2010508916A JP5154643B2 JP 5154643 B2 JP5154643 B2 JP 5154643B2 JP 2010508916 A JP2010508916 A JP 2010508916A JP 2010508916 A JP2010508916 A JP 2010508916A JP 5154643 B2 JP5154643 B2 JP 5154643B2
Authority
JP
Japan
Prior art keywords
terms
identified
filtered
information
term
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010508916A
Other languages
English (en)
Other versions
JP2010528333A (ja
Inventor
モンス フォルケ マルクス アンドレアション,
ペル エミル オストランド,
エリク ヨハン ヴェンデル バックルンド,
Original Assignee
ソニーモバイルコミュニケーションズ, エービー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ソニーモバイルコミュニケーションズ, エービー filed Critical ソニーモバイルコミュニケーションズ, エービー
Publication of JP2010528333A publication Critical patent/JP2010528333A/ja
Application granted granted Critical
Publication of JP5154643B2 publication Critical patent/JP5154643B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting

Description

本発明は音声処理に関し、具体的には、音声認識で認識された単語を用いることに関する。
高速プロセッサの出現によって、小型の装置やパーソナルコンピュータで効果的な音声認識が行えるようになってきている。音声認識の応用例には、音声ダイヤル、音声データ入力、ディクテーション、音声コマンドによる機器制御が含まれる。
一側面によれば、方法は、音声認識を用いて音声信号内のタームを識別するステップと、前記識別されたタームをフィルタリング・タームと比較することにより、1つ以上の識別されたタームを保持するステップと、前記保持されたタームと前記保持されたタームに関連する情報とをリモート装置に送信するステップと、前記保持されたタームと前記保持されたタームに関連する前記情報とに関するメッセージを前記リモート装置から受信するステップとを含みうる。
また、前記1つ以上の識別されたタームを保持するステップは、前記識別されたタームと前記フィルタリング・タームとを比較するステップと、前記識別されたタームから前記フィルタリング・タームの単語を削除するステップとを含んでもよい。
また、前記1つ以上の識別されたタームを保持するステップは、前記識別されたタームと前記フィルタリング・タームとを比較するステップと、前記識別されたターム内の単語が前記フィルタリング・ターム内にある場合、前記単語を保持するステップとを含んでもよい。
また、前記保持されたタームと前記保持されたタームに関連する情報とをリモート装置に送信するステップは、前記保持されたタームと当該タームが識別された時刻とを前記リモート装置に送信するステップを含んでもよい。
また、前記保持されたタームと前記保持されたタームに関連する情報とをリモート装置に送信するステップは、前記保持されたタームと前記保持されたタームが識別された位置の名称を、前記保持されたタームと前記位置の名称とに基づいて広告を取得するリモート装置に送信するステップを含んでもよい。
また、前記音声認識を用いるステップは、隠れマルコフ・モデルを用いて前記音声信号内のタームを認識するステップを含みうる。
また、本方法は、前記保持されたタームと前記保持されたタームに関連する前記情報をデータベースに格納するステップを更に有することができる。
また、本方法は、前記保持されたタームと前記情報とを所定時間後に前記データベースから削除するステップを更に有することができる。
また、前記メッセージを受信するステップは、前記保持されたタームと前記保持されたタームに関連する前記情報とに関する広告を受信するステップを含んでもよい。
また、前記メッセージを受信するステップは、前記保持されたタームと前記保持されたタームに関連する前記情報とに関する広告、リンク、又はブックマークを含む電子メール・メッセージを、前記リモート装置から受信するステップを含むことができる。
また、前記メッセージを受信するステップは、前記保持されたタームに関するキーワードを用いてサーチエンジンで検索を行った結果を受信するステップを含むことができる。
別の側面によれば、装置は、前記装置で受信した情報ストリーム内のタームを識別する音声認識エンジンと、前記識別されたタームの一部をフィルタリングするワードフィルタと、前記フィルタリングされたタームと前記識別されたタームに関連する情報とを格納する単語格納ユニットと、プロセッサであって、前記格納されたタームと当該タームに関連する情報とをリモート装置に送信し、前記フィルタリングされたタームと当該タームに関連する情報とに関するメッセージを前記リモート装置から受信するように構成されたプロセッサとを有することができる。
また、前記ワードフィルタは、前記識別されたタームの中で、所定のタームのセットにマッチするタームを削除するフィルタと、前記識別されたタームの中で、所定のタームのセットにマッチするタームを保持するフィルタとのうちの少なくともいずれか1つを含むことができる。
また、前記メッセージは、前記格納されたフィルタリングされたタームから得られるキーワードに基づいて取得された広告、又は、前記格納されたフィルタリングされたタームから得られるキーワードに基づいて検索を行った結果を含むことができる。
また、前記検索を行った前記結果は、URLのリスト又はブックマークのリストのうちの少なくともいずれか1つを含むことができる。
また、前記メッセージは、電子メール・メッセージ、ウェブページ、ボイスメール又はビデオメッセージのうちの少なくともいずれか1つを含みうる。
また、前記プロセッサは、更に、所定時間後に、前記格納されたタームと前記格納されたタームに関連する前記情報を削除するように構成されている、プロセッサはさらに、格納されたタームおよび、格納されたタームに関連する情報を所定の期間後に取り除くように構成されうる。
また、前記格納されたタームに関連する前記情報は、当該タームが識別された時刻、又は、当該タームが識別された時点の前記装置の物理的位置のうちの少なくともいずれか1つを含むことができる。
また、前記単語認識エンジンは、音声認識エンジン又はインスタント・メッセージ認識エンジンのうちの少なくともいずれか1つを含みうる。
さらに別の側面によれば、装置は、音声認識を用いて音声信号内のタームを識別する手段と、前記識別されたタームを単語のセットと比較することにより、前記識別されたタームの一部を保持する手段と、前記保持された前記一部と前記保持された前記一部に関連する時刻とを広告サーバに送信する手段と、前記広告サーバから、前記保持された前記一部と前記保持された前記一部に関連する情報とに関する広告を受信する手段とを有することができる。
添付の図面は、本明細書に組み込まれて本明細書の一部をなし、本明細書で記述する1つ以上の実施形態を図解し、そして記述と併せて実施形態を説明している。図面には以下のものがある。
本明細書で記述している概念を実現できるシステムを示す図である。 図1のクライアント装置又はサーバ装置の一例を示す図である。 図1のクライアント装置の一例を示すブロック図である。 図1のクライアント装置の構成要素の例示の機能ブロック図である。 図4のパーソナルワード生成システムの例示の機能ブロック図である。 図1のサーバ装置に含まれうる構成要素の例示の機能ブロック図である。 図6のアドバタイズメント・システムの例示の機能ブロック図である。 図6のウェブ検索システムの例示の機能ブロック図である。 音声認識を行う処理の一例を示すフローチャートである。 音声認識に基づいてユーザに適合した広告を提供する処理の一例を示すフローチャートである。 音声認識に基づいてユーザに適合した検索結果を提供する処理の一例を示すフローチャートである。 図1のクライアント装置及び/又はサーバ装置の構成要素の一部を通るデータのフローを説明する図である。 音声認識を用いる場合の例を説明する図である。
以下の詳細な説明では、添付の図面を参照する。図面中で同じ参照番号は、同一または同様な要素を特定するものとする。また、以下の詳細な説明は、本発明を限定するものではない。
(概要)
本明細書で説明している実現例では、重要なターム(term)(たとえば単語(word))を識別するために、ユーザの発話がモニタされ処理される。各重要なタームおよび、重要なタームが識別された時刻及び/又は位置は、データベースに格納される。周期的に、あるいは要求に応じて、格納されたタームはデータベースから読み出され、そしてアプリケーション(たとえば、広告サーバ)に伝送される。アプリケーションは、伝送された情報を用いて広告を編集、及び/又は取得し、そしてユーザに広告を送信できる。その代わりに、アプリケーションは、その情報を用いて検索を行い、そしてユーザに検索の結果を利用できるようにすることができる。
本明細書で使用しているターム“ブラウザ”は、ユーザがネットワーク上にあるリソース(たとえば、インターネット上のウェブサイトまたはホスト)と情報をやり取りできるようにするソフトウェア・アプリケーションを指す。
本明細書で使用しているターム“サーチエンジン”は、ネットワーク内でまたは計算機システム内で情報を見出すためのシステムを指す。サーチエンジンは、検索ターム(たとえば、テキスト、画像、及び/又は音)を受け取り、そして“検索結果”(すなわち、検索タームにマッチする1つ以上の項目のリスト)を返すことができる。多くの場合、“検索”は、検索タームをネットワーク上でサーチエンジンに送信できるブラウザで検索タームを入力するステップを伴う場合がある。
単語が識別される、ターム“時刻(time)”には、時刻(time of day)、曜日(day of week)、月日(day of month)、及び/又は単語が識別された瞬間を指定する時間的情報に相応しい任意の情報片を含みうる。
本明細書で使用しているターム“ターム(term)”または“単語(word)”は、同じ意味で使われる場合があり、そして複数の単語及び/又は、意味を担う任意の一連の区切られた文字を指す場合がある。
(システム構成例)
図1は、本明細書で説明する概念が実現されるシステムの例を示す。図示しているように、システム100は、クライアント装置102、サーバ装置104、およびネットワーク106を含みうる。他の実装では、システム100は、付加的な、少数の、または種々の構成要素を含むことができる。さらに、システム100の1つ以上の構成要素が、システム100の別の構成要素の1つ以上の機能を行う場合がある。
クライアント装置102は、以下のデバイスのいずれかを含みうる。パーソナル・コンピュータ。電話、たとえば無線電話。セルラ方式無線電話にデータ処理、ファクシミリ、及び/又はデータ通信機能を組み合わせたパーソナル通信システム(PCS)端末。移動電話。電子手帳。ラップトップ。パーソナル・コンピュータ(PC)。無線電話、ページャ、インターネット/インフラネット接続、ウェブ・ブラウザ、システム手帳、カレンダ、GPSレシーバ、または別の種類の計算機若しくは通信装置、これらの装置のうちの1つで実行されるスレッドまたは処理、及び/又はこれらの装置のうちの1つにより実行できるオブジェクトを含むことができる携帯情報端末(PDA)。
サーバ装置104は、サーバ・プログラム及び/又はアプリケーションをホスティングするための1つ以上のコンピュータ・システムを含みうる。サーバ装置104は、クライアント装置102に内蔵できるクライアント・アプリケーションからデータまたは情報を受信し、データ/情報を処理し、そしてクライアント装置102にデータ/情報を送信できる。
ネットワーク106は、インターネット、アドホック・ネットワーク、ローカル・エリア・ネットワーク(LAN)、広域ネットワーク(WAN)、首都圏エリア・ネットワーク(MAN)、セルラ網、公衆交換電話網(PSTN)、任意の他のネットワーク、またはネットワークの組み合わせを含みうる。クライアント装置102は、サーバ装置104またはネットワーク106内の他のデバイスと、無線または有線通信リンクを通して通信できる。
(装置の例)
図2は、クライアント装置102の例を示す図である。図解しているように、クライアント装置102は、カメラ202、スピーカ204、ディスプレイ206、制御ボタン208、キーパッド210、マイクロフォン212、筐体214を含みうる。カメラ202は、ユーザがデバイス102の前にある被写体のメディア(たとえば、画像、ビデオ・クリップ)を眺め、撮りそして保存することができるようになっている。スピーカ204は、クライアント装置102のユーザに可聴情報を提供できる。ディスプレイ206は、ユーザに視覚情報、たとえば、ビデオ画像または映像を提供するためにディスプレイ画面を含むことができ、そしてユーザからの入力を受け取るタッチ画面(たとえば、容量性画面、近接場画面)を含むことができる。制御ボタン208は、クライアント装置102に1つ以上の操作を行わせる、たとえば電話をかけさせるまたは電話を受けさせるために、ユーザがクライアント装置102と情報をやり取りするのを許容できる。キーパッド210は、標準的な電話キーパッドを含みうる。マイクロフォン212は、ユーザから可聴情報を受信できる。筐体214は、クライアント装置102の構成要素のための囲いを提供し、そしてクライアント装置の構成要素を外部の要素から保護できる。
図3は、装置300の例示のブロック図を示す。装置300は、クライアント装置102またはサーバ装置104を表わしうる。図示しているように、装置300は、メモリ302、処理ユニット304、ネットワーク・インタフェース306、ディスプレイ308、マイクロフォン310、他の入力/出力デバイス312、およびバス314を含みうる。実装に依存して、装置300は、付加的な、少数の、種々の構成要素を含むことができる。たとえば、装置300がクライアント装置102を表す場合には、装置300はGPSレシーバを含みうる。別の例では、装置300がサーバ装置104を表すとすると、装置300は複数の中央処理装置を含みうる。
メモリ302は、データおよびコンピュータで読み取り可能な命令を格納するために、スタティック・メモリ、たとえばリード・オンリ・メモリ(ROM)、及び/又はダイナミック・メモリ、たとえばランダム・アクセス・メモリ(RAM)、またはオンボード・キャッシュを含みうる。メモリ302はまた、記憶装置、たとえばフロッピデスク、CD−ROM、CD−R/Wディスク、及び/又はフラッシュメモリ、ほかに他の種類の記憶装置を含みうる。処理ユニット304は、1つ以上のプロセッサ、マイクロプロセッサ、及び/又は装置300を制御できる処理論理を含みうる。
ネットワーク・インタフェース306は、装置300が他の装置及び/又はシステムと通信できるようにする、送受信機に似た任意のメカニズムを含みうる。たとえば、ネットワーク・インタフェース306は、ネットワーク、たとえばインターネット、セルラ網、地上無線ネットワーク(たとえば、無線ローカル・エリア・ネットワーク(WLAN))、衛星を利用したネットワーク等を経由して通信するためのメカニズムを含んでもよい。その上または代わりに、ネットワーク・インタフェース306は、モデム、ローカル・エリア・ネットワーク(LAN)へのイーサネット(登録商標)・インタフェース、及び/又は装置300を他の装置に接続するためのインタフェース/接続(たとえば、ブルートゥース・インタフェース)を含んでもよい。さらに、ネットワーク・インタフェース306は、受信機、たとえばクライアント装置102の位置を提供するためのGPSレシーバを含みうる。
ディスプレイ308は、画面(たとえば、液晶ディスプレイ(LCD)、陰極線管(CRT)ディスプレイ、有機発光ダイオード(OLED)ディスプレイ、表面電界ディスプレイ(SED)、プラズマ・ディスプレイ、電界放出ディスプレイ(FED)、双安定性ディスプレイ等)上にテキストまたは画像として、装置300により生成される信号を表示できる装置、およびユーザ入力インタフェースとして機能できるタッチ画面またはパネル対応ディスプレイを含みうる。たとえば、ディスプレイ308は、感圧の(たとえば、抵抗性の)、近接場性の(たとえば、容量性の)、聴覚性の(たとえば、弾性表面波)、感光性の(たとえば、赤外線)、及び/又はディスプレイ308が入力デバイスとして使われるのを許容する任意の他の種類の表示オーバレイを含むことができる。
マイクロフォン310は、ユーザからの可聴情報を受信し、そして可聴情報を処理されるべき処理ユニット304に中継できる。マイクロフォン310の例は、マイクロフォン212を含んでもよい。
他の入力/出力デバイス312は、キーボード、キーパッド(たとえば、図2のキーパッド210)、1つ以上のボタン(たとえば、制御ボタン208)、マウス、スピーカ(たとえば、スピーカ204)、デジタル・ビデオ・ディスク(DVD)ライタ、DVDリーダ、ユニバーサル・シリアル・バス(USB)ライン、及び/又は物理事象または現象を装置300に関連するデジタル信号に及び/又はから相互に変換するための他の種類のデバイスを含みうる。バス314は、装置300の構成要素が互いに通信できるインタフェースを提供できる。
図4は、クライアント装置102の例示の構成要素の機能ブロック図である。図示しているように、クライアント装置102は、サポート論理部402、ブラウザ404、電子メール・クライアント406、データベース408、パーソナルワード生成システム410、ポジショニング論理部412、及び/又は他のアプリケーション414を含みうる。他の実装では、クライアント装置102は、少数の、付加的な、または図4で図解しているものとは異なる種類の構成要素を含むことができる。
サポート論理部402は、図4の他の構成要素(たとえば、ブラウザ404、電子メール・クライアント406、他のアプリケーション414)に対する様々なサポート機能を行うためのハードウェア及び/又はソフトウェアを含みうる。たとえば、サポート論理部402は、図4に図解している構成要素(たとえば、他のアプリケーション414)と図3の構成要素(たとえば、ネットワーク・インタフェース306、ディスプレイ308、マイクロフォン310、および入力/出力デバイス312)との間のインタフェースを提供することができる。さらに別の例では、サポート論理部402は、伝送制御プロトコル(TCP)/インターネット・プロトコル(IP)スタックを、通信アプリケーション、たとえばブラウザ404をサポートするために提供することができる。
ブラウザ404は、ユーザがウェブサイトまたはホストでウェブ上の情報をやりとりするのを許容するソフトウェア・アプリケーションを含みうる。図1で、ユーザはブラウザ404を用いてネットワーク106内のウェブサイトを訪れ、及び/又はウェブサイトと情報をやりとりできる。さらに、ユーザはブラウザ404を用いて、サーバ装置104からクライアント装置102に受信した検索結果及び/又は広告を眺めることができる。ブラウザ404は、たとえば、メモリ302に格納された命令を使用する処理ユニット304により実装されてもよい。
電子メール・クライアント406は、電子メールを受信し、作成し、及び/又は送信するのに使用されるソフトウェア・アプリケーションを含みうる。図1では、電子メール・クライアント406は、ウェブサイトへのリンクまたはウェブ上の情報を含むメッセージをサーバ装置104から受信できる。さらに、電子メール・クライアント406は、ユーザにふさわしい広告を含むメッセージを受信することができる。
データベース408は、ブラウザ404、電子メール・クライアント406、パーソナルワード生成システム410、及び/又は他のアプリケーション414に対して情報リポジトリの役割を果たしうる。たとえば、ブラウザ404は、最近訪れたサイトのウェブページをデータベース408に格納することができる。別の例では、パーソナルワード生成システム410は、音声認識エンジンにより認識されている単語を格納及び/又は読み出すことができる。
パーソナルワード生成システム410は、マイクロフォン310から信号を受け取り、信号内の単語を認識し、重要なタームのための単語をフィルタリングし、重要なタームをデータベース408への/からの格納、読み出し、及び/又は配信するハードウェア及び/又はソフトウェアを含みうる。パーソナルワード生成システム410は、各重要なタームに対してタームが取り出された時刻および位置を格納し及び/又は取得することができる。たとえば、ユーザが場所Zで午後14時にマイクロフォン310に一文“私は昨日XYZに買い物に行った”と発すると、パーソナルワード生成システム410は、文中の単語を認識し、“買い物(shopping)”および“XYZ”に対する単語をフィルタリングし、そしてターム“買い物”および“XYZ”を午後14時及び/又は場所Zと一緒にデータベース408に格納できる。サーバ装置104からの要求に基づいて、またはあるスケジュールに基づいて、パーソナルワード生成システム410は、ターム、タームに関連する時刻、及び/又は位置を読み出し、そしてさらなる処理のためにサーバ装置104(図1)に配信することができる。
ポジショニング論理部412は、クライアント装置102の物理的位置を得るためのハードウェア及び/又はソフトウェアを含みうる。ポジショニング論理部412は、クライアント装置102の他の構成要素、たとえばGPS受信機から物理的位置に関する情報を得ることができる。他のアプリケーション414は、クライアント装置102の様々な機能、たとえばテキスト・メッセージング、マルチメディア・メッセージング、無線通信(たとえば、ブルートゥース)、画像の取得および格納、赤外線通信、音響信号を用いたスピーカ駆動、ファイル・アップローディングおよびダウンローディング、画像転送等をサポートするためのハードウェア及び/又はソフトウェアを含みうる。
図5は、パーソナルワード生成システム410の例示の機能ブロック図である。図示しているように、パーソナルワード生成システム410は、音声認識エンジン502、ワードフィルタ・コンポーネント504、および単語格納/読み出しユニット506を含みうる。他の実装では、パーソナルワード生成システムは、少数の、付加的な、または図5に示しているものとは異なる構成要素を含むことができる。たとえば、パーソナルワード生成システム410は、発話内で認識される単語からフィルタリングして取り除きうる共通的な単語のデータベースを含むことができる。
音声認識エンジン502は、マイクロフォン310から受信する音声信号を処理するためのハードウェア及び/又はソフトウェアを含みうる。音声認識エンジン502は、自身が識別する単語および、各単語を識別する時刻および位置を出力することができる。音声認識エンジン502は、ニューラル・ネットワーク、隠れマルコフ・モデル、信号間の類似性を検出するための動的時間伸縮(DTW)等を用いるものを含めて、発話内の一連の単語を認識するための1つ以上の現存する手法を採用できる。音声認識エンジン502は、一部の実装では、音声認識の精度およびスピードを向上するためにトレーニング信号を受け取ることができる。
ワードフィルタ・コンポーネント504は、音声認識エンジン502から出力される単語をフィルタリングするためのハードウェア及び/又はソフトウェアを含み、そしてフィルタリングされた単語を単語格納/読み出しユニット506に伝えることができる。フィルタリングにおいて保持されるべき単語を決定するステップで、ワードフィルタ・コンポーネント504は、音声認識エンジン502から識別された単語を所定の一連の単語と比較することができる。他の実装では、ワードフィルタ・コンポーネント504は、たとえば、前置詞(たとえば、“へ(to)”、“中へ(into)”、“に(at)”等)または接続詞(たとえば、“そして(and)”、“または(or)”等)等のような共通的な単語をフィルタリングして取り除くことができる。さらに他の実装では、ワードフィルタ・コンポーネント504は、クライアント装置102のユーザにより個人的として指定される単語(たとえば、名前)を受け入れないことができる。
単語格納/読み出しユニット506は、フィルタリングされた単語、単語が識別された時刻および位置、および各単語が識別された頻度をデータベース408に格納し、そして読み出すためのハードウェア及び/又はソフトウェアを含みうる。単語格納/読み出しユニット506は、単語および、対応する時刻及び/又は位置を他の構成要素(たとえば、ワードフィルタ・コンポーネント504、サーバ装置104(図1)等)からの要求に基づいて、またはあるスケジュールに基づいて格納し、及び/又は読み出すことができる。さらに、単語格納/読み出しユニット506は、要求された、時間ウィンドウ(たとえば、毎月2日目の午後2時から3時の間)、地理的領域(たとえば、スウェーデンのルンド)、及び/又は時刻/位置の他の組み合わせパターン(たとえば、位置Xから2キロメートル以内で木曜日の午後2時から4時までに最もよく発せられた上位10位の単語)に基づいて単語を読み出すことができる。1つの実装では、単語格納/読み出しユニット506は、データベース408内の情報を最新の状態に保つために、ある期間(たとえば、1日、1週間等)後に単語を破棄することができる。他の実装では、単語格納/読み出しユニット506は、共通的に使用される単語の包括的なユーザ・プロファイルを得るために長時間にわたって単語を収集することができる。
図6は、サーバ装置104の例示の構成要素の機能ブロック図である。図示しているように、サーバ装置104は、サポート論理部602、データベース604、アドバタイズメント・システム606、ウェブ検索システム608、および他のアプリケーション610を含みうる。一部の実装では、構成要素は多くのサーバ装置にわたって分布させることができる。他の実装では、サーバ装置104は、少数の、付加的な、または図6に図解しているものとは異なる種類の構成要素を含むことができる。たとえば、1つの実装では、サーバ装置104は、アドバタイズメント・システム606を含み、そしてウェブ検索システム608を除外する場合があり、またはウェブ検索システム608を含み、そしてアドバタイズメント・システム606を除外することができる。
サポート論理部602は、図6の他の構成要素(アドバタイズメント・システム606、ウェブ検索システム608、および他のアプリケーション610)に対する様々なサポート機能を行うためのハードウェア及び/又はソフトウェアを含みうる。データベース604は、アドバタイズメント・システム606、ウェブ検索システム608、及び/又は他のアプリケーション610に対して情報リポジトリの役割を果たしうる。たとえば、データベース604は、広告を形成するために組み合わせできる情報を読み出すことができる。別の例では、データベース604は、ウェブ検索システム608により収集されているリンク(たとえば、ユニフォーム・リソース・ロケータ(URL))を格納することができる。さらに別の例では、データベース604は、図6の1つ以上の構成要素(たとえば、アドバタイズメント・システム606)からのサービスを要求しているクライアント装置についての情報(たとえば、ネットワーク・アドレス、電子メール・アドレス、電話番号等)を格納することができる。
1つの実装では、サーバ装置104によりサービスを受けている各クライアント装置102に対して、データベース604は、周期的にまたはイベント(たとえば、クライアント装置102がサーバ装置104と交信する)に基づいて、クライアント装置102のデータベース408に記録されているフィルタリングされた単語、及び/又はフィルタリングされた単語がクライアント装置102で識別された時刻および位置を収集することができる。1つの実装では、データベース604は、情報を最新に保つために、ある期間(たとえば、1日、1週間等)後に単語を破棄することができる。他の実装では、データベース604は、包括的なユーザ・プロファイルを得るために長い期間にわたって単語を収集することができる。
アドバタイズメント・システム606は、クライアント装置102内の単語格納/読み出しユニット506からまたはデータベース604から情報を受信するため、受信した情報に基づいて広告を編集するため、そして広告をクライアント装置102に送信するためのハードウェア及び/又はソフトウェアを含みうる。
ウェブ検索システム608は、クライアント装置102内の単語格納/読み出しユニット506から及び/又はデータベース604から情報を受信するため、受信した情報に基づいてネットワークで検索を行うためのハードウェア及び/又はソフトウェアを含みうる。ウェブ検索システム608は、検索結果をクライアント装置102に送信できる。他のアプリケーション610は、サーバ装置104の様々な機能、たとえば電子メールの提供、ウェブページの提供、ファイルの提供等をサポートするためのハードウェア及び/又はソフトウェアを含みうる。
図7は、アドバタイズメント・システム606の例示の機能フロック図である。図示しているように、アドバタイズメント・システム606は、広告準備コンポーネント702および広告サーバ704を含みうる。他の実装では、アドバタイズメント・システム606は、付加的な、少数の、及び/又は図7に図解しているものとは異なる構成要素を含むことができる。
広告準備コンポーネント702は、クライアント装置102から、フィルタリングされた単語および、単語が識別された時刻及び/又は位置を要求する及び/又は受信するためのハードウェア及び/又はソフトウェアを含みうる。さらに、広告準備コンポーネント702は、受信した単語に基づいて一連のキーワードを得るためのハードウェア及び/又はソフトウェアを含むことができる。
キーワードは、受信した単語から多くの異なる方法で選定されうる。1つの実装では、たとえば、キーワードは、クライアント装置102で特定の期間内に識別されている受信した単語の中で最も多く話された上位5位の単語を選定することにより決定されうる。別の実装では、キーワードは、受信した単語が識別されている位置に近い(たとえば、1キロメートル以内)地理的位置の名称に部分的に基づいて、決定されうる。
広告サーバ704は、キーワード、及び/又はキーワードに関連している位置に基づいて一連の広告を編集するためのハードウェア及び/又はソフトウェアを含みうる。たとえば、キーワードが場所Zで発せられているターム“レストラン”を含むと、広告サーバ704は、場所Z近くにあるレストランの広告を準備及び/又は集めることができる。1つの実装では、広告は、データベース604内に格納されているビデオ・クリップ、テキスト、映像及び/又は他の関連情報から集められる。さらに別の実装では、広告はキーワードでデータベース604を検索することにより、データベース604から読み出される。
広告サーバ704は、編集した広告をクライアント装置102に送信できる。広告は、電子メール・メッセージ、ウェブページ、音声メッセージ、ビデオ・メッセージ、アプレット、及び/又は任意の他の形態のメッセージとして送信される。情報は種々の時刻に送信でき、そして1つの実装では、情報は、キーワードがクライアント装置102で識別された時刻頃に送信される。別の実装では、ユーザの現在の位置情報が、ユーザに送信できる広告のリストをさらに絞るために用いられうる。
図8は、ウェブ検索システム608の例示の機能ブロック図である。図示しているように、ウェブ検索システム608は、ウェブ検索準備コンポーネント802、ウェブ検索サーバ804、およびアグリゲータ806を含みうる。他の実装では、ウェブ検索システム608は、付加的な、少数の、及び/又は図8に図解しているものとは異なる構成要素を含みうる。
ウェブ検索準備コンポーネント802は、フィルタリングされた単語および、単語が音声認識エンジン502で識別された時刻及び/又は位置を、クライアント装置102内の単語格納/読み出しユニット506またはデータベース604から、要求及び/又は受信するためのハードウェア及び/又はソフトウェアを含みうる。さらに、ウェブ検索準備コンポーネント802は、フィルタリングされた単語に基づいて一連のキーワードを得るためのハードウェア及び/又はソフトウェアを含むことができる。
キーワードは、フィルタリングされた単語から多くの種々の方法で選定できる。1つの実装では、たとえば、キーワードは、フィルタリングされた単語と、フィルタリングされた単語が識別されている位置に近い地理的位置の名称との両方に基づいて決定されうる。
ウェブ検索サーバ804は、キーワードに基づいて検索を行うためのハードウェア及び/又はソフトウェアを含みうる。1つの実装では、ウェブ検索サーバ804は、コンテンツを求めてデータベースを検索するサーチエンジンを含みうる。別の実装では、ウェブ検索サーバ804は、キーワードを含む検索要求をネットワーク106(図1)内のサーチエンジンに送ることができる。検索結果は、リンク(たとえば、URL)または埋め込みコンテンツ(たとえば、テキスト、記事、映像等)、RSSフィード等を含むことができる。
アグリゲータ806は、ウェブ検索サーバ804によりなされた検索要求の結果を受信し、情報を電子メール・メッセージ内にまたはウェブページとして書式を整え、そして書式が整えられた情報をクライアント装置102に送信するためのハードウェア及び/又はソフトウェアを含みうる。
(音声認識を用いた処理の例)
図9乃至図11は、音声認識を用いた処理例のフローチャートである。図12は、図9乃至図11の例示の処理が行われる際に、クライアント装置102及び/又はサーバ装置104の構成要素の一部を通るデータのフローを示す。
図9は、音声認識を行うための例示の処理900のフローチャートである。図9の例示の処理900は、クライアント102のパーソナルワード生成システム410により行われうる。多くの実装では、パーソナルワード生成システム410、及び/又はパーソナルワード生成システム410に関連するプログラム(たとえば、発話の中で識別された単語に関する情報を送信するためにサーバ装置104と通信するためのプログラム)のインスタンスは、クライアント装置102の種々の用途を妨げるのを回避するために、バックグラウンドで走行できる。
ブロック902で、マイクロフォン(たとえば、マイクロフォン310)からオーディオ信号が受信される。図12は、マイクロフォン310から音声認識エンジン502に流れるオーディオ信号を示す。
ブロック904で、音声認識は、ユーザの発話に対し、発話内の単語を識別するために適用できる。上述したように、音声認識は、たとえば、ニューラル・ネットワーク、隠れマルコフ・モデル、DTW等により行われうる。識別された各単語に対して、識別が生じる時刻及び/又は地理的位置が得られる。図12では、識別された単語が、音声認識エンジン502からワードフィルタ・コンポーネント504に渡される。
ブロック906で、識別された単語がフィルタリングされる。いずれの単語を保持するかを決定するステップでは、識別された単語は、データベース内に格納されている所定の一連の単語と比較される。他の実装では、共通的に使用される単語(たとえば、前置詞、接続詞等)は取り除かれる。
ブロック908で、フィルタリングされた単語は、単語が識別された時刻および位置と一緒にデータベースに格納される。オプションとして、各単語に対して、単語が識別される頻度が格納され及び/又は更新されうる。図12は、フィルタリングされた単語を格納するべきデータベースに送信するワードフィルタ・コンポーネント504を図解している。
図10は、音声認識に基づいてユーザにカスタマイズされた広告を提供するための例示の処理1000のフローチャートである。図10の例示の処理1000は、サーバ装置104のアドバタイズメント・システム606により行うことができる。示しているように、ブロック1002で、フィルタリングされた単語及び/又は、フィルタリングされた単語が識別された時刻および位置が得ることができる。実装に依存して、情報はクライアント装置102及び/又はサーバ装置104で得られる。1つの実装では、情報はスケジュールまたは事象の発生(たとえば、所定数の単語が特定の期間内に認識される)に基づいて提供されうる。別の実装では、情報の部分集合が広告準備コンポーネント702からのデータベース要求に応えて得られる。図12は、特定の期間Tの間に最もよく話された単語を含みうる情報の部分集合の、データベース408から広告準備コンポーネント702への転送を示す。
ブロック1004で、一連のキーワードがフィルタリングされた単語から得られる。図7に関連して上述したように、キーワードを得るのに種々の基準を用いることができる。得られるキーワードは、図12に図解しているように、広告準備コンポーネント702から広告サーバ704に送信される。
ブロック1006で、広告はキーワードに基づいて編集されうる。広告を編集するステップは、キーワードにマッチする情報(たとえば、ビデオ、テキスト等)をデータベース(たとえば、データベース604)内で検索するステップ、および情報を編集するステップを含みうる。さらに別の実装では、広告を編集するステップは、フィルタリングされた単語に最もよくマッチする広告を読み出すステップを含みうる。マッチは、キーワードだけでなく、キーワードに関連する位置および時刻に基づく。
ブロック1008で、編集された広告は、フィルタリングされた単語が得られているクライアント装置に送信される。上述したように、広告は、電子メール・メッセージ、ウェブページ、音声メッセージ、ビデオ・メッセージ、及び/又は情報を交換する他の形態として送信されうる。図12は、広告を電子メール・メッセージまたはウェブページとして、電子メール・クライアント404またはブラウザ406に送信するステップを示す。
処理1000では、広告は、クライアント装置102のユーザにより話される単語に基づいて、そして単語に関連する時刻/地理的情報に基づいて生成されるので、ユーザにとって非常に興味のある広告を、適切な時刻および場所に配信できる。たとえば、ユーザがある日新しいコンピュータを購入することについて多く話すと、ユーザはコンピュータ販売店からの広告を受信することができる。格納された情報はクライアント装置102から徐々に消去されうるので、ユーザが次の日に部屋の模様替えをすることについてよく話すと、ユーザはコンピュータ販売店からの代わりに家具店からの広告を受信することができる。
図11は、音声認識に基づいてユーザにふさわしい検索結果を提供するための例示の処理1100のフローチャートである。図11の例示の処理は、サーバ装置104のウェブ検索システムにより行われることができる。図示しているように、ブロック1102で、フィルタリングされた単語、及び/又はフィルタリングされた単語が識別された時刻および位置は、ブロック1002に対して上述したものと同様な方法で得ることができる。図12は、特定の期間Tの間に最もよく話された単語を含みうる、フィルタリングされた単語の部分集合の、データベース408からウェブ検索準備コンポーネント802への転送を示す。
ブロック1104で、一連のキーワードは、フィルタリングされた単語から得ることができる。図8を参照して上述したように、実装に依存して、キーワードを得るのに種々の基準が使用できる。図12で図解しているように、1つの実装では、キーワードはウェブ検索準備コンポーネント802からウェブ検索サーバ804に送信されうる。
ブロック1106で、検索はキーワードに基づいて行われうる。1つの実装では、検索はデータベース604を用いて行われうる。別の実装では、ウェブ検索サーバ804が、検索要求をネットワーク106(図1)内のサーチエンジンに送ることができる。検索の結果は、リンク(たとえば、URL)または埋め込みコンテンツ(たとえば、テキスト、記事、映像等)、RSSフィード等を含むことができる。図12では、検索結果はウェブ検索サーバ804からアグリゲータ806に渡されるリンクとして示されている。
ブロック1108で、検索結果は情報集約され、そして送信されることができる。検索結果は、1つ以上のウェブページ、電子メール・メッセージ、音声メッセージ、ビデオ・メッセージ、及び/又は他の形態の交換メッセージに情報集約(すなわち、編集)されうる。情報集約された情報は、クライアント装置102に送信できる。図12は、検索結果を電子メール・メッセージとしてまたはウェブページとして電子メール・クライアント404またはブラウザ406に送信するステップを示す。クライアント装置102で、受信した情報は、メニュー、ユーザ・インタフェース等においてユーザに表示できる。受信した情報は、所定の期間後に廃棄されうる。
(代替の実装)
音声認識を行うステップおよび音声認識を用いるステップに対する、上述した構成要素および処理への多くの変更が実装できる。代替の実装では、音声認識エンジン502は、音響信号をスピーカに供給する論理に接続されうる。そのような実装では、パーソナルワード生成システム410は、ネットワーク利用性能を有する種々の形式の装置(たとえば、ケーブルテレビのようなネットワークへの能力を有するテレビ)内に設置できる。電話のような装置に実装されると、音声認識エンジン502は、クライアント装置102のユーザにより発せられる単語を識別するだけでなく、発信者により話される単語もまた識別できる。
別の実装では、音声認識エンジン502の使用に加えてまたはその代わりに、重要なタームに対してインスタント・メッセージ(たとえば、着信メッセージ及び/又は発信メッセージ)を調べる、インスタント・メッセージング単語認識エンジンが使用される。
図6から図8には、広告準備コンポーネント702及び/又はウェブ検索準備コンポーネント802がサーバ装置104の副構成要素として示されている。他の実装では、広告準備コンポーネント702及び/又はウェブ検索準備コンポーネント802は、クライアント装置102内に含まれうる。
さらに他の実装では、ワードフィルタ・コンポーネント504及び/又は単語格納/読み出しユニット506は、サーバ装置104に組み込まれうる。より一般的には、ある構成要素をクライアント装置内かまたはサーバ装置内に含めるかどうかは、処理能力、メモリ、及び/又はクライアント装置およびサーバ装置に関する他の要因に依存する。
(例)
次の例は、図13Aおよび図13Bを参照して、広告および検索結果を提供するために音声認識を行う処理および音声認識を用いる処理に関与する処理を説明している。例は、図9乃至図11を参照して上述した例示の処理と一致する。
例では、ジェイン(Jane)1302が彼女の友人グレタ(Greta)(図示せず)に、火曜日の午後2時に話しかけていると仮定する。さらに、クライアント装置1304内のパーソナルワード生成システム410(図示せず)がバックグラウンドで実行されていると仮定する。ジェインの会話中に、ジェイン1302はターム“花(bloom)”および“買い物(shopping)”を何度も使用する。
クライアント装置1304で、音声認識エンジン502(図示していない)は、クライアント装置1304内のマイクロフォンからオーディオ信号を受信し、そしてジェイン1302により話される単語を識別する。識別された単語は、クライアント装置1304内のワードフィルタ・コンポーネント504(図示していない)に渡され、そしてフィルタリングされる。ワードフィルタ・コンポーネント504は、単語をフィルタリングし、そして2語、“花”および“買い物”のみを保持する。単語格納/読み出しユニット506(図示せず)は、単語、“花”が識別された時刻(たとえば、午後2時5分、2時15分、および2時35分)、および“買い物”が識別された時刻(たとえば、午後2時3分、2時12分、および2時37分)を記録する。地理的位置は、クライアント装置1304内のポジショニング論理部412により、スウェーデンのルンドとして提供され、そしてクライアント装置1304内のデータベース408(図示せず)に格納される。
クライアント装置1304は、サーバ装置にコンタクトし、そして単語(たとえば、午後2時と午後3時との間に最もよく話されている単語)および、単語に関連する時間的および地理的情報をサーバ装置に送信する。サーバ装置で、広告準備コンポーネント702(図示していない)が単語を受信し、そしてキーワード“花”、“買い物”、“ルンド”および“スウェーデン”を生成する。広告サーバ704(図示していない)は、キーワードを用い、スウェーデンのルンドで“花”と呼ばれる小売店についてのウェブページ広告を読み出す。広告サーバ704は、ウェブページを指すURLをリンクとして電子メール・メッセージに含め、そして電子メール・メッセージをクライアント装置1304に送信する。
さらに、サーバ装置で、ウェブ検索準備コンポーネント802(図示していない)は単語を受信し、そしてキーワード“花”および“買い物”を生成する。キーワードは、検索クエリを花および買い物に関するURLのリストを返すサーチエンジンに送るために、ウェブ検索サーバ804(図示していない)により使用される。アグリゲータ806は、URLのリストを電子メール・メッセージに含め、そして電子メール・メッセージをクライアント装置1304に送信する。
クライアント装置1304で、ジェイン1302は、広告サーバ704から1つの電子メール・メッセージが、そしてアグリゲータ806から別の電子メール・メッセージがあることに気付く。ジェイン1302は、クライアント装置1304のディスプレイ1306上で、広告サーバ704からの電子メール・メッセージを見て、電子メール・メッセージ内のURLリンクをクリックし、そして図13Bで図解しているように、広告ページ1308を眺める。
(結論)
実施形態に関するこれまでの記述は、実例を提供しているが、しかし網羅的であることまたは開示されたそのままの形態に実施形態を限定することを意図したものではない。上記教示を踏まえて修正や変更が可能である。
たとえば、一連のブロックが図9乃至図11に図解した処理に関して記述されてきているけれども、ブロックの順序は、修正できる。たとえば、ブロック904は、ブロック906乃至908が行われている間に行われうる。さらに、図9乃至図11で従属関係にないブロックは、他のブロックと並行して行われることができるブロックを表わしうる。
本明細書で記述した態様は、図で説明した実装においてソフトウェア、ファームウェア、およびハードウェアの多くの種々の形態で実装できることは、明らかであろう。態様を実装するのに使用される実際のソフトウェア・コードまたは専用の制御ハードウェアは、限定するものとは見なされるべきではない。このように、態様の運用および動作は、特定のソフトウェア・コードに関係なく記述されたソフトウェアおよび制御ハードウェアは、本明細書の記述に基づいて態様を実装するように設計されることができると理解されよう。
本出願で使用される要素、行動、または命令は、そのように明確に記述されなければ、本発明に決定的または本質的とは見なされるべきではない。また、本明細書で使用されているように、冠詞“(a)”は1つ以上の項目を含むように意図されている。1つのみの項目が意図されるところでは、ターム“1つの(one)”または同様な言語が使用される。さらに、語句“に基づいて(based on)”は、違うように明確に述べられなければ、“少なくとも一部分、に基づいて(based,at least in part,on)”を意味するように意図されている。
ターム“備える(comprises)/備えている(comprising)”は、本明細書で使用される場合、述べられている特徴、整数、ステップまたは構成要素の存在を指定するものと解釈されるが、しかし1つ以上の他の特徴、整数、ステップ、構成要素、またはこれらの集まりの存在または追加を排除しない。
さらに、本発明のある部分は、1つ以上の機能を行う“論理部(logic)”として記述されてきている。この論理部は、ハードウェア、たとえばプロセッサ、特定用途向け集積回路、またはフィールド・プログラマブル・ゲート・アレイ、ソフトウェア、またはハードウェアとソフトウェアとの組み合わせを含みうる。

Claims (10)

  1. クライアント装置のマイクロフォンを介して会話中のユーザの発話から生成された音声信号を受信するステップと、
    音声認識を用いて前記音声信号に含まれる複数のタームを識別するステップと、
    前記識別された複数のタームをフィルタリング・タームのセットと比較することにより、1つ以上の識別されたタームを保持するステップと、
    前記クライアント装置が、前記保持されたタームの各々に対する対応情報であって、
    前記保持されたタームの発話の回数、
    該発話の各々が記録された時の時刻情報、
    該発話の各々について特定された地理的位置情報、
    を含む対応情報を記憶するステップと、
    リモート装置から受信した要求に応答して、前記要求に記述され、かつ前記保持されたタームの部分集合に関連する前記対応情報において識別される、特定の位置から特定の距離内、特定の曜日、特定の時刻に基づいて、該保持されたタームの部分集合を前記リモート装置の1つ以上の要素及びサーチエンジンに送信するステップと、
    前記保持されたタームの前記部分集合のうちの1つ以上のタームと該1つ以上のタームに関連する前記対応情報とに関する広告を前記リモート装置から受信するステップと、
    前記保持されたタームの前記部分集合のうちの前記1つ以上のタームから選択されたキーワードを用いて行われた検索の結果であって広告以外の情報を含む結果を、前記サーチエンジンから受信するステップと、
    を有することを特徴とする方法。
  2. 前記1つ以上の識別されたタームを保持するステップは、
    前記フィルタリング・タームにマッチする前記識別されたタームを特定するステップと、
    前記識別されたタームから前記フィルタリング・タームのうちの1つにマッチする単語を削除するステップと、
    を含むことを特徴とする請求項1に記載の方法。
  3. 前記1つ以上の識別されたタームを保持するステップは、
    前記フィルタリング・タームとマッチする前記識別されたタームを特定するステップと、
    前記識別されたターム内の単語が前記フィルタリング・タームのうちの1つにマッチする場合、前記単語を保持するステップと、
    を含むことを特徴とする請求項1に記載の方法。
  4. 前記広告は、電子メール・メッセージ、ウェブページ、ボイスメール又はビデオメッセージのうち1つ以上を介して受信されることを特徴とする請求項1に記載の方法。
  5. 前記保持されたタームと前記保持されたタームに関連する前記情報とに関する広告、リンク、又はブックマークを含む電子メール・メッセージを、前記リモート装置から受信するステップを更に有することを特徴とする請求項1に記載の方法。
  6. 装置であって、
    通信における前記装置のユーザの発話から生成された音声信号を受信するマイクロフォンと、
    前記音声信号に含まれる複数ののタームを識別する音声認識エンジンと、
    前記識別された複数のタームの1つ以上をフィルタリングするフィルタユニットと、
    前記フィルタリングされたタームに関する情報であって、
    前記通信において前記フィルタリングされたタームのうちの1つ以上のタームの複数のインスタンス、
    前記フィルタリングされたタームのうちの前記1つ以上のタームが前記通信において発生した曜日及び時刻、
    前記フィルタリングされたタームのうちの前記1つ以上のタームが前記通信において発生した前記時刻における前記装置の地理的位置、
    を含む情報を記録するデータベースと、
    前記フィルタリングされたタームと該フィルタリングされたタームに関連する前記記録された情報とを格納する格納ユニットと、
    前記フィルタリングされたタームの部分集合を検索するプロセッサであって、
    前記フィルタリングされたタームの前記部分集合のうち最も多く発せられた上位所定数のタームに対応する前記記録された複数のインスタンスと、
    前記フィルタリングされたタームの前記部分集合に対して記述された特定の時間ウィンドウに対応する前記記録された曜日及び時刻と、
    前記フィルタリングされたタームの前記部分集合に対して記述された特定の位置から特定の距離内にある領域に対応する前記記録された位置と、
    に基づいて前記フィルタリングされたタームの前記部分集合を検索するプロセッサと、
    通信インタフェースであって、
    前記フィルタリングされたタームの前記部分集合と前記フィルタリングされたタームの前記部分集合に関連する前記記録された情報とをリモート装置及びサーチエンジンに送信し、
    前記フィルタリングされたタームの前記部分集合のうちの1つ以上のタームと該1つ以上のタームに関連する前記記録された情報とに関する広告を前記リモート装置から受信し、
    前記フィルタリングされたタームの前記部分集合のうちの前記1つ以上のタームから選択されたキーワードを用いて行われた検索の結果であって広告以外の情報を含む結果を、前記サーチエンジンから受信する
    通信インタフェースと、
    を有することを特徴とする装置。
  7. 前記フィルタユニットは、
    前記識別されたタームから、所定のタームのセットにマッチするタームを削除するフィルタと、
    前記識別されたタームから、別の所定のタームのセットにマッチするタームを保持するフィルタと、
    のうちの少なくともいずれか1つを含むことを特徴とする請求項6に記載の装置。
  8. 前記検索の結果は、リンク、埋め込みコンテンツ、RSS(Really Simple Syndication)フィードURLのリスト又はブックマークのリストのうち1つ以上を含むことを特徴とする請求項6に記載の装置。
  9. 前記広告は、電子メール・メッセージ、ウェブページ、ボイスメール又はビデオメッセージのうちの少なくともいずれか1つをを介して提供されることを特徴とする請求項6に記載の装置。
  10. 装置であって、
    モニタされた通信における前記装置のユーザの発話によって供給される音声信号を受信する手段と、
    音声認識を用いて前記音声信号内のタームを識別する手段と、
    前記識別されたタームを単語のセットと比較することにより、前記識別されたタームの1つ以上を保持する手段と、
    前記保持されたタームの各々に対する情報であって、
    前記モニタされた通信において当該タームが識別された回数の記録、
    前記モニタされた通信における前記識別された回数の各回の時刻の記録、
    前記モニタされた通信における前記装置の1つ以上の地理的位置、
    を含む情報を記憶する手段と、
    受信した要求に記述され、かつ前記保持されたタームのうちの一部のタームに関連する前記記憶された情報に記述された、特定の位置から特定の距離内、特定の曜日、特定の時刻に対応する前記保持されたタームのうちの選択した一部のタームを広告サーバ及びサーチエンジンに送信する手段と、
    前記広告サーバから、前記選択したタームと該選択したタームに関連する前記記憶された情報とに関する広告を受信する手段と、
    前記サーチエンジンから、前記選択したタームから選択されたキーワードを用いて行われた検索の結果であって広告以外の情報を含む結果を受信する手段と、
    を有することを特徴とする装置。
JP2010508916A 2007-05-21 2007-11-20 広告及び/又はウェブページを識別するための音声認識 Expired - Fee Related JP5154643B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/751,170 US8078468B2 (en) 2007-05-21 2007-05-21 Speech recognition for identifying advertisements and/or web pages
US11/751,170 2007-05-21
PCT/IB2007/054714 WO2008142493A1 (en) 2007-05-21 2007-11-20 Speech recognition for identifying advertisments and/or web pages

Publications (2)

Publication Number Publication Date
JP2010528333A JP2010528333A (ja) 2010-08-19
JP5154643B2 true JP5154643B2 (ja) 2013-02-27

Family

ID=39135299

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010508916A Expired - Fee Related JP5154643B2 (ja) 2007-05-21 2007-11-20 広告及び/又はウェブページを識別するための音声認識

Country Status (5)

Country Link
US (1) US8078468B2 (ja)
EP (1) EP2150953A1 (ja)
JP (1) JP5154643B2 (ja)
CN (1) CN101681622B (ja)
WO (1) WO2008142493A1 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8397168B2 (en) 2008-04-05 2013-03-12 Social Communications Company Interfacing with a spatial virtual communication environment
US20120130822A1 (en) * 2010-11-19 2012-05-24 Microsoft Corporation Computing cost per interaction for interactive advertising sessions
US20130066634A1 (en) * 2011-03-16 2013-03-14 Qualcomm Incorporated Automated Conversation Assistance
CN103578469A (zh) * 2012-08-08 2014-02-12 百度在线网络技术(北京)有限公司 一种展示语音识别结果的方法及装置
CN104243666B (zh) * 2013-06-13 2017-10-31 腾讯科技(深圳)有限公司 语言处理方法及装置
US9551588B2 (en) 2014-08-29 2017-01-24 The Nielsen Company, LLC Methods and systems to determine consumer locations based on navigational voice cues
US20160171109A1 (en) * 2014-12-12 2016-06-16 Ebay Inc. Web content filtering
US9916025B2 (en) * 2015-09-08 2018-03-13 Samsung Electronics Co., Ltd. Performing searches using computing devices equipped with pressure-sensitive displays
CN109949798A (zh) * 2019-01-03 2019-06-28 刘伯涵 基于音频的广告检测方法以及装置

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001197223A (ja) 2000-01-06 2001-07-19 Sony Corp 通信システム、通信管理装置及び方法
US6773344B1 (en) 2000-03-16 2004-08-10 Creator Ltd. Methods and apparatus for integration of interactive toys with interactive television and cellular communication systems
JP2002288179A (ja) * 2001-03-23 2002-10-04 Ricoh Co Ltd インターネット会議室サービスシステム
US7716161B2 (en) 2002-09-24 2010-05-11 Google, Inc, Methods and apparatus for serving relevant advertisements
US20040059712A1 (en) * 2002-09-24 2004-03-25 Dean Jeffrey A. Serving advertisements using information associated with e-mail
CN1826596A (zh) 2002-09-24 2006-08-30 Google公司 用于提供相关广告服务的方法和装置
US7512603B1 (en) * 2002-11-05 2009-03-31 Claria Corporation Responding to end-user request for information in a computer network
US7386443B1 (en) * 2004-01-09 2008-06-10 At&T Corp. System and method for mobile automatic speech recognition
US7747676B1 (en) * 2004-12-20 2010-06-29 AudienceScience Inc. Selecting an advertising message for presentation on a page of a publisher web site based upon both user history and page context
JP2006319456A (ja) * 2005-05-10 2006-11-24 Ntt Communications Kk キーワード提供システム及びプログラム
US20070078708A1 (en) 2005-09-30 2007-04-05 Hua Yu Using speech recognition to determine advertisements relevant to audio content and/or audio content relevant to advertisements
WO2007056451A2 (en) * 2005-11-07 2007-05-18 Scanscout, Inc. Techniques for rendering advertisments with rich media
US20070174258A1 (en) * 2006-01-23 2007-07-26 Jones Scott A Targeted mobile device advertisements
US8082510B2 (en) * 2006-04-26 2011-12-20 Cisco Technology, Inc. Method and system for inserting advertisements in unified messaging solutions

Also Published As

Publication number Publication date
EP2150953A1 (en) 2010-02-10
US20080294436A1 (en) 2008-11-27
CN101681622B (zh) 2012-08-15
JP2010528333A (ja) 2010-08-19
US8078468B2 (en) 2011-12-13
CN101681622A (zh) 2010-03-24
WO2008142493A1 (en) 2008-11-27

Similar Documents

Publication Publication Date Title
JP5154643B2 (ja) 広告及び/又はウェブページを識別するための音声認識
US10503809B2 (en) System and method of providing a context-aware personalized blogging agent
US8055675B2 (en) System and method for context based query augmentation
US9020107B2 (en) Performing actions for users based on spoken information
US8386506B2 (en) System and method for context enhanced messaging
US8626694B2 (en) System and method for disambiguating non-unique identifiers using information obtained from disparate communication channels
US7581166B2 (en) System and method of collecting, correlating, and aggregating structured edited content and non-edited content
US9600484B2 (en) System and method for reporting and analysis of media consumption data
US20140241514A1 (en) Performing actions for users based on spoken information
US20090150514A1 (en) System and method for contextual addressing of communications on a network
US20080021963A1 (en) Content dissemination using a multi-protocol converter
US7707142B1 (en) Methods and systems for performing an offline search
US20090076917A1 (en) Facilitating presentation of ads relating to words of a message
JP2005528850A (ja) モバイル機器に提供されるデータを制御するための方法および装置
US20190182195A1 (en) Event-Based Scoring of Communication Messages
US20120109759A1 (en) Speech recognition system platform
US20140128039A1 (en) System and Method for Storing and Managing Voicemails
JP4547996B2 (ja) コミュニケーション装置及びコミュニケーション概要作成方法
EP2680256A1 (en) System and method to analyze voice communications
JP2013118488A (ja) 音声データ利用システム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111128

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120228

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120518

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120820

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120827

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120913

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121106

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121205

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151214

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5154643

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees