JP5154643B2 - 広告及び/又はウェブページを識別するための音声認識 - Google Patents
広告及び/又はウェブページを識別するための音声認識 Download PDFInfo
- Publication number
- JP5154643B2 JP5154643B2 JP2010508916A JP2010508916A JP5154643B2 JP 5154643 B2 JP5154643 B2 JP 5154643B2 JP 2010508916 A JP2010508916 A JP 2010508916A JP 2010508916 A JP2010508916 A JP 2010508916A JP 5154643 B2 JP5154643 B2 JP 5154643B2
- Authority
- JP
- Japan
- Prior art keywords
- terms
- identified
- filtered
- information
- term
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
Description
本明細書で説明している実現例では、重要なターム(term)(たとえば単語(word))を識別するために、ユーザの発話がモニタされ処理される。各重要なタームおよび、重要なタームが識別された時刻及び/又は位置は、データベースに格納される。周期的に、あるいは要求に応じて、格納されたタームはデータベースから読み出され、そしてアプリケーション(たとえば、広告サーバ)に伝送される。アプリケーションは、伝送された情報を用いて広告を編集、及び/又は取得し、そしてユーザに広告を送信できる。その代わりに、アプリケーションは、その情報を用いて検索を行い、そしてユーザに検索の結果を利用できるようにすることができる。
図1は、本明細書で説明する概念が実現されるシステムの例を示す。図示しているように、システム100は、クライアント装置102、サーバ装置104、およびネットワーク106を含みうる。他の実装では、システム100は、付加的な、少数の、または種々の構成要素を含むことができる。さらに、システム100の1つ以上の構成要素が、システム100の別の構成要素の1つ以上の機能を行う場合がある。
図2は、クライアント装置102の例を示す図である。図解しているように、クライアント装置102は、カメラ202、スピーカ204、ディスプレイ206、制御ボタン208、キーパッド210、マイクロフォン212、筐体214を含みうる。カメラ202は、ユーザがデバイス102の前にある被写体のメディア(たとえば、画像、ビデオ・クリップ)を眺め、撮りそして保存することができるようになっている。スピーカ204は、クライアント装置102のユーザに可聴情報を提供できる。ディスプレイ206は、ユーザに視覚情報、たとえば、ビデオ画像または映像を提供するためにディスプレイ画面を含むことができ、そしてユーザからの入力を受け取るタッチ画面(たとえば、容量性画面、近接場画面)を含むことができる。制御ボタン208は、クライアント装置102に1つ以上の操作を行わせる、たとえば電話をかけさせるまたは電話を受けさせるために、ユーザがクライアント装置102と情報をやり取りするのを許容できる。キーパッド210は、標準的な電話キーパッドを含みうる。マイクロフォン212は、ユーザから可聴情報を受信できる。筐体214は、クライアント装置102の構成要素のための囲いを提供し、そしてクライアント装置の構成要素を外部の要素から保護できる。
図9乃至図11は、音声認識を用いた処理例のフローチャートである。図12は、図9乃至図11の例示の処理が行われる際に、クライアント装置102及び/又はサーバ装置104の構成要素の一部を通るデータのフローを示す。
音声認識を行うステップおよび音声認識を用いるステップに対する、上述した構成要素および処理への多くの変更が実装できる。代替の実装では、音声認識エンジン502は、音響信号をスピーカに供給する論理に接続されうる。そのような実装では、パーソナルワード生成システム410は、ネットワーク利用性能を有する種々の形式の装置(たとえば、ケーブルテレビのようなネットワークへの能力を有するテレビ)内に設置できる。電話のような装置に実装されると、音声認識エンジン502は、クライアント装置102のユーザにより発せられる単語を識別するだけでなく、発信者により話される単語もまた識別できる。
次の例は、図13Aおよび図13Bを参照して、広告および検索結果を提供するために音声認識を行う処理および音声認識を用いる処理に関与する処理を説明している。例は、図9乃至図11を参照して上述した例示の処理と一致する。
実施形態に関するこれまでの記述は、実例を提供しているが、しかし網羅的であることまたは開示されたそのままの形態に実施形態を限定することを意図したものではない。上記教示を踏まえて修正や変更が可能である。
Claims (10)
- クライアント装置のマイクロフォンを介して会話中のユーザの発話から生成された音声信号を受信するステップと、
音声認識を用いて前記音声信号に含まれる複数のタームを識別するステップと、
前記識別された複数のタームをフィルタリング・タームのセットと比較することにより、1つ以上の識別されたタームを保持するステップと、
前記クライアント装置が、前記保持されたタームの各々に対する対応情報であって、
前記保持されたタームの発話の回数、
該発話の各々が記録された時の時刻情報、
該発話の各々について特定された地理的位置情報、
を含む対応情報を記憶するステップと、
リモート装置から受信した要求に応答して、前記要求に記述され、かつ前記保持されたタームの部分集合に関連する前記対応情報において識別される、特定の位置から特定の距離内、特定の曜日、特定の時刻に基づいて、該保持されたタームの部分集合を前記リモート装置の1つ以上の要素及びサーチエンジンに送信するステップと、
前記保持されたタームの前記部分集合のうちの1つ以上のタームと該1つ以上のタームに関連する前記対応情報とに関する広告を前記リモート装置から受信するステップと、
前記保持されたタームの前記部分集合のうちの前記1つ以上のタームから選択されたキーワードを用いて行われた検索の結果であって広告以外の情報を含む結果を、前記サーチエンジンから受信するステップと、
を有することを特徴とする方法。 - 前記1つ以上の識別されたタームを保持するステップは、
前記フィルタリング・タームにマッチする前記識別されたタームを特定するステップと、
前記識別されたタームから前記フィルタリング・タームのうちの1つにマッチする単語を削除するステップと、
を含むことを特徴とする請求項1に記載の方法。 - 前記1つ以上の識別されたタームを保持するステップは、
前記フィルタリング・タームとマッチする前記識別されたタームを特定するステップと、
前記識別されたターム内の単語が前記フィルタリング・タームのうちの1つにマッチする場合、前記単語を保持するステップと、
を含むことを特徴とする請求項1に記載の方法。 - 前記広告は、電子メール・メッセージ、ウェブページ、ボイスメール又はビデオメッセージのうち1つ以上を介して受信されることを特徴とする請求項1に記載の方法。
- 前記保持されたタームと前記保持されたタームに関連する前記情報とに関する広告、リンク、又はブックマークを含む電子メール・メッセージを、前記リモート装置から受信するステップを更に有することを特徴とする請求項1に記載の方法。
- 装置であって、
通信における前記装置のユーザの発話から生成された音声信号を受信するマイクロフォンと、
前記音声信号に含まれる複数ののタームを識別する音声認識エンジンと、
前記識別された複数のタームの1つ以上をフィルタリングするフィルタユニットと、
前記フィルタリングされたタームに関する情報であって、
前記通信において前記フィルタリングされたタームのうちの1つ以上のタームの複数のインスタンス、
前記フィルタリングされたタームのうちの前記1つ以上のタームが前記通信において発生した曜日及び時刻、
前記フィルタリングされたタームのうちの前記1つ以上のタームが前記通信において発生した前記時刻における前記装置の地理的位置、
を含む情報を記録するデータベースと、
前記フィルタリングされたタームと該フィルタリングされたタームに関連する前記記録された情報とを格納する格納ユニットと、
前記フィルタリングされたタームの部分集合を検索するプロセッサであって、
前記フィルタリングされたタームの前記部分集合のうち最も多く発せられた上位所定数のタームに対応する前記記録された複数のインスタンスと、
前記フィルタリングされたタームの前記部分集合に対して記述された特定の時間ウィンドウに対応する前記記録された曜日及び時刻と、
前記フィルタリングされたタームの前記部分集合に対して記述された特定の位置から特定の距離内にある領域に対応する前記記録された位置と、
に基づいて前記フィルタリングされたタームの前記部分集合を検索するプロセッサと、
通信インタフェースであって、
前記フィルタリングされたタームの前記部分集合と前記フィルタリングされたタームの前記部分集合に関連する前記記録された情報とをリモート装置及びサーチエンジンに送信し、
前記フィルタリングされたタームの前記部分集合のうちの1つ以上のタームと該1つ以上のタームに関連する前記記録された情報とに関する広告を前記リモート装置から受信し、
前記フィルタリングされたタームの前記部分集合のうちの前記1つ以上のタームから選択されたキーワードを用いて行われた検索の結果であって広告以外の情報を含む結果を、前記サーチエンジンから受信する
通信インタフェースと、
を有することを特徴とする装置。 - 前記フィルタユニットは、
前記識別されたタームから、所定のタームのセットにマッチするタームを削除するフィルタと、
前記識別されたタームから、別の所定のタームのセットにマッチするタームを保持するフィルタと、
のうちの少なくともいずれか1つを含むことを特徴とする請求項6に記載の装置。 - 前記検索の結果は、リンク、埋め込みコンテンツ、RSS(Really Simple Syndication)フィードURLのリスト又はブックマークのリストのうち1つ以上を含むことを特徴とする請求項6に記載の装置。
- 前記広告は、電子メール・メッセージ、ウェブページ、ボイスメール又はビデオメッセージのうちの少なくともいずれか1つをを介して提供されることを特徴とする請求項6に記載の装置。
- 装置であって、
モニタされた通信における前記装置のユーザの発話によって供給される音声信号を受信する手段と、
音声認識を用いて前記音声信号内のタームを識別する手段と、
前記識別されたタームを単語のセットと比較することにより、前記識別されたタームの1つ以上を保持する手段と、
前記保持されたタームの各々に対する情報であって、
前記モニタされた通信において当該タームが識別された回数の記録、
前記モニタされた通信における前記識別された回数の各回の時刻の記録、
前記モニタされた通信における前記装置の1つ以上の地理的位置、
を含む情報を記憶する手段と、
受信した要求に記述され、かつ前記保持されたタームのうちの一部のタームに関連する前記記憶された情報に記述された、特定の位置から特定の距離内、特定の曜日、特定の時刻に対応する前記保持されたタームのうちの選択した一部のタームを広告サーバ及びサーチエンジンに送信する手段と、
前記広告サーバから、前記選択したタームと該選択したタームに関連する前記記憶された情報とに関する広告を受信する手段と、
前記サーチエンジンから、前記選択したタームから選択されたキーワードを用いて行われた検索の結果であって広告以外の情報を含む結果を受信する手段と、
を有することを特徴とする装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/751,170 US8078468B2 (en) | 2007-05-21 | 2007-05-21 | Speech recognition for identifying advertisements and/or web pages |
US11/751,170 | 2007-05-21 | ||
PCT/IB2007/054714 WO2008142493A1 (en) | 2007-05-21 | 2007-11-20 | Speech recognition for identifying advertisments and/or web pages |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010528333A JP2010528333A (ja) | 2010-08-19 |
JP5154643B2 true JP5154643B2 (ja) | 2013-02-27 |
Family
ID=39135299
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010508916A Expired - Fee Related JP5154643B2 (ja) | 2007-05-21 | 2007-11-20 | 広告及び/又はウェブページを識別するための音声認識 |
Country Status (5)
Country | Link |
---|---|
US (1) | US8078468B2 (ja) |
EP (1) | EP2150953A1 (ja) |
JP (1) | JP5154643B2 (ja) |
CN (1) | CN101681622B (ja) |
WO (1) | WO2008142493A1 (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8397168B2 (en) | 2008-04-05 | 2013-03-12 | Social Communications Company | Interfacing with a spatial virtual communication environment |
US20120130822A1 (en) * | 2010-11-19 | 2012-05-24 | Microsoft Corporation | Computing cost per interaction for interactive advertising sessions |
US20130066634A1 (en) * | 2011-03-16 | 2013-03-14 | Qualcomm Incorporated | Automated Conversation Assistance |
CN103578469A (zh) * | 2012-08-08 | 2014-02-12 | 百度在线网络技术(北京)有限公司 | 一种展示语音识别结果的方法及装置 |
CN104243666B (zh) * | 2013-06-13 | 2017-10-31 | 腾讯科技(深圳)有限公司 | 语言处理方法及装置 |
US9551588B2 (en) | 2014-08-29 | 2017-01-24 | The Nielsen Company, LLC | Methods and systems to determine consumer locations based on navigational voice cues |
US20160171109A1 (en) * | 2014-12-12 | 2016-06-16 | Ebay Inc. | Web content filtering |
US9916025B2 (en) * | 2015-09-08 | 2018-03-13 | Samsung Electronics Co., Ltd. | Performing searches using computing devices equipped with pressure-sensitive displays |
CN109949798A (zh) * | 2019-01-03 | 2019-06-28 | 刘伯涵 | 基于音频的广告检测方法以及装置 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001197223A (ja) | 2000-01-06 | 2001-07-19 | Sony Corp | 通信システム、通信管理装置及び方法 |
US6773344B1 (en) | 2000-03-16 | 2004-08-10 | Creator Ltd. | Methods and apparatus for integration of interactive toys with interactive television and cellular communication systems |
JP2002288179A (ja) * | 2001-03-23 | 2002-10-04 | Ricoh Co Ltd | インターネット会議室サービスシステム |
US7716161B2 (en) | 2002-09-24 | 2010-05-11 | Google, Inc, | Methods and apparatus for serving relevant advertisements |
US20040059712A1 (en) * | 2002-09-24 | 2004-03-25 | Dean Jeffrey A. | Serving advertisements using information associated with e-mail |
CN1826596A (zh) | 2002-09-24 | 2006-08-30 | Google公司 | 用于提供相关广告服务的方法和装置 |
US7512603B1 (en) * | 2002-11-05 | 2009-03-31 | Claria Corporation | Responding to end-user request for information in a computer network |
US7386443B1 (en) * | 2004-01-09 | 2008-06-10 | At&T Corp. | System and method for mobile automatic speech recognition |
US7747676B1 (en) * | 2004-12-20 | 2010-06-29 | AudienceScience Inc. | Selecting an advertising message for presentation on a page of a publisher web site based upon both user history and page context |
JP2006319456A (ja) * | 2005-05-10 | 2006-11-24 | Ntt Communications Kk | キーワード提供システム及びプログラム |
US20070078708A1 (en) | 2005-09-30 | 2007-04-05 | Hua Yu | Using speech recognition to determine advertisements relevant to audio content and/or audio content relevant to advertisements |
WO2007056451A2 (en) * | 2005-11-07 | 2007-05-18 | Scanscout, Inc. | Techniques for rendering advertisments with rich media |
US20070174258A1 (en) * | 2006-01-23 | 2007-07-26 | Jones Scott A | Targeted mobile device advertisements |
US8082510B2 (en) * | 2006-04-26 | 2011-12-20 | Cisco Technology, Inc. | Method and system for inserting advertisements in unified messaging solutions |
-
2007
- 2007-05-21 US US11/751,170 patent/US8078468B2/en not_active Expired - Fee Related
- 2007-11-20 JP JP2010508916A patent/JP5154643B2/ja not_active Expired - Fee Related
- 2007-11-20 CN CN2007800529757A patent/CN101681622B/zh not_active Expired - Fee Related
- 2007-11-20 EP EP07849194A patent/EP2150953A1/en not_active Withdrawn
- 2007-11-20 WO PCT/IB2007/054714 patent/WO2008142493A1/en active Search and Examination
Also Published As
Publication number | Publication date |
---|---|
EP2150953A1 (en) | 2010-02-10 |
US20080294436A1 (en) | 2008-11-27 |
CN101681622B (zh) | 2012-08-15 |
JP2010528333A (ja) | 2010-08-19 |
US8078468B2 (en) | 2011-12-13 |
CN101681622A (zh) | 2010-03-24 |
WO2008142493A1 (en) | 2008-11-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5154643B2 (ja) | 広告及び/又はウェブページを識別するための音声認識 | |
US10503809B2 (en) | System and method of providing a context-aware personalized blogging agent | |
US8055675B2 (en) | System and method for context based query augmentation | |
US9020107B2 (en) | Performing actions for users based on spoken information | |
US8386506B2 (en) | System and method for context enhanced messaging | |
US8626694B2 (en) | System and method for disambiguating non-unique identifiers using information obtained from disparate communication channels | |
US7581166B2 (en) | System and method of collecting, correlating, and aggregating structured edited content and non-edited content | |
US9600484B2 (en) | System and method for reporting and analysis of media consumption data | |
US20140241514A1 (en) | Performing actions for users based on spoken information | |
US20090150514A1 (en) | System and method for contextual addressing of communications on a network | |
US20080021963A1 (en) | Content dissemination using a multi-protocol converter | |
US7707142B1 (en) | Methods and systems for performing an offline search | |
US20090076917A1 (en) | Facilitating presentation of ads relating to words of a message | |
JP2005528850A (ja) | モバイル機器に提供されるデータを制御するための方法および装置 | |
US20190182195A1 (en) | Event-Based Scoring of Communication Messages | |
US20120109759A1 (en) | Speech recognition system platform | |
US20140128039A1 (en) | System and Method for Storing and Managing Voicemails | |
JP4547996B2 (ja) | コミュニケーション装置及びコミュニケーション概要作成方法 | |
EP2680256A1 (en) | System and method to analyze voice communications | |
JP2013118488A (ja) | 音声データ利用システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111128 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120228 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120518 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20120820 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20120827 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120913 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121106 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121205 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151214 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5154643 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |