JP2020091907A - インタラクティブなエクスペリエンスに適合させた自然言語文法 - Google Patents

インタラクティブなエクスペリエンスに適合させた自然言語文法 Download PDF

Info

Publication number
JP2020091907A
JP2020091907A JP2020036823A JP2020036823A JP2020091907A JP 2020091907 A JP2020091907 A JP 2020091907A JP 2020036823 A JP2020036823 A JP 2020036823A JP 2020036823 A JP2020036823 A JP 2020036823A JP 2020091907 A JP2020091907 A JP 2020091907A
Authority
JP
Japan
Prior art keywords
bid
conversation
expression
natural language
grammar
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020036823A
Other languages
English (en)
Other versions
JP7129439B2 (ja
Inventor
チンディ・ジャン
Qindi Zhang
ジョエル・マッケンジー
Mckenzie Joel
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SoundHound Inc
Original Assignee
SoundHound Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SoundHound Inc filed Critical SoundHound Inc
Publication of JP2020091907A publication Critical patent/JP2020091907A/ja
Application granted granted Critical
Publication of JP7129439B2 publication Critical patent/JP7129439B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0269Targeted advertisements based on user profile or attribute
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0273Determination of fees for advertising

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Engineering & Computer Science (AREA)
  • Marketing (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

【課題】インタラクティブな広告エクスペリエンスを配信するシステムを提供する。【解決手段】インタラクティブな広告エクスペリエンスを配信するシステムは、広告ユニットのデータベース21を備える。データベース21に含まれる広告ユニットの入札を評価し、最高入札値がついた広告ユニットを選ぶ22。選ばれた広告ユニットの紹介メッセージを配信する23。紹介メッセージを配信した後、潜在顧客から自然言語表現を受信する24。広告ユニットからの文法26に従って、当該自然言語表現を解釈する25。この表現が文法26に一致した場合、当該表現が一致した文法26のインテントが示すアクションを行う27。【選択図】図2

Description

発明の分野
本発明は、自然言語文法を用いた、人間とマシンとの間の音声ベースの会話型インタフェースの分野に関する。(分類704/E17.015または704/251)
背景
ラジオおよびテレビ放送技術における初期の草分け的存在であるデビッド・サーノフは、RCA(登録商標)の社長およびNBC(登録商標)の創業者になる前に、「ラジオプレーヤには、想像し得る商品価値がない。具体的な誰かに宛てて送られていないメッセージにお金を払う人がいるだろうか?」と言った。やがて現れる電気通信システムおよびネットワークを通して広告を送信する巨大産業を、当時彼はまだ認識していなかった。
視覚的広告は、出版物が印刷されるようになった期間とほぼ同じ期間、印刷出版物に含まれていた。最終的に他のラジオ放送コンテンツ内で音声広告を1時間に何回か放送することが日常となったことは、サーノフ氏にとっては驚きであったに違いない。テレビ放送事業者も、同様に、テレビ放送コンテンツ内で映像広告を1時間に何回か放送する手法を取り入れた。当然、インターネットに接続されたコンピュータ、携帯電話、タブレット端末、音楽プレーヤ、仮想現実、およびその他のこのようなデバイスの出現によって、デバイスのユーザが望む他のコンテンツがちりばめられた視覚的広告、映像広告、および音声広告がデバイスを通して提供された。
印刷物という媒体であれ、ラジオであれ、テレビであれ、またはインターネットに接続されたデバイスであれ、広告は、広告およびお金を提供することによって広告機会に入札する広告主、最高入札を受け付けて、望ましいコンテンツの間にはさんで関連広告を広告主の商品またはサービスの見込みのある顧客(潜在顧客)に配信するパブリッシャ、および、うまく行けば、潜在顧客を、広告主のお金になる顧客にコンバートすることから構成される。
印刷広告、ラジオ広告、およびテレビ広告では、放送メッセージを読んだり注目したりすることによって広告に関与している潜在顧客が何人いるかを特定する直接の方法がなかった。いつ、どこでエンゲージメント(関与)が生じたか、潜在顧客の種類など、エンゲージメントを特徴付ける直接の方法もなかった。インターネットを用いた装置によって、潜在顧客のエンゲージメントを直接特定し、かつ特徴付ける機能がもたらされた。すなわち、一般に、潜在顧客がブラウザにあるリンクをクリックする行為である。リンクをクリックすることによって情報要求が広告主に送られるので、エンゲージメントを測定し、より正確にコンバージョン(広告に出ている商品またはサービスの購入)を予測する方法が、インターネットによってもたらされた。
別の値打ちのある広告の形態として、プロダクトプレイスメントがある。すなわち、広告に出ている製品またはサービスを、コンテンツである物語の一部として含ませることである。たとえば、映画E.T.では、リーシーズピーシーズ(登録商標)というブランドのキャンディの跡を地球外生物が追いかけ、セックス・アンド・ザ・シティというテレビドラマでは、マノロブラニクというブランドの靴を登場人物のキャリーが頻繁に見せたり話に出していた。
別の広告の形態として、テレマーケティングがある。すなわち、潜在顧客に電話をかけ
ることである。テレマーケティングは、潜在顧客には迷惑であると評判である。なぜならば、少なくとも、潜在顧客にとって都合のよいタイミングに合っていない。また、1つの途切れない会話というかたちで生じるため、ずうずうしい売り口上である。テレマーケティングは、周知のとおり効果がなく、コンバージョン率が低く、潜在顧客の予測できない反応を処理するために比較的費用のかかる人間のオペレータを必要とし、人間のオペレータが付いていける比較的簡素な原稿を必要とし、オペレータの忍耐力および心理的健康をすり減らし、最も利益をもたらす潜在顧客にたどり着くことができない。
発明の概要
現在、ほとんどの広告は、インタラクティブではない。静止画の広告もあれば、音声メッセージの広告もあり、映像広告もある。非インタラクティブ広告を用いて正確に潜在顧客にターゲットを絞ることについてかなりの調査が行われた。会話型広告におけるインタラクティビティの大部分は、少量の具体的な追加情報を見るために、または、ゲームをするために、ビジュアル広告内のボタンのうちの1つまたは数個をクリックする機能である。
本開示は、会話型の自然言語による潜在顧客とのやり取りをサポートする広告ユニットを規定し、広告を配信し、広告在庫に入札し、潜在顧客からの情報をパブリッシャに、そしてパブリッシャから広告主に提供し、顧客とのやり取りから機械学習を行い、かつ、広告エコシステムに関連する側面の、システムおよび方法を対象とする。
特定の実施形態を用いることによって、広告コンバージョンは、獲得経路に正確かつ有意義に起因し得る。コンバージョン率がより高く、より測定可能になると、ターゲティングはより大きな影響力を持ち、より正確になる。
信頼できるマシンのインタフェースから自然言語によるインタラクティブ広告を配信することは、掲載されたコンテンツがマシンの挙動になり、製品がコンテンツに囲まれて置かれるプロダクトプレイスメントの最終形態である。
実施形態に係る、会話型ロボット装置と潜在顧客とのエンゲージメントを示す図である。 実施形態に係る、エクスペリエンスを提供する方法のフローチャートを示す図である。 実施形態に係る、会話状態付きの人間とマシンとの対話、および会話状態に基づいた入札を示す図である。 実施形態に係る、入札を分析するためにも用いられる会話状態を背景にした、表現の解釈を示す図である。 実施形態に係る、対話スクリプトを示す図である。 実施形態に係る、パブリッシャが広告主の広告を潜在顧客に配信することに広告主が入札する様子を示す図である。 実施形態に係る、広告エコシステムを通した広告主から潜在顧客への広告の流れを示す図である。 実施形態に係る、エコシステムを通した、アクションおよび会話型フィードバックを有するインタラクティブ広告の配信を示す図である。 実施形態に係る、潜在顧客と広告サーバとのやり取りのためのシステムを示す図である。 実施形態に係る、回転ディスクである非一時的なコンピュータ読み取り可能な媒体を示す図である。 実施形態に係る、フラッシュ・ランダムアクセスメモリである非一時的なコンピュータ読み取り可能な媒体を示す図である。 実施形態に係る、コンピュータプロセッサベースのシステム・オン・チップの下側を示す図である。 実施形態に係る、コンピュータプロセッサベースのシステム・オン・チップの上側を示す図である。 実施形態に係るサーバを示す図である。 実施形態に係る、装置用システム・オン・チップのブロック図である。 実施形態に係る、サーバ・プロセッサのブロック図である。 実施形態に係る、会話型ロボット装置の構成要素を示す図である。 実施形態に係る、音声アシスタント装置を示す図である。 実施形態に係る、音声イヤホン装置を示す図である。 実施形態に係る、携帯電話装置を示す図である。 実施形態に係る、自動車装置を示す図である。
詳細な説明
様々な実施形態によれば、自然言語表現は、話すこと、またはタイピング、タッピング、ジェスチャ、もしくは直接的な認知カップリングなどの他の手段による、1つ以上のトークンの情報についての人間の表現であり得る。自然言語文法は、1つ以上のインテントであり得、インテントの各々は、インテントに対応付く可能な表現のセットを有する。分野は、会話のトピックまたはデータセットに特有の文法セットであり得る。インテントは、自然言語表現によって表現される人間の仮定された所望のアクションを表すデータ構造であり得る。アクションのいくつかの例として、情報を取り出して問い合わせに応答すること、メッセージを送信すること、動作を行うこと、または、任意の所望のアクションを行うためのウェブAPI(Application Programming Interface)に対するSDK(Software Development Kit)関数呼び出しを行うことがある。解釈することは、トークンシーケンスまたはトークンシーケンス仮説からインテントを導出するプロセスであり得る。
いくつかの実施形態によれば、広告主は、広告ユニットを規定し、広告ユニットが潜在顧客に配信されるようにお金を払う存在である。広告ユニットは、コンテンツと、入札と、1つ以上の自然言語文法とから構成される。いくつかの実施形態によると、広告は、インタラクティブな広告ユニット内のコンテンツとして規定された紹介メッセージを配信することから始まる。紹介メッセージは、具体的な人間とマシンとのやり取りを開始するよう意図されたコンテンツである。1フレーズと同じくらいに短い紹介メッセージもある。コンテンツは、様々な実施形態によると、画像、映像、オーディオクリップ、話し言葉などのうちの1つ以上であり得、コンテンツは、潜在顧客にとって意味のあるものである。会話型コマーシャルメッセージと同じくらいに長い紹介メッセージもある。いくつかの実施形態は、新しい会話を開始するための紹介メッセージを提示する。いくつかの実施形態は、料理レシピの材料の要求に対して、材料の具体的なブランド名を用いて応答するなど、紹介メッセージを、マシンが会話する番の一部としての会話に変える。
いくつかの実施形態によれば、パブリッシャは、広告を潜在顧客に配信し、そうすることによって報酬を得る存在である。一般に、パブリッシャは、このような広告を、潜在顧客が所望、期待、または要求する他のコンテンツの中に含めて配信する。いくつかの実施形態では、パブリッシャは、1つ以上の遠隔装置に向けたコンテンツを、サーバを利用して制御または供給する。いくつかの実施形態では、装置は、単体でパブリッシャ機能を実
行する。いくつかの実施形態では、パブリッシャは、1つ以上の仲介者と協力して広告を受け付ける、または、どの広告を潜在顧客に配信するのかを判断する。いくつかの実施形態では、パブリッシャは、潜在顧客または広告を配信する装置のユーザから情報を受け付ける、または、潜在顧客または広告を配信する装置のユーザについての情報を受け付ける。装置の実施形態のいくつかの例として、人間型ロボット、家電、家事アシスタントデバイス、ウェアラブル電子デバイス、携帯電話、デスクトップコンピュータ、自動車、屋外看板、キオスク、自動販売機、人間とマシンとのインタフェースを有する装置などがある。
いくつかの実施形態によれば、紹介メッセージの配信完了後、または、紹介メッセージの配信開始後、パブリッシャは、潜在顧客が提供する、エンゲージメントを示す自然言語表現を特定する。このような実施形態は、インタラクティブな広告ユニット内で規定された自然言語の文法に応じて自然言語表現を解釈する。自然言語表現が文法に一致することが解釈によって分かることに応答して、このような実施形態は、エンゲージメントが生じたと判断することができる。
いくつかの実施形態が処理できる表現の例として、以下のような、会話を起動するエンゲージメント質問がある。
「tell me more [about that ad | product]([その広告|製品について]もっと教えてください)」
「what was that [ad](その[広告]とは何でしたか)」。
以下のようなパーソナルアシスタントのエンゲージメント:
「email me a link(リンクを電子メールで送ってください)」
「remind me about this [tonight, tomorrow](これについて[今夜,明日]リマインドしてください)」。
以下のような一般的な小売りについての質問のエンゲージメント:
「show [it to] me([それを]見せてください)」
「where can I buy it(それはどこで買えますか)」
「[how much | what] does it cost([いくら|なにが]かかりますか)」
「buy it [online] [now]([今][オンラインで]購入してください)」。
以下のような製品に特有のエンゲージメント質問:
「how many rolls is that(それは何ロールですか)」
「what colors does it come in(どの色がありますか)」
「how much does it weigh(重さはどのくらいですか)」。
または、応答が用意されていない他のエンゲージメント質問。
いくつかの実施形態は、仲介者を利用する。仲介者は、広告主をパブリッシャに繋げること、広告ユニットを集めること、在庫を集めること、潜在顧客の属性、コンテキスト、会話状態、ムードなどに基づいて入札を分析すること、供給および入札に応じて価格を設定すること、潜在顧客のエンゲージメントおよびコンバージョンについての情報を広告主に提供すること、のうちの1つ以上を行うことなどによって広告ユニットの在庫への配信を容易する存在である。エンゲージメントの方法は、実施形態間で異なる。音声対応の会話型装置を用いた実施形態によると、エンゲージメントとは、広告ユニット文法によって解釈される読み上げ応答である。
様々な実施形態は、様々なモードおよび自然言語によるやり取りの手段を利用する。そ
のうちのいくつかは、マシンが音声を出力するためのTTS(Text−To−Speech)およびマシンが人間の音声を認識するための自動音声認識(ASR)を用いた、言葉によるものである。このような実施形態は、オーディオエクスペリエンスを提供する。いくつかの実施形態は、音楽、音響効果、またはその他のオーディオ情報を利用してオーディオエクスペリエンスを提供する。いくつかの実施形態は、テキストの表示および送信を含むテキスト入出力のモードを利用してやり取りを行う。いくつかの実施形態は、他の神経センシングおよび神経刺激モードの、自然言語に基づいた人間とマシンとのやり取りを提供する。
いくつかの実施形態は、スピーカなどの聞き取り可能なマシン出力手段の代わりにまたはそれに加えて、表示装置を利用し、マイクロフォンまたは他の気圧波センシング装置からキャプチャされた音声信号のASRの代わりにまたはそれに加えて、キーボードまたはタッチスクリーンなどのテキスト入力手段を利用する実施形態もある。
マシンによって読み上げられる広告は、潜在顧客がマシンに普段期待する音声で配信された場合、より説得力があるだろう。音声出力を生成するためのTTSを用いて広告を配信するいくつかの実施形態は、SSML(Speech Synthesis Markup Language)などのマークアップ言語など、メタデータを有するテキストを受け付けることによって、それを十分に行う。これによって、マシンの音声を利用しているものの、潜在顧客を引きつけたり説得するのに有用な口調を設定したり、特定の単語を強調したりすることができる。
多くの人は、自身のインテントを指定するには、当該インテントを完全に自覚するために必要な情報を連続して少しずつを得て指定するほうが簡単であると分かる。モーダル・ダイアログは、このようなやり取りを容易にすることができる。モーダル・ダイアログは、マシンがそのユーザと交互にやり取りを行い、情報を提供するように、または、誰かが所望するアクションを行うようにユーザを促す、人間とマシンとのやり取りのシーケンスであり得る。たとえば、テキストメッセージを送信するというインテントを引き起こすために、マシンは、受信者の名前を提供するよう逐次ユーザに求め、その後、メッセージを送信するだろう。別の例として、月々の住宅ローンの支払い額を算出するために、マシンは、住宅価値、頭金の割合、利率、ローン期間、およびその他の情報を提供するよう、逐次ユーザに尋ねるだろう。何人かのユーザは、別のやり取りがモーダル・ダイアログに割り込んでくるとイライラするかもしれない。会話型インタフェースがモーダル・ダイアログに関与していないとき、いくつかの実施形態は、紹介メッセージを配信するだけである。いくつかの実施形態は、紹介メッセージを配信する機会に気づくと、モーダル・ダイアログが完了したらすぐに配信を行う。
いくつかの実施形態は、モーダル・ダイアログ外であっても元の活動に割り込み、エンゲージメントを開始し、元の活動を続ける前に応答を要求し得る。たとえば、ゲームをすることができるマシンの使用中、いくつかの実施形態は、ゲームに割り込んで紹介メッセージをカジュアルに配信する。いくつかのこのような実施形態は、タイムアウトを有しており、タイムアウトの後、潜在顧客のエンゲージメントがない場合、元の活動が再開する。
様々な実施形態は、広告がより効果的になるよう、広告が配信される時を正確に制御することよって、広告主に利点を提供する。いくつかの実施形態は、いくつかの広告を、すぐにではなく、会話が有用であると示した時に配信する。たとえば、天気が雨になる場合、天気についてのマシンとの会話があると、マシンに、潜在顧客が出かける準備をしている時にのみ、傘の広告を配信させる。
いくつかの実施形態によれば、広告会話を終了するための複数の条件がある。音声活動がない期間の終わりのタイムアウトは、広告会話を終わらせることを示し得る。いくつかの実施形態によると、タイムアウト期間は5秒であるが、異なる実施形態にとってより短いまたはより長い期間が適切である。いくつかの実施形態では、広告会話におけるマシンの番が質問で終わった場合、タイムアウトは、マシンの番が意見で終わった場合よりも長い。いくつかの実施形態は、背景の聞き取れない言葉を間違って音声認識してしまうことを回避するために、「オッケーロボット」などのウェイク表現を使用するよう潜在顧客に要求し、応答を提供する。いくつかの実施形態は、スクリーン上のボタンのクリックを利用して応答を開始することができる。
いくつかの実施形態によれば、興味の欠如の表示があると、広告会話は終了する。たとえば、広告文法ではなく分野文法において高スコアである潜在顧客の表現は、広告に対する興味の欠如を示し得る。いくつかの実施形態は、会話状態に、広告会話が進行中であるということを格納し、それに応じて、他の分野文法と比較してスコアを計算するときに広告文法のほうにより大きな重みを与える。
いくつかの実施形態によれば、コンバージョンによって会話が終了する。広告ユニットは、コンバージョンを構成するものを規定し得る。たとえば、アイテムを販売しているストアに対するナビゲーション分野での要求は、コンバージョンであり得、オンラインで製品またはサービスを注文する要求は、コンバージョンであり得、後からの返信の要求は、コンバージョンであり得る。いくつかの実施形態は、広告ユニットに、動的な世間話などの会話的エンゲージメントを、潜在顧客が適宜応答した場合、無期限に維持させる。いくつかのこのような実施形態では、潜在顧客は、システムにタイムアウトさせることによって、または、広告文法以外の分野でスコアが十分に高いと表現をすることによって、この会話を終了する。
いくつかの実施形態は、広告ユニットを分野として考える。多くの広告ユニットは、自然言語インタプリタに同時に提示され、互いに、かつ非広告分野と、潜在顧客の表現の各々に対する最も高い解釈スコアを競い合う。いくつかのこのような実施形態は、文法表現に、インテントについての異なる可能な言い回しに対して動的な重みを与えさせる。
いくつかの実施形態は、文法ベースのインタプリタを利用する。いくつかの実施形態は、完全に統計的言語モデルベースのインタプリタを利用する。
視覚的コミュニケーション方法にとって、ウェブページに含まれるクリック可能な広告は、印刷物やテレビ広告よりも効果的であったが、会話型広告のいくつかの実施形態の利点は、目が不自由な人や、車を運転しているまたはヘリコプターもしくは宇宙ドローンのパイロットをしているなど視覚的に他のことに関与している人向けのオーディオ広告の効果を、少なくとも、印刷物やテレビ広告と同じ程度向上させることである。
図1は、エンゲージメントのシナリオを示す図である。広告ユニットを有する、人間型ロボット支援の自然言語会話掲載装置11は、内蔵のTTSソフトウェアを用いて、「did you hear about the new StarPaste?(新しいStarPasteについて聞きました
か?)」と言う紹介メッセージを提供する。人間の潜在顧客12は、この紹介メッセージを聞き、「tell me about it(教えてください)」と言うことによって関与する。
図2は、インタラクティブな広告エクスペリエンスを配信する動作のフローチャートを示す図である。システムは、広告ユニットのデータベース21を備え、広告ユニットは、各々、入札と、コンテンツと、文法とを有する。プロセスは、ステップ22において、データベース21に含まれる広告ユニットの入札を評価し、最高入札値がついた広告ユニッ
トを選ぶことから開始する。いくつかの実施形態では、入札の評価は、広告ユニットの配信よりもずっと前にオフラインで生じる。いくつかの実施形態では、入札評価は、リアルタイムで生じる。プロセスは、ステップ23に進み、最高入札値がついたことによって選ばれた広告ユニットの紹介メッセージを配信する。ステップ24では、紹介メッセージを配信した後、システムは、潜在顧客から自然言語表現を受信する。システムは、ステップ25に進み、最高入札がついたことによって選ばれた広告ユニットからの文法26に従って、当該自然言語表現を解釈する。この表現が文法26に一致した場合、プロセスは、ステップ27に進む。ステップ27では、システムは、当該表現が一致した文法26のインテントが示すアクションを行う。
いくつかの実施形態は、多次元複素関数を用いて広告エクスペリエンスを配信するかどうかおよびいつ配信するかをリアルタイムで判断する。いくつかの実施形態では、この関数は、広告主が広告の配信にいくら入札してもよいと思っているかに関係し、広告がコンバージョンを実現できる可能性の推定に関係し、掲載装置をユーザが使用することを広告が思いとどまらせる可能性の推定に逆向きに関係する。これらは、Vickrey−Clarke−Groves関数などの選択関数に対する入力であり得る。様々な実施形態では、各対話の番において定期的に、または、会話の始めおよび仮定された終わりにアルゴリズムが実行され得る。
コンバージョンの尤度を推定することは、様々な係数を有する重み付き関数であり得る。いくつかの係数は、古い会話履歴、ユーザの好み、ユーザプロファイル(年齢、性別、民族性、購入履歴、場所)、および同様の広告へのエンゲージメントまたは拒否の履歴など、トピックに対するユーザの興味に関する。いくつかの係数は、最近の会話状態履歴または最近アクセスされた分野からのキーワードなど、最近の会話に関する。
ユーザが掲載装置を使用することを思いとどまらせる広告の尤度を推定することは、様々な係数を有する重み付き関数であり得る。いくつかの係数は、会話がない時間に割り込みがあったかどうか、会話の仮定された終わりに割り込みがあったかどうか、または会話の途中に割り込みがあったかどうかなど、割り込みの種類、および、会話が些細な会話かどうか(たとえば、「good morning(おはようございます)」)、情報を提供する会話であるかどうか(たとえば、「what's the weather and when is my next meeting?(天気
はどうですか、私の次のミーティングはいつですか?)」)、またはアクティブな会話であるかどうか(たとえば、「call my friend(友達に電話して)」)など、会話の種類に関する。いくつかの係数は、「shut up(うるさい)」など、広告に対するユーザ応答の
履歴に関する。いくつかの係数は、広告の長さ、返答を送信するよう要求する広告であるかどうか、割り込み可能な広告であるかどうか、含んでいる要素の種類(たとえば、読み上げテキスト、音楽、映像など)など、広告の押しつけがましさの程度に関する。
会話状態
広告は、広告が配信された時に潜在顧客が思っていることに最も関係する場合、最も有効である。広告がそのコンテンツが潜在顧客の直接の状況または会話の直接のトピックに一致するときに配信される以上に適切な場合はない。広告は、いつ何どき潜在顧客が何を思っているかを示す、今日利用可能な最良のインジケータである。
いくつかの実施形態は、広告の紹介メッセージに、時間、位置、ユーザプロファイル、および会話状態などのコンテキストによって条件付けられた(conditioned)コンテンツ
を含ませる。たとえば、紹介メッセージは、時刻によって、「good morning(おはようございます)」、「good afternoon(こんにちは)」、または「good evening(こんばんは)」と話すことから始まってもよい。紹介メッセージは、「did you know that they have the new Star brand toothpaste at Wal-Mart?(Wal−Mart(登録商標)にSt
arブランドの新しい歯磨き粉があることを知っていましたか?)」または、「did you know that they have the new Star brand toothpaste at Carrefour?(Carrefo
ur(登録商標)にStarブランドの新しい歯磨き粉があることを知っていましたか?)」など、位置によって店の名前を変えて、製品を提供する最寄りの店の名前を言ってもよい。紹介メッセージは、ユーザプロファイルに基づいて潜在顧客の名前を言ってもよい。たとえば、「hey, Maria, did you hear about the new Star brand toothpaste?(こ
んにちは、マリア、Starブランドの新しい歯磨き粉について聞きましたか?)」、または「hey, Mario, did you hear about the new Star brand toothpaste?(こんにちは
、マリオ、Starブランドの新しい歯磨き粉について聞きましたか?)」。紹介メッセージは、イーグルスの試合の得点の要求があった後に、「before you go to the next Eagles game you should try the new Star brand toothpaste(次のイーグルスの試合に行く前に、Starブランドの新しい歯磨き粉を試してみてください)」、または、新しい服を買うときに、「before you go to tomorrow's party, you should try the new Star
brand toothpaste(明日のパーティに行く前に、Starブランドの新しい歯磨き粉を
試してみてください)」など、最近の会話状態に含まれる具体的なエンティティに言及してもよい。
条件付き紹介メッセージコンテンツをサポートするいくつかの実施形態は、範囲に基づいて条件を指定することができる。たとえば、天気予報で気温が20℃と30℃(華氏68度と86度)との間である場合、メッセージは、「check out the new Star Wear styles of activewear(Star Wearの新しいスポーツウェアのスタイルをチェックしてみてください)」であったり、気温予報が30℃(華氏86度)よりも高い場合、メッセージは、「check out the new Star Wear swimsuit lineup(Star Wearの新
しい水着ラインナップをチェックしてみてください)」であったり、気温予報が20℃(華氏68度)よりも低い場合、メッセージは、「check out the new Star Wear down parka collection(Star Wearの新しいダウンパーカコレクションをチェックして
みてください)」であったりする。
いくつかの実施形態は、会話状態に基づいた条件付き広告入札値をサポートする。いくつかの実施形態は、閾値に従った条件付けをサポートし、範囲に従った条件付けをサポートするものもある。いくつかの実施形態は、会話状態以外のコンテキストに基づいた条件付き広告入札値をサポートする。
いくつかの実施形態では、会話状態は、文法に関連する変数および値を格納するデータ構造である。いくつかの実施形態は、特定の回数の会話的対話の番が終わった後、会話状態変数を削除する。いくつかの実施形態は、会話状態にタイムスタンプを含み、一定の時間の後、会話状態変数を削除する。いくつかの実施形態は、変数の種類またはその値によって、異なる対話の番の回数または時間を利用してもよい。
いくつかの実施形態は、会話状態に格納された様々な表現に関連付けられた1つ以上の感情値を含む。いくつかの実施形態は、人間とマシンとのインタフェースの環境でのムードを表す現在のムード変数を保持する。
いくつかの実施形態は、広告エクスペリエンスを開始するときに会話状態を保存し、広告会話を終了するときに、当該広告エクスペリエンスを配信する前の状態に会話状態を戻す。
いくつかの実施形態は、会話状態変数をサーバ上に保持する。いくつかの実施形態は、会話状態変数をクライアントデバイス上に保持する。いくつかの実施形態は、クライアントとサーバとの間で送られた各人間の表現およびマシンの応答を有する会話状態を転送す
る。
複数の装置を通じて1つの仮想エージェントとやり取りしている潜在顧客にシームレスなエクスペリエンスを提供するために、いくつかの実施形態は、異なるアプリまたは異なる装置間の会話状態を共有する。
図3は、左側の潜在顧客と右側の会話型装置との対話の例を示す図である。まず、潜在顧客が、「what's the score of the eagles game(イーグルスの試合の得点は何点です
か)」と尋ねる。装置は、分野文法の大規模配列に従って音声認識および自然言語解釈を行う。分野文法のいくつかはローカルに、いくつかはリモートサーバ上にある。装置は、「Eagles(イーグルス)」をスポーツチームの名前として認識し、当該認識および「score(得点)」という言葉を問い合わせが用いたことに基づいて、問い合わせがスポーツに
ついてであると解釈する。装置は、ライブスポーツ情報のプロバイダのウェブAPIに要求を送信する。ウェブAPIは、イーグルスが現在ホークスに対して積極的に試合を行っていると特定する。プロバイダは、APIを通して、得点は「5-7(5対7)」であると
装置に応答する。装置は、「eagles 5 hawks 7(イーグルスが5得点、ホークスが7得点です)」と読み上げる自然言語による応答を潜在顧客に伝える。
次に、潜在顧客は、「text what's up to 555-1234(555−1234に最近どうですか、とテキストを送る)」よう装置に指示する。装置は、この表現を解釈し、SMS分野で高スコアであると理解する。装置は、SMSウェブAPIプロバイダへの呼び出しを利用してこの表現を構文解析し、「what's up(最近どうですか)」は、テキストのメッセ
ージであり、「555-1234」は、テキストが送信される先の電話番号であると判断する。ウェブAPIは、装置に確認応答を提供し、装置は、「message sent(メッセージが送信されました)」という自然言語による応答を潜在顧客に提供する。
潜在顧客は、続いて、「where can I get some toothpaste(どこで歯磨き粉を買えま
すか)」と尋ねる。装置は、これがショッピング分野で高スコアであると解釈し、地理的位置サービスソフトウェア機能から位置を読み出し、小売店舗の地理的位置を示す地図のプロバイダに位置情報を送信する。装置は、続いて、APIにアクセスし、小売店舗、この場合、歯磨き粉の在庫があると肯定応答するStar−Mart、が見つかるまで、装置の地理的位置から順番に遠くにある小売店舗を探す。装置は、続いて、「there's toothpaste at Star-Mart(Star−Martに歯磨き粉があります)」という自然言語に
よる応答を提供する。
次に、潜在顧客は、「will it rain tomorrow(明日は雨ですか)」と尋ねる。装置は
、これを天気分野で高スコアであると解釈し、天気情報プロバイダAPIにアクセスして地域の天気予報を得、「no(いいえ)」と返答する。潜在顧客は、続いて、「what's the
capital of France(フランスの首都はどこですか)」と尋ねる。装置は、これをウィキペディアについての質問として解釈し、ウィキペディアAPIに、フランスのウィキペディア記事に含まれる首都情報の要求を送信し、「Paris(パリ)」という応答を得る。装
置は、「Paris is the capital of France(パリがフランスの首都です)」という自然言語による応答を提供する。
この会話の間、装置は、会話状態の変数および値の配列を作る。最初の問い合わせの結果、システムは、イーグルスという値を有する変数sports_team、および得点という値を有する変数sports_requestを会話状態に追加する。それは、システムがスポーツウェブAPIにアクセスして応答を得るために使用する情報である。応答は、装置が会話状態に格納する2つの情報から構成される。具体的には、ホークスという値を有する対戦相手という変数、および5−7という値を有する変数score_va
lueという情報である。第2のやり取りの結果、装置は、text_message=“what’s up”とtext_number=555−1234とを会話状態変数に追加する。3番目のやり取りによって、装置は、shopping_product=toothpaste、shopping_request=nearest_store、およびshopping_response=star−martを格納する。4番目のやり取りによって、装置は、weather_request=will_rain、weather_time=tomorrow、およびweather_response=no_rainを会話状態に追加する。5番目のやり取りによって、装置は、wikipedia_request=capital_city、wikipedia_article=France、およびwikipedia_answer=Parisを会話状態に追加する。
また、装置は、様々な広告ユニットについての入札関数の配列を保持する。配列には、3つの入札関数が含まれており、StarShoes用の広告ユニット、StarPaste用の広告ユニット、およびStarTheater用の広告ユニットの各々について1つの入札関数が含まれている。広告入札関数には、広告ユニットを配信するために申し込まれた金額が記載されている。いくつかの実施形態は、広告ユニット配信1000回分の通貨単位の入札を受け付ける。いくつかの実施形態は、図3に示す広告入札関数よりも複雑な広告入札関数をサポートし、かつ、処理する傾向にある。
会話状態は変数shopping_productを含んでいるが、それは、=shoes(靴)ではないので、StarShoes広告入札は、0.3金額分である。会話状態がshopping_product変数を含み、その値がtoothpasteであるので、StarPaste広告入札は、0.9金額分である。会話状態はwikipedia_request変数を含んでいるが、その値がperson_ageではないので、StarTheater広告入札は、0.8金額分である。そのため、StarPasteが、最高入札関数値を有する広告ユニットである。
特定の沈黙期間の後、装置は、StarPasteの広告ユニットの紹介メッセージを配信する。紹介メッセージは、「did you know that StarPaste is on sale at Star-Mart for just 2 bitcoins?(StarPasteがStar−Martでたった2ビットコインでセール中であることを知っていましたか?)」と話すTTSによって生成された自然言語音声である。これによって、この広告に潜在顧客を関与させる。
図4は、実施形態に係るプロセスを示す図である。段階41では、パブリッシャは、表現を受信し、文法42および会話状態変数43の配列に従ってこの表現を解釈する。したがって、パブリッシャはインテントを生み出す。段階44では、パブリッシャは、インテントが指定するアクションを行う。また、解釈段階では、具体的なエンティティへの参照も作られる。エンティティは、パブリッシャが会話状態変数43の配列に格納する。一方で、段階45では、複数の広告ユニットを受信する。会話状態43を背景に当該広告ユニットの入札が分析される。したがって、段階45における分析により、最高入札の広告ユニットが選ばれ、その紹介メッセージが出力される。この目的は、潜在顧客が広告ユニットの文法に一致する表現をするよう潜在顧客を関与させることである。
ムード
広告に出くわすと、潜在顧客は、広告に出くわしたときの潜在顧客の感情に従って、広告に出ている製品またはサービスに対して心情を持つ。潜在顧客の現在の感情を最もよく瞬時に計測するのは、情動検出である。自然言語、音声韻律、カメラ入力、および人々の情動を推定するためのその他の形態のセンサおよびアルゴリズムを利用する多くの情動検出アルゴリズムが存在する。情動が人の性質であるのに対し、ムードは、人同士または人
とマシンとのやり取りの周囲の性質である。
いくつかの実施形態は、ムードを検出し、ムードに基づいて条件付きで広告ユニット紹介メッセージを配信する。いくつかの実施形態は、紹介メッセージコンテンツなど、ムードによって条件付けられた広告コンテンツをサポートする。いくつかの実施形態は、ムードによって条件付けられた広告入札値をサポートする。いくつかの実施形態は、閾値に従った条件付けをサポートし、連続値に従った条件付けをサポートするものもある。いくつかの実施形態は、ムードを頻繁に再評価し、いくつかの実施形態は、ムードを時折再評価する。
ムードを用いて広告の配信を条件付けることによって、広告主は、広告に出ている製品およびサービスに対して潜在顧客が持つ心情を制御できるようになる。
原稿による会話
いくつかの実施形態の会話型広告は、原稿に従って潜在顧客を誘導する。いくつかの実施形態では、原稿は、複数の条件会話経路を有し得、マシンは、明瞭な選択肢を提案する。たとえば、マシンは、「would you like to know more about the health benefits, the flavor, or the brightness of StarPaste?(Starpasteの健康上の利点、フレーバー、または白さについてさらに知りたいですか?)」と尋ねてもよい。
紹介メッセージの目的はエンゲージメントを実現することである一方、原稿は、潜在顧客がエンゲージメントを購入にコンバートするよう促すことができる。異なる潜在顧客は異なる興味を持っている。彼らの自然言語による対話を分析することによって、原稿による広告ユニットは、潜在顧客を分類することができる。潜在顧客を分類することによって、原稿は、最も効果的に潜在顧客をコンバートするよう促す情報を提供することができる。
いくつかの実施形態では、マシンは、潜在顧客の反応からコツコツと集めた情報を用いて、潜在顧客の考えおよび感情の瞬間の状態をプロファイリングする。たとえば、潜在顧客が通常よりも早くかつ大きな声で話をした場合、広告は、落ち着かせる言葉を述べてもよい。別の例として、最近の会話がお金についてであると会話状態が示した場合、広告は、値引き価格についての情報を提供してもよい。
潜在顧客がどのように広告に関与するかを知ることは、広告主および仲介者にとって有用であり得る。いくつかの実施形態は、対話スクリプトの各ステップにおいて、人間とマシンとのインタフェースからのフィードバックをパブリッシャ、仲介者、または広告主に送信する。いくつかの実施形態では、フィードバックは、原稿の位置を示す。いくつかの実施形態では、フィードバックは、キャプチャされた潜在顧客の表現を文字に起こしたものまたはオーディオ録音を含む。いくつかの実施形態は、個人を特定する情報を含む。いくつかの実施形態は、さらなる情報について広告主または仲介者に割り増し金額を請求する。
図5は、広告対話スクリプトの実施形態を示す図である。広告対話スクリプトは、「did you hear about the new StarPaste?(新しいStarPasteについて聞きました
か?)」と潜在顧客に話す紹介メッセージ51から開始する。インタフェースは、続いて、潜在顧客の表現が認識されるのを待ち、受信した表現を広告ユニット文法に一致させる。表現が、「don't care(どうでもいい)」、「shut up(うるさい)」、または沈黙な
どの表現を含んだ無関心を示す文法に一致した場合、原稿は、「sorry(すみません)」
と言って返答して会話を終了し、インタフェース装置は、結果のフィードバックを広告主に送信する。
紹介メッセージ51の後、広告53以外の分野で有力なスコアに潜在顧客の表現が一致した場合、原稿は、広告会話を終了し、インタフェースは、結果のフィードバックを広告主に送信し、インタフェースは、当該他の分野の会話に進む。
紹介メッセージ51の後、「tell me more(もっと教えてください)」または「what about it(それは何ですか)」など、エンゲージメント54を示す文法に潜在顧客の表現
が一致した場合、原稿は、続いて、「it gives a healthier mouth and more sparkle(
より健康な口とさらなるきらめきが手に入ります)」というメッセージである返信用コンテンツアイテムを提供する。原稿は、潜在顧客を、見た目よりも健康に興味があるまたはその逆の潜在顧客として分類することを要求する。メッセージは、健康を気にする潜在顧客にアピールする情報(「healthier mouth(より健康な口)」)、または、見た目を気
にする潜在顧客にアピールする情報(「more sparkle(さらなるきらめき)」)を含む。
潜在顧客の次の表現が、経路55において、「healthy how?(どう健康なのですか?)」または「does it have fluoride?(フッ素が入っていますか?)」などと言うことによって健康に関する文法に一致した場合、原稿は、健康を気にする潜在顧客が前へ進むよう仕向けるためのメッセージで返答する。「dentist recommended with double fluoride(ダブルフッ素で医者が推奨しています)」というメッセージである。経路56において、「brighter how?(どう白くなるのですか?)」または「what about breath?(息はどう
ですか?)」などと言うことによって潜在顧客の次の表現が見た目に関する文法に近づいた場合、原稿は、見た目を気にする潜在顧客が前へ進むよう仕向けるためのメッセージで返答する。「number 1 in Hollywood for shiny fresh breath(輝くフレッシュな息でハリウッドでナンバーワンです)」というメッセージである。
経路55または経路56を取った後、原稿は、続いて、「StarPaste is on sale now at Star-Mart for just 2 bitcoins(只今、StarpasteがStar−Martで
たった2ビットコインでセール中です)」と言うメッセージ57を用いて、潜在顧客が購入にコンバートするよう促す。この時点で、原稿は会話を終了し、インタフェースは、対応するフィードバックを広告主に送る。
いくつかの実施形態は、多くの条件経路と、多次元の潜在顧客分類と、条件付きの個人向けメッセージコンテンツとを有するはるかに複雑な原稿をサポートし、いくつかの広告ユニットは、当該原稿を規定する。
プライバシー
いくつかの実施形態は、他の人が広告の紹介メッセージを聞いたり見たりしたら潜在顧客を困らせたり恥ずかしい思いをさせるような広告を配信し得る。たとえば、いくつかの広告は、サプライズパーティ用の贈り物についての広告であり得、いくつかの広告は、個人の疾患を治療する製品についての広告であり得、いくつかの広告は、好色な趣味を供給するサービスについての広告であり得る。
いくつかの実施形態は、広告または広告入札を、ターゲットの潜在顧客以外の人の存在によって条件付けることができる。いくつかの実施形態は、カメラおよび人を検出するための画像処理を用いてこの条件付けを行う。いくつかの実施形態は、オーディオ音声区別アルゴリズムを用いて複数の話し手が存在するかどうかを検出する。いくつかの実施形態は、Bluetooth(登録商標)、Wi−Fiなど、個人用の持ち運び可能な電子デバイスからの無線信号の送信、または携帯電話からの移動体通信ネットワーク信号を検出する。
他の人の存在を検出するいくつかの実施形態は、他の人が存在する場合、プライバシーレベル変数を下げる。いくつかのこのような実施形態は、画像処理または声の特徴付けを利用して、男性もしくは女性、または成人もしくは子供が存在するかどうかを判断するなど、存在している人の属性を検出する。
いくつかの実施形態は、自然言語による人間とマシンとのインタフェースがヘッドホン、ウェアラブル装置、または個人用携帯電話端末など、個人用インタフェースによるものである場合、プライバシーレベル変数を上げる。
いくつかの実施形態は、広告ユニットコードを構文解析し、広告ユニットに関連付けられたプライバシーレベル要件を検出する。当該実施形態は、広告を表示させるだけであり、いくつかの実施形態では、現在のプライバシーレベルが広告ユニットコードにおいて規定されたレベル以上である場合、入札の際に広告のみが考慮される。
インテントおよびアクション
自然言語理解システムは、表現を解釈してインテントを判断する。インテントは、話し手がマシンに行ってもらいたいアクションを表し得るデータ構造である。いくつかの実施形態では、解釈は、システム設計者によって作成されたものなど、コンテキストを含まない文法規則に従って行われる。いくつかの実施形態では、解釈は、表現された言葉に統計的言語モデルを適用することによって行われる。これは、訓練済みのニューラルネットワークを利用することによってなど、様々なやり方で行うことができる。
いくつかの実施形態によれば、インタラクティブな自然言語による広告は、潜在顧客が表現する言葉に応じた具体的なインテントを規定する規則を有する文法を含む。たとえば、文法は、「tell me more(もっと教えてください)」という言葉を、追加情報を要求するインテントとして認識してもよい。これは、広告の製品またはサービスについてより多くの情報を配信するアクションを行うようインタフェースに要求することを意味する。文法は、「shut up(うるさい)」という言葉を、広告会話を終了するアクションを要求す
るインテントとして認識してもよい。携帯電話広告についての文法は、「how's its battery life(バッテリ寿命はどうですか)」という言葉を、広告に出ている電話機のバッテリ容量および電力消費についての具体的な情報を求める要求として認識してもよい。文法は、「get it(手に入れて)」という言葉を、広告に出ている製品またはサービスを注文するアクションを要求するインテントとして認識してもよい。
自然言語文法のインテントによって規定されたアクションを行うための手段をたくさん利用することができる。たとえば、テキストメッセージ送信関数は、テキストメッセージを送信する手段を提供する。発注関数は、広告に出ている製品またはサービスの配達を注文する手段を提供する。地図関数は、広告に出ている商品またはサービスを購入できる場所までの行き方を潜在顧客に教える手段を提供する。ブラウザは、広告に出ている商品またはサービスについての、HTML(Hypertext Markup Language)およびCSS(Cascading Style Sheet)などのウェブコンテンツを提示するための手段を提供する。また、ブラウザは、JavaScript(登録商標)言語で書かれた原稿など、特定の種類の原稿を実行するための手段を提供する。このような原稿は、コンピュータに、コンピュータができる任意のアクションを実行させることができる。自動運転車両は、広告に出ている商品またはサービスを購入するための場所に潜在顧客を輸送する手段を提供する。それぞれ異なる用途の実施形態のためにインテントが示すアクションを適切に実行するための様々な手段が、当業者に明らかになるだろう。
様々な実施形態は、インテントが示すアクションを、可能な範囲で実行する。いくつか
の実施形態は、意図されたアクションを実行できない場合、潜在顧客、広告主、またはその両方に対して、実行できない旨返答する。
入札
いくつかの実施形態によれば、在庫は、パブリッシャが販売することができる広告スペース/時間である。入手可能な在庫に広告入札を行うための多くの方法が知られている。
図6は、入札とお金とを含む広告ユニットを広告主62a、62b、62cがパブリッシャ61に提供する実施形態を示す図である。パブリッシャは、望ましいコンテンツと広告とを潜在顧客63a、63b、63cに提供する。うまく行けば、広告コンバージョンが生じ、潜在顧客は広告主からの商品またはサービスにお金を使う。
入札システムは、数多くの仲介者と、広告主とパブリッシャとの間に存在する数多くの種類の仲介者とを含み得る。図7は、広告主72a、72b、72cが広告ユニットをメディアバイヤー75に提供するシステムを示す図である。メディアバイヤー75は、複数のパブリッシャに配分するための広告ユニットを集めてパッケージ化し、価格設定を交渉する者である。通常のメディアバイヤーは、大規模な広告代理店である。メディアバイヤー75は、広告ユニットをトレーディングデスク76に提供し、トレーディングデスク76は、アドエクスチェンジ77上で入札を行う。大規模広告代理店は、トレーディングデスクを有している傾向がある。アドエクスチェンジ77は、広告ユニット入札を在庫と一致させ、プログラムによるオークション価格設定で市場を創る。AppNexus(登録商標)がアドエクスチェンジの例である。別の経路では、別の広告主72dおよびメディアバイヤー75が広告ネットワーク74に広告ユニットを提供する。Google(登録商標)AdWords(登録商標)が広告ネットワークの例である。広告ネットワークは、入手可能な在庫内での広告の自動発注を容易にする。パブリッシャ71は、エクスチェンジ77および広告ネットワーク74上で在庫を提供して、潜在顧客73a、73b、73cに配信する。
いくつかのアドエクスチェンジは、プログラムによる入札を実施する。プログラムによる入札は、広告市場に高い流動性をもたらす。様々な実施形態におけるプログラムによる入札は、ユーザプロファイル、現在地、位置履歴、現在の活動、時刻、曜日、時期、最近配信された広告の種類、会話状態に含まれる情報の種類、会話状態に含まれる情報の具体的な値、ムード、感情、および神経活動パターンによって異なる。
いくつかの実施形態によれば、パブリッシャは、人間とマシンとの間の会話型インタフェースについての会話状態を保持する。パブリッシャは、広告に対する入札を、人間とマシンとの間の会話型インタフェースと関連させて分析する。入札は、会話状態変数の興味値を示し、興味会話状態変数値を有する少なくとも1つの現在の会話状態変数の影響を受ける。
いくつかの実施形態は、会話状態に含まれるキーワードの存在に基づいて入札をサポートする。いくつかの実施形態は、会話状態に含まれる会話の特定の分野の存在に基づいて入札をサポートする。たとえば、天気はある分野であり、スポーツは別の分野である。いくつかの実施形態は、会話状態内の特定の変数の存在に基づいて入札をサポートする。たとえば、sports_teamは、変数である。いくつかの実施形態は、変数の具体的な値に基づいて入札をサポートする。たとえば、「eagles(イーグルス)」は、変数sports_teamの値であり得る。いくつかの実施形態は、変数sports_teamsの値としての「eagles(イーグルス)」、「hawks(ホークス)」、および「falcons(ファルコンズ)」など、変数のあり得る値のセットに基づいて入札をサポートする。いくつかの実施形態は、20℃と30℃(華氏68度〜86度)との間の値を有する気温変
数など、数値変数の値の範囲に基づいて入札をサポートする。いくつかの実施形態は、上記基準の組み合わせに基づいて入札をサポートする。いくつかの実施形態は、変数の種類、具体的な値、値のセット、および範囲の存在のうちのいずれかのプログラムによる式として、入札を指定することをサポートする。このような式は、入札と会話状態との一致の程度を決定する。また、式は、上述した係数に基づいて、入札値に対する悪影響を表現し得る。
いくつかの実施形態は、ムードに基づいて入札をサポートする。このような実施形態は、人間とマシンとのインタフェースにおいて現在のムード値を検出し、ムード値を背景に入札を評価する。いくつかの実施形態は、外部で計算されたムード値を受け付け、この値を用いて、計算された入札値に影響を与える。
いくつかの実施形態は、潜在顧客がプライベートなリスニング環境にいるかどうかによって条件付けられた入札をサポートする。このような実施形態は、この環境を検出し、それに応じて入札値を計算する。いくつかのこのような実施形態は、ほかの人の存在を検出することによってリスニング環境を判断する。
いくつかの実施形態は、人間とマシンとのインタフェースにおいて音声活動検出を行い、音声活動がない場合にのみ、広告紹介メッセージを出力する。いくつかの実施形態は、広告紹介メッセージを出力する前、音声活動を検出しなかった後、一定の時間待機する。
いくつかの実施形態は、自然言語表現の具体的なインテントに基づいて入札をサポートする。いくつかの実施形態は、1つ以上のインテントによって引き起こされた具体的なアクションに基づいて入札をサポートする。
いくつかの実施形態は、エンゲージメントが生じた場合にのみ、広告主に入札に対する代金を請求する。いくつかの実施形態は、コンバージョンが生じた場合にのみ広告主に代金を請求する。いくつかの実施形態は、コンバージョンまたはエンゲージメントからの解放の前に潜在顧客が広告と何回やり取りを行っていたかに基づいて、広告主に代金を請求する。いくつかの実施形態は、潜在顧客が価格要求を行うかどうか、または、潜在顧客が否定的な感情を表現するかどうかなど、潜在顧客がどのような種類のやり取りを行っているかに基づいて広告主に代金を請求する。
いくつかの実施形態は、入札を規定する方法、および、入札を分析する方法である。いくつかの実施形態は、入札の分析を行うシステムである。いくつかの実施形態は、入札または入札関数を格納する非一時的なコンピュータ読み取り可能な媒体である。
フィードバックおよびアナリティクス
潜在顧客の現在の心理状態、考えているまさにそのトピック、および潜在顧客の考えの具体的な対象を知ることは、広告主およびアナリティクス会社によるオフライン分析にとって、非常に価値がある。しかしながら、このような情報をリアルタイムで知ることのほうがはるかに価値がある。
クリックに基づく広告フィードバックが潜在顧客の心理状態、トピック、および思考の対象を判断することは、いつも、難しく、複雑であり、精度が低い。電子メールメッセージのコンテンツを処理することなどによる潜在顧客のコミュニケーションの自然言語処理は、心理状態、トピック、および思考の対象を判断するのに有用である。しかしながら、これは、リアルタイムではない。
いくつかの実施形態は、自然言語による会話をリアルタイムで処理することによって、
広告ターゲティングにとって非常に価値のある情報を抽出する。このような情報は、会話型広告ユニット用のリアルタイム入札アルゴリズムに応用された場合、有用である。また、このような情報は、人間とマシンとのやり取りからフィードバックされた場合、広告主にとって有用である。
いくつかの実施形態は、潜在顧客からの自然言語表現を解釈することによってリアルタイム入札のために情報をフィードバックし、インテントデータ構造を作成する。続いて、インテントデータ構造を分析し、分析結果をリアルタイムで導出する。次に、分析結果を広告主のリアルタイム入札に提供する。
いくつかの実施形態は、エンゲージメントまたはコンバージョンが生じたかどうかなどのフィードバックを表現ごとに提供する。いくつかの実施形態は、広告の会話ごとにフィードバックを提供する。
いくつかの実施形態では、分析結果は、インテントの表示を含む。分析結果を有するいくつかの実施形態は、エンゲージメントの前に、会話の分野の表示をフィードバックする。分析結果を有するいくつかの実施形態は、広告インタラクションの直後に会話の分野の表示をフィードバックする。
いくつかの実施形態は、個人を特定する情報を広告主にフィードバックする。いくつかの実施形態は、具体的には、個人を特定する情報を隠す。そうする理由の一つは、システムユーザのプライバシーを保証するためである。個人を特定する情報の別の使用方法は、匿名潜在顧客インタラクション分析(アナリティクス)に対する支払い額よりも高い支払い額で広告主にこの情報を売ることである。
いくつかの実施形態は、トピック、インテント、意味情報、ムード/情動、尋ねられた質問、エンゲージメント率、その他のエンゲージメント評価指標、広告のコンバージョン率ならびに広告カテゴリ、リーチ、配信、費やされた額、および他のコンバージョン評価指標についてのフィードバックアナリティクスを利用する。アナリティクスは、競合する広告入札の配列に含まれるどの広告/どれくらいの広告が、広告ユニット配信の条件に一致するかを含み得る。これにより、広告を配信するタイミングを決定する機能が向上する。
プロクター・アンド・ギャンブル(登録商標))は、FMOT(First Moment Of Truth)を潜在顧客が製品を購入する時と定義し、SMOT(Second Moment Of Truth)を潜在顧客が製品を最初に使う時と定義している。Google(登録商標)は、ZMOT(Zero Moment Of Truth)を潜在顧客がある種類の製品についての情報を最初に検索する時と定義している。いくつかのキーとなる問い合わせ表現はZMOTを示し、「・・・を見せてください」または「・・・はどこで手に入れることができますか」などである。自然言語解釈から導出されたいくつかのインテントは、ZMOTを示す。製品またはサービスについてのリサーチに関連するインテントを作成する文法に、数多くの言語パターンが一致し得る。
いくつかの実施形態は、人間とマシンとのインタフェースにおける自然言語によるやり取りを監視することによって、広告機会を特定する。当該実施形態は、自然言語表現を解釈してZMOTインテントを特定する。このような時に、このような実施形態は、問い合わせにおいてまたは会話状態において言及された製品またはサービスの種類を特定し、言及された製品またはサービスを特定すると、この製品またはサービスについての広告入札を通知し、そのタイムリーな関連性を理由に広告配信価格を上げる。いくつかのこのような実施形態は、続いて、入札によって特定された広告ユニットを配信する。いくつかのこ
のような実施形態は、製品またはサービスの広告ユニットの紹介メッセージを配信する。いくつかのこのような実施形態は、続いて、潜在顧客から表現の返信を受信し、それらを文法に一致させる。
図8は、実施形態の広告会話シナリオに従う、広告主と、仲介者と、パブリッシャと、潜在顧客との間の情報フローのタイムラインを示す図である。時間t0において、会話が開始する前に、広告主は、広告ユニットを仲介者に提供する。仲介者は、オークションプロセスにおける広告ユニットへの入札に基づいて広告ユニットの価格を決定する。
時間t0よりもかなり後であり得る時間t1において、パブリッシャは、落札価格を有する広告ユニットを特定する。具体的には、パブリッシャは、潜在顧客からの表現に基づいて少なくとも1つの広告ユニットを決定する。一実施形態において、パブリッシャは、潜在顧客からの表現に一致する文法を含んだ広告ユニットを決定する。各広告ユニットは、1つの文法と1つ以上の入札とを含む。入札の各々は、少なくとも1つのインテントに関連付けられる。パブリッシャは、各広告ユニットに含まれる文法を用いて、潜在顧客からの表現に含まれる少なくとも1つのインテントを決定する。次に、パブリッシャは、潜在顧客からの表現に一致した決定された広告ユニットの1つ以上の入札の中から、1つの入札を選択し、選択された入札に基づいて動的価格設定情報を決定する。一例において、広告ユニットについて、パブリッシャは、「[can you | please] text [me] a link [to me]([私に]リンクを[私に]テキスト送信[できますか|お願いします])」に対応
するインテントへの入札よりも、「見せて」に対応するインテントへの入札を高くするよう決定する。別の実施形態では、各広告ユニットは、分野を規定する文法を含む。パブリッシャは、決定された広告ユニットの文法によって規定された表現の分野を決定する。次に、パブリッシャは、決定された広告ユニットへの入札を決定し、決定された入札に基づいて動的価格設定情報を決定する。一例において、広告ユニットについて、パブリッシャは、「sports(スポーツ)」分野への入札よりも「weather(天気)」分野への入札を高
くするよう決定する。パブリッシャは、続いて、時間t2において、仲介者および広告主にメタ情報を提供する。メタ情報は、落札広告ID、会話状態、直近の会話の分野、および広告を選んでいるときのムード、潜在顧客の地理的位置およびユーザプロファイル、ならびにZMOT広告配信手数料があるかどうかなどの動的価格設定情報を含み得る。
その後すぐ、時間t3において、パブリッシャは、広告ユニットの紹介メッセージを配信する。このシナリオにおいて、潜在顧客は、ブラウザ広告用語を用いた場合、音声クリック(spoken click)(スリック(slick))としても知られるエンゲージメントの音声
表現を提供する。スリックは、広告に出ている製品の価格設定についての具体的な情報を要求する。時間t5において、パブリッシャは、価格設定情報についてのウェブAPI要求を広告主に送信する。時間t6において、広告主は、ウェブAPI応答を、TTS応答用のマークアップテキストとともにパブリッシャに提供する。時間t7において、パブリッシャは、パブリッシャの人間とマシンとのインタフェース装置に内蔵されたTTSソフトウェアを用いて音声をマシンの典型的な音声に合成し、合成された音声をスピーカから出力する。
時間t8において、潜在顧客は、第2のスリックを提供し、注文をするよう求める。時間t9において、パブリッシャは、注文を履行するためのウェブAPI要求を仲介者に対して行う。注文を履行する仲介者は、注文を配達するために処理し、時間t10において、ウェブAPI応答をパブリッシャに提供する。時間t11において、パブリッシャは、注文の受領を電子メールで送信するアクションを行い、注文を確認するTTS応答を潜在顧客に提供する。
時間t12において、パブリッシャは、アナリティクスに使用するためにコンバージョ
ンを広告主に報告し、パブリッシャは、感謝するメッセージをTTS音声として出力する。
「ボイラープレート」
様々な実施形態は、人間とマシンとのインタフェース装置、およびパブリッシャ役、広告主役、および仲介者役用の1つ以上の接続されたサーバの様々な配置を有する。一実施形態において、1つの装置は、少なくとも1つの広告ユニットを備えた広告サーバと通信する。
別の実施形態では、広告主は、異なるオフィスに複数の事業部を持っており、文法を開発するプログラマを抱えている広告主もいれば、広告コンテンツを開発するアーティストを抱えている広告主もいれば、文法とコンテンツとを組み合わせて広告ユニットし、広告ユニットを組み合わせてキャンペーンにする広告部門を抱えている広告主もいる。広告主は、広告代理店に広告を渡し、広告代理店は、広告をデータベースサーバ上に格納し、他の仲介者とやり取りするメディアバイヤーによって当該広告にアクセスする。メディアバイヤーは、広告および入札を広告ネットワークに、そして供給側ネットワークを管理するサードバーティのトレーディングデスクに配信する。トレーディングデスクは、サードバーティエクスチェンジに広告入札を配信し、サードバーティエクスチェンジは、入札を在庫に一致させる。落札された広告ユニットは、装置を通して短い待機時間で潜在顧客にアクセスするために地理的に分散したサーバを有するパブリッシャに送られる。広告ユニットは、異なる消費者製品メーカーによって設計された異なる種類の装置上にローカルに格納され、広告ユニットのコンテンツは、パブリッシャの管理の下、潜在顧客に配信される。
図9は、実施形態を示す図である。潜在顧客91は、パブリッシャ装置92と通信を行う。パブリッシャ装置92は、音声コンテンツを潜在顧客91に配信するスピーカ93を備える。パブリッシャ装置92は、マイクロフォン94をさらに備える。マイクロフォン94は、潜在顧客91からの自然言語音声を含むオーディオを受信する。
パブリッシャ装置92は、ネットワーク95を通じて、広告サーバ96と通信を行う。広告サーバ96は、広告ユニットを配信し、広告入札関数を実行して、配信するのに最も価値のある広告ユニットを選択する。
図10Aは、コンピュータコードを格納する非一時的なコンピュータ読み取り可能な回転ディスク媒体101を示す図である。コンピュータコードは、コンピュータプロセッサによって実行されると、コンピュータプロセッサに、本明細書に記載の方法および一部の方法ステップを実行させる。
図10Bは、コンピュータコードを格納する非一時的なコンピュータ読み取り可能なフラッシュRAM(Random Access Memory)チップ媒体102を示す図である。コンピュータコードは、コンピュータプロセッサによって実行されると、コンピュータプロセッサに、本明細書に記載の方法および一部の方法ステップを実行させる。
図10Cは、いくつかの実施形態のコンポーネントを備え、コンピュータコードを実行することによって本明細書に記載の方法または一部の方法ステップを実行する、複数のコンピュータプロセッサコアを備えたパッケージ化されたSoC(System−On−Chip)103の下(はんだボール)側を示す図である。図10Dは、SoC103の上側を示す図である。
図11は、様々な実施形態の構成要素として使用されるラックベースのサーバシステム
111を示す図である。このようなサーバは、広告主サーバ、パブリッシャサーバ、および様々な仲介者の機能のためのサーバとして有用である。
図12は、システム・オン・チップ103内のコアのブロック図である。システム・オン・チップ103は、マルチコアコンピュータプロセッサ(CPU)121とマルチコアグラフィックスアクセラレータプロセッサ(GPU)122とを備える。CPU121およびGPU122は、ネットワーク・オン・チップ123を通してDRAMインタフェース124およびフラッシュRAMインタフェース125に接続される。ディスプレイインタフェース126は、ディスプレイを制御し、MPEG(Motion Picture
Experts Group)映像およびJPEG(Joint Picture Experts Group)静止画像広告コンテンツをシステムが出力するのを可能にする。I/Oインタフェース127は、SoC103が制御する装置が備える人間とマシンとのインタフェースのスピーカおよびマイクロフォンアクセスを提供する。ネットワークインタフェース128は、装置がインターネットでサーバと通信を行うためのアクセスを提供する。
図13は、サーバ111の実施形態を示す図である。マルチプロセッサCPUアレイ131およびGPUアレイ132は、コンピュータコードを格納するDRAMサブシステム134、および他のサーバまたはパブリッシャ装置へのインターネットアクセスを提供するネットワークインタフェース135に、基板レベル配線133を通して接続される。
装置の様々な実施形態を用いてインタラクティブな自然言語による広告を掲載することができる。平凡な広告もあれば、好奇心をそそる広告もある。
図14Aは、エキサイティングな人間型ロボットアシスタント自然言語会話型掲載装置11の構成要素を示す図である。オーディオを出力するために、装置11は、両側にスピーカ142を備える。装置は、マイクロフォンアレイ143を備える。マイクロフォンアレイ143は、異なる遅延量の音声を受信するよう物理的に配置された、いくつかのMEMS(Microelectromechanical System)マイクロフォンを備える。装置は、マイクロフォンアレイ143を使用して検出された音声の方向を検出するためのDSP(Digital Signal Processing)を行うソフトウェアを実行する内部プロセッサを備える。装置11は、立体画像および映像キャプチャを提供するための2つのカメラを有するモジュール144をさらに備える。さらには、1つ以上の潜在顧客の位置および相対的な向きを検出するために、DSPソフトウェアは、人間の形状について訓練されたモデルに対するニューラルネットワークベースの物体認識を実行する。装置11は、さらに、JPEG静止画像およびMPEG映像ストリームなどのビジュアル広告コンテンツを出力する、いくつかの広告ユニット用の表示画面145を備える。装置11は、車輪146aおよび車輪146bをさらに備える。車輪146aおよび車輪146bは、各々、独立してまたは一致して回転することができる。一致して回転することによって、装置は、潜在顧客の周りをついて回るなど、移動することができる。独立して回転することによって、装置は向きを変えて潜在顧客の方に向いて潜在顧客の動きおよび活動を監視するなどできる。装置11は、さらに、潜在顧客が、装置が煩わしくなったときに装置を黙らせることができる電源スイッチ147を備える。
図14Bは、ホームバーチャルアシスタントおよび音楽再生装置148の実施形態を示す図である。図14Cは、Bluetooth対応のイヤホン装置149の実施形態を示す図である。図14Dは、よくある携帯電話1410の実施形態を示す図である。図14Eは、自動車1411の実施形態を示す図である。
ホームバーチャルアシスタント148などのいくつかの実施形態は、ユーザにプライバ
シーをほとんど与えない。イヤホン149などのいくつかの実施形態は、潜在顧客に優れたプライバシーを与える。携帯電話1410などのいくつかの実施形態は、表示装置画面を有する。いくつかの実施形態は、イヤホン149など、スクリーンレスであり、表示画面を持たない。ホームバーチャルアシスタント148などのいくつかの実施形態は、据え置き型である。自動車1411などのいくつかの実施形態は、可動性である。携帯電話1410などのいくつかの実施形態は、据え置き型である。
広告配信の方法ならびにシステム、およびコンピュータ読み取り可能な媒体の機能によって完全な実施形態が構成されるが、広告のフローに含まれるいくつかの要素は、それぞれ異なる国に存在していてもよい。つまり、広告ユニットまたはそのコンポーネントをそれぞれ異なる国にあるサーバを経由させることで、クレームされた方法、システム、およびコンピュータ読み取り可能な媒体の直接侵害が回避されることはない。
コード例
以下の例示的な広告ユニットコードリスティングは、例示的な広告ユニットについてのコードリスティングである。C言語と同様の構文を用いた専用プログラミング言語を利用する。3〜55行目に入札関数が記述されている。40〜53行目で割り当てられる入札値は、特定のユーザID向けにブロックされているかどうかを条件としている。入札値は、さらに、共有またはパブリックとは対照的に、個人的であるプライバシーレベルを条件としている。入札値は、さらに、閾値よりも大きいムード値によって条件付けられている。入札値は、さらに、会話状態における、6〜8行目で指定される特定の最近の分野の存在によって、プラスの影響を受ける。入札値は、9〜13行目で指定される、会話状態における特定の分野の存在によって、マイナスの影響を受ける。入札は、さらに、最近の会話状態における、15〜27行目で指定されるキーワードの存在によって、プラスおよびマイナスの影響を受ける。入札は、さらに、現在の潜在顧客、環境、およびマシンの状態を記述した特定のメタ情報の存在によって、プラスおよびマイナスの影響を受ける。異なる分野、キーワード、およびメタ情報が入札値に影響する程度は、それぞれ、2.0、1.5、および2.5の割合にスケール変更される。
61〜68行目では、紹介メッセージが記述されている。紹介メッセージには、表示用画像、出力用のオーディオクリップ、および、単語を強調するようマークアップされた読み上げ用のいくつかのテキストへの参照が含まれている。
広告ユニットは、71行目において、不快でないコンテンツに制限される。広告ユニットが割り当てられ、79行目において、パブリッシャから広告主に報告する高レベルの情報が提供される。広告は、82行目においてエンゲージメントなしに会話を終了させることを考える前に、潜在顧客の反応を10.0秒間待機するように構成される。
85〜96行目では、オプションの言葉を有する特定の言い回しを含む文法が規定される。文法インテントは、広告ユニット外で規定された関数または広告ユニット内で規定された関数に対する関数呼び出しである。各行において、インテントは、文法に関連付けられている。一例として、87行目において、「can you | please] text [me] a link [to
me]」が、文法を規定する部分であり、「text_url()」が、この表現のインテントを規定し、かつ、装置11のアクションを規定する部分である。別の例として、94行目において、「i don't care(どうでもいい)」が、文法を規定する部分であり、「set_dont_care()」が、表現のインテントを規定し、かつ、装置11のアクションを規定する部分であ
る。潜在顧客から受信した自然言語表現が85〜96行目の文法のうちの1つ以上の文法に一致すると装置11が判断した場合、装置11は、一致した文法に関連付けられたインテントが当該自然言語表現のインテントであると判断する。
99〜119行目では、映像クリップ、アニメーション、画像、映像ストリーム、ならびに現在の装置の緯度および経度に最も近い街を見つけるなどの条件付きコンテンツがマークアップされたTTSテキストを含むコンテンツ要素が指定される。
122〜167行目では、文法インテントによって呼び出されるカスタム関数が定義される。123〜132行目において、より多くの情報を求める潜在顧客の要求に応答して追加の情報コンテンツのシーケンスを配信するための関数が指定される。134〜137行目では、テキストメッセージを送信するための関数が指定される。139〜142行目では、電子メールメッセージを送信するための関数が指定される。144〜147行目では、広告に出ている製品の特定のSKU(Stock Keeping Unit)番号の価格を調べるための関数が指定される。149〜152行目では、掲載装置が表示画面を有する場合、製品の画像を表示するための関数が指定される。154〜164行目では、SKUが入手可能な最寄りの店、当該最寄りの店での当該製品の価格、および製品が現在セール中であるかどうかを見つけるための関数が指定される。
165〜167行目では、製品に興味がないと潜在顧客が示したかどうかについての表示をユーザIDごとに設定するための関数が指定される。製品に興味がないと潜在顧客が示した場合、その広告はそのユーザIDに対して今後配信されない。
下記の例に示すコードは、いくつかの実施形態のいくつかの機能の例示にすぎない。高度な広告主は、より多くのコードを有する広告ユニット、より高度な入札、より複雑かつ多様な文法、さらなる依存、およびより多くかつより複雑なコンテンツを作成する。いくつかの実施形態は、広告ユニットで使用するために利用可能な他のシステム関数を提供し、より複雑なコード構成をサポートする。
いくつかの実施形態は、それほど高度でない広告主のための簡単なテンプレートを提供する。たとえば、実施形態は、SKUおよびTTS文字列を提供し、値段設定および位置を調べるための機能、ウェブコンテンツを表示するための機能、製品の一般的な問い合わせに回答するための文法を提供するための機能を自動的に提供する。簡単なテンプレートについての広告規定は、下記のようなものである。
BID = 1.5
SKU = 9781542841443
INTRO = "did you hear about the new StarPaste?"
MORE = "it gives a healthier mouth and more sparkle"
システムは、「tell me more」に対してMOREテキストのTTSおよびSKU値を用いた価格設定検索とともに応答することを含む、文法を提供する。
例示的な広告ユニットコードリスティング
1 ad StarPaste {
2 float PPKI = 0.25;//インプレッション1000回あたりのデフォルト価格
3 bid{
4 float mood_min: 0.5;//ムードの閾値を下げる
5 //会話重み付けの分野
6 domain cntxt_domain_pos = {"health",
7 "grocery",
8 "dating"};
9 domain cntxt_domain_neg = {"math",
10 "geography",
11 "MoonPaste",//競合する製品広告
12 "MoonPaste",
13 "MoonPaste"};
14 //キーワード重み付け
15 words cntxt_words_pos = {"smell",
16 "breath",
17 "breath",//反復することによって重みを増やす
18 "breath",
19 "fresh",
20 "date",
21 "night",
22 "sleep",
23 "morning"};
24 words cntxt_words_neg = {"directions",
25 "text",
26 "call",
27 "problem"};
28 //メタ情報重み付け
29 meta cntxt_meta_pos = {"location=US",
30 "gender=female",
31 "age>16",
32 "environment=home",
33 "environment=retail-grocery",
34 "people_present<4",
35 "male_present=FALSE"};
36 meta cntxt_meta_neg = {"time=9to5",
37 "environment=restaurant",
38 "male_present=TRUE"};
39 //ムードが悪い潜在顧客に広告を配信しない
40 float bid_val =
41 check_dont_show(user_id()) ? 0 :
42 (privacy_level < PERSONAL) ? 0 :
43 (mood < mood_min) ? 0 :
44 PPKI * mood
45 //最近の会話分野が否定的な分野よりも肯定的な分野を多く含む場合にのみ
46 //広告を配信する
47 * 2.0*min(count(cntxt_domain_pos) - count(cntxt_domain_neg),0))
48 //最近のキーワードが否定的な分野よりも肯定的な分野を多く含む場合にのみ
49 //広告を配信する
50 * 1.5*min(count(cntxt_words_pos) - count(cntxt_words_neg),0)
51 //最近のメタ情報が否定的な分野よりも肯定的な分野を多く含む場合にのみ
52 //広告を配信する
53 * 2.5*min(count(cntxt_meta_pos) - count(cntxt_meta_neg),0);
54 return bid_val;
55 }
56
57 //紹介メッセージは、
58 //人間とマシンとのインタフェースがスクリーンを有する場合、画像を使用し、
59 //人間とマシンとのインタフェースがTTSサービスを有する場合ttsを使用し、60 //ttsサービスが利用可能でない場合、オーディオを使用する。
61 intro{
62 image = "./media/StarPaste.jpg";//画像コンテンツへの参照
63 //オーディオ出力はあるがTTS機能は有さない装置向け
64 audio = "./media/jingle.mp3";
65 //システムは、グローバルtts文字列変数から音声を出力する
66 tts = "have you heard about the <emphasis level="strong">new
67 </emphasis> Star brand StarPaste?";
68 }
69
70 //不快なコンテンツまたは文法を有する広告をブロックするためのグローバル設定
71 non_offensive_restriction = TRUE;
72
73 //システムに、
74 //1つ1つの会話表現(文法にヒットした会話表現、ほかの文法にヒットしなかった75 //場合、直後の会話表現)を、ユーザID、タイムスタンプ、位置、
76 //言語/アクセント、人の存在(検出された場合、具体的なID、または
77 //具体的な数字および特性)、ムード、会話状態とともに、
78 //広告主に報告させるためのグローバル設定
79 reporting_level = HIGH;
80
81 //応答がない場合の、タイムアウトまでの秒数についてのグローバル設定
82 conversation timeout = 10.0;
83
84 //文法
85 grammar{
86 "tell me more" => next_more();
87 "[can you|please] text [me] a link [to me]" => text_url();
88 "[can you|please] send [me] a link [to me]" => email_url();
89 "how much is it" => say_cost();
90 "[how much|what] does it cost" => say_cost();
91 "show me" => show_product();
92 "where can I [buy|get] [it|some]" => where_to_buy();
93 "i don't care" => set_dont_care();
94 "dont tell me about it" => set_dont_care();
95 "i hate [it|that]" => set_dont_care();
96 }
97
98 //画面およびスクリーンレス装置について定義されたコンテンツオブジェクト
99 content more1 {
100 tts = "it's made with ground unicorn horn for a magic sparkle";
101 video = "./media/sparkle.mpg"; //映像コンテンツへの参照
102 }
103 content more2 {
104 tts = "use it today and get a date by tonight、guaranteed";
105 flash = "./media/date.swf"; //Flashアニメーションへの参照
106 }
107 content more3 {
108 tts = "it's <nearest_city(lat_long())>'s silkiest tooth paste";
109 image = "./media/lingerie.gif"; //シルクのGIFアニメーションへの参照
110 }
111 content more4 {
112 tts = rand(
113 "why don't you add it to your cart",
114 "ask your shopping assistant for express delivery",
115 "it's available everywhere that fine toiletries are sold",
116 );
117 //有名人のスポークスマンのライブストリームへの参照
118 stream = "http://www.starpastes.com/celebrity.strm";
119 }
120
121 //文法は、広告特有の関数を読み出すことができる
122 int more_idx=0;
123 function next_more {
124 if(more_idx <= 4)more++;
125 case(more_idx){
126 //deliver関数は、コンテンツオブジェクトの出力を処理する
127 1: deliver(more1);
128 2: deliver(more2);
129 3: deliver(more3);
130 4: deliver(more4);
131 }
132 }
133 //SMSを送信する
134 function text_url {
135 send_text("http://www.starpastes.com/robo_ad.html");
136 tts = "here you go";
137 }
138 //電子メールを送信する
139 function email_url {
140 send_email("http://www.starpastes.com/robo_ad.html");
141 tts = "done";
142 }
143 //価格を言う
144 function say_cost {
145 float price = get_price("9781542841443"); // StarPaste SKU
146 tts = "it's only <price>";
147 }
148 //製品を画面に表示する
149 function show_product{
150 if(DISPLAY_SCREEN = TRUE)
151 image = "./media/StarPaste.jpg";
152 }
153 //製品を買う場所、値段、およびそれがセールかどうか言う
154 function where_to_buy {
155 //アイテムの在庫がある最も近い店を探す
156 int store_id = nearest_stock("9781542841443");
157 //store_name関数を用いて最も近い店での値段を確認する
158 tts = "it's available at <store_name(store_id)> for just
159 <price_check(store_id, "9781542841443")>";
160 //store_sales関数を用いてアイテムがセール中であるかどうかを確認する
161 if(store_sales(store_id, "9781542841443"))
162 tts = "it's on sale at <store_name(store_id)>
163 <emphasis level="strong">today</emphasis>";
164 }
165 set_dont_care {
166 set_dont_show(user_id());
167 }
168 }

Claims (18)

  1. 広告ユニットの入札関数を指定するステップを含み、前記入札関数は、人間とマシンとの会話を表す会話状態変数の値を格納するシステムによって実行されると、前記会話状態変数の格納された前記値によって異なる入札値の計算をさせる、方法。
  2. 前記会話状態変数は、1つ以上のキーワードを表す、請求項1に記載の方法。
  3. 前記会話状態変数は、分野を表す、請求項1または2に記載の方法。
  4. 前記入札値は、さらに、プログラムによる式の結果によって異なる、請求項1〜3のいずれか1項に記載の方法。
  5. 前記入札値の計算は、ムード変数の前記値によって異なる、請求項1〜4のいずれか1項に記載の方法。
  6. 前記入札関数は、プライバシーを所望する表示によって条件付けられる、請求項1〜5のいずれか1項に記載の方法。
  7. コンピュータによって実行されると、前記コンピュータに、潜在顧客から表現を受信させ、前記表現のインテントに基づいてリアルタイム入札を判断させる、プログラム。
  8. コンピュータによって実行されると、前記コンピュータに、潜在顧客から表現を受信させ、前記表現の分野に基づいてリアルタイム入札を判断させる、プログラム。
  9. リアルタイム入札についての情報をフィードバックする方法であって、
    潜在顧客からの自然言語表現を解釈してインテントデータ構造を作成するステップと、
    前記インテントデータ構造を分析して分析結果をリアルタイムで導出するステップと、
    前記分析結果を広告主のリアルタイム入札に提供するステップとを含む、方法。
  10. 前記分析結果は、インテントの表示を含む、請求項9に記載の方法。
  11. 前記分析結果は、前記潜在顧客が前記自然言語表現を行う前の会話の分野の表示を含む、請求項9または10に記載の方法。
  12. 前記分析結果は、前記広告インタラクション直後の会話の分野の表示を含む、請求項9〜11のいずれか1項に記載の方法。
  13. 前記分析結果は、個人を特定する情報を含む、請求項9〜12のいずれか1項に記載の方法。
  14. 前記分析は、個人を特定する情報を隠す、請求項9〜13のいずれか1項に記載の方法。
  15. 広告機会を特定する方法であって、
    人間とマシンとのインタフェースにおいて自然言語による対話を監視するステップと、
    自然言語表現を、ZMOT(Zero Moment Of Truth)インテントを特定する問い合わせとして解釈するステップと、
    前記問い合わせにおいて言及されている製品またはサービスの種類を特定するステップと、
    広告入札を通知するステップとを含む、方法。
  16. 前記広告入札によって特定された広告ユニットを配信するステップをさらに含む、請求項15に記載の方法。
  17. 前記広告入札に関連付けられた紹介メッセージを配信するステップをさらに含む、請求項15または16に記載の方法。
  18. 文法に一致した返信を受信するステップをさらに含む、請求項17に記載の方法。
JP2020036823A 2017-12-22 2020-03-04 インタラクティブなエクスペリエンスに適合させた自然言語文法 Active JP7129439B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
WOPCT/US2017/068211 2017-12-22
PCT/US2017/068211 WO2019125486A1 (en) 2017-12-22 2017-12-22 Natural language grammars adapted for interactive experiences

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2018230121A Division JP7178248B2 (ja) 2017-12-22 2018-12-07 インタラクティブなエクスペリエンスに適合させた自然言語文法

Publications (2)

Publication Number Publication Date
JP2020091907A true JP2020091907A (ja) 2020-06-11
JP7129439B2 JP7129439B2 (ja) 2022-09-01

Family

ID=66993708

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2018230121A Active JP7178248B2 (ja) 2017-12-22 2018-12-07 インタラクティブなエクスペリエンスに適合させた自然言語文法
JP2020036823A Active JP7129439B2 (ja) 2017-12-22 2020-03-04 インタラクティブなエクスペリエンスに適合させた自然言語文法
JP2021093124A Pending JP2021131908A (ja) 2017-12-22 2021-06-02 インタラクティブなエクスペリエンスに適合させた自然言語文法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2018230121A Active JP7178248B2 (ja) 2017-12-22 2018-12-07 インタラクティブなエクスペリエンスに適合させた自然言語文法

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2021093124A Pending JP2021131908A (ja) 2017-12-22 2021-06-02 インタラクティブなエクスペリエンスに適合させた自然言語文法

Country Status (3)

Country Link
JP (3) JP7178248B2 (ja)
CN (1) CN110110317A (ja)
WO (1) WO2019125486A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022108073A1 (ko) * 2020-11-20 2022-05-27 삼성전자주식회사 서버 및 그의 제어 방법

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11900928B2 (en) 2017-12-23 2024-02-13 Soundhound Ai Ip, Llc System and method for adapted interactive experiences
CN110517096A (zh) * 2019-08-30 2019-11-29 百度在线网络技术(北京)有限公司 内容植入方法、装置、电子设备及存储介质
JP7015291B2 (ja) * 2019-11-19 2022-02-02 株式会社ラストワンマイル 情報処理装置
JP7314442B2 (ja) * 2020-07-17 2023-07-26 株式会社三鷹ホールディングス ポイントサイネージビジネスシステム

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014109992A (ja) * 2012-12-04 2014-06-12 Yahoo Japan Corp 広告情報提供装置および広告情報提供方法
JP2015508542A (ja) * 2012-01-11 2015-03-19 フェイスブック,インク. ユーザ活動に基づく広告ユニットのグループ化および順位付け
JP2015536007A (ja) * 2012-10-08 2015-12-17 フェイスブック,インク. ソーシャルペイによるオンライン広告
JP2016024631A (ja) * 2014-07-18 2016-02-08 ヤフー株式会社 提示装置、提示方法及び提示プログラム
JP2016045584A (ja) * 2014-08-20 2016-04-04 ヤフー株式会社 応答生成装置、応答生成方法及び応答生成プログラム
JP2017507434A (ja) * 2014-03-11 2017-03-16 リアルアイズ・オーウー ウェブベースの広告インベントリを生成し、ウェブベースの広告をターゲティングする方法

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7137126B1 (en) * 1998-10-02 2006-11-14 International Business Machines Corporation Conversational computing via conversational virtual machine
JP2004234492A (ja) * 2003-01-31 2004-08-19 Nec Software Tohoku Ltd チャットシステム及び広告提供方法
US20070038737A1 (en) * 2005-07-19 2007-02-15 International Business Machines Corporation System and method for networking educational equipment
RU2008134153A (ru) * 2006-01-23 2010-02-27 ЧаЧа Сёрч, Инк. (US) Целевые рекламные объявления для мобильных устройств
DE102006036338A1 (de) * 2006-08-03 2008-02-07 Siemens Ag Verfahren zum Erzeugen einer kontextbasierten Sprachdialogausgabe in einem Sprachdialogsystem
US9318108B2 (en) * 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
KR20090072599A (ko) * 2007-12-28 2009-07-02 (주)다음소프트 메신저용 채팅 로봇을 이용한 광고 방법 및 광고 장치
US8270580B2 (en) * 2008-04-01 2012-09-18 Microsoft Corporation Interactive voice advertisement exchange
CN101651699B (zh) * 2008-08-15 2014-02-19 华为技术有限公司 获取广告内容、投放广告业务的方法、装置及系统
US11012732B2 (en) * 2009-06-25 2021-05-18 DISH Technologies L.L.C. Voice enabled media presentation systems and methods
US8275384B2 (en) * 2010-03-20 2012-09-25 International Business Machines Corporation Social recommender system for generating dialogues based on similar prior dialogues from a group of users
US20120130822A1 (en) * 2010-11-19 2012-05-24 Microsoft Corporation Computing cost per interaction for interactive advertising sessions
US10972530B2 (en) * 2016-12-30 2021-04-06 Google Llc Audio-based data structure generation
KR101385316B1 (ko) * 2012-04-03 2014-04-30 주식회사 로보플래닛 로봇을 이용한 광고 및 콘텐츠 연계형 대화 서비스 제공 시스템 및 그 방법
US9701530B2 (en) * 2013-11-22 2017-07-11 Michael J. Kline System, method, and apparatus for purchasing, dispensing, or sampling of products
EP2933070A1 (en) * 2014-04-17 2015-10-21 Aldebaran Robotics Methods and systems of handling a dialog with a robot
US9704181B2 (en) * 2014-05-06 2017-07-11 International Business Machines Corporation Real-time social group based bidding system
KR20160023935A (ko) * 2014-08-20 2016-03-04 한국해양대학교 산학협력단 자동판매기를 이용한 광고 제공 장치 및 방법
US20170091612A1 (en) * 2015-09-30 2017-03-30 Apple Inc. Proactive assistant with memory assistance
US10455088B2 (en) * 2015-10-21 2019-10-22 Genesys Telecommunications Laboratories, Inc. Dialogue flow optimization and personalization
JP6132378B1 (ja) * 2016-06-09 2017-05-24 真由美 稲場 相手方の性格・趣向を理解してコミュニケーションをとることを支援する機能を実現させるためのプログラム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015508542A (ja) * 2012-01-11 2015-03-19 フェイスブック,インク. ユーザ活動に基づく広告ユニットのグループ化および順位付け
JP2015536007A (ja) * 2012-10-08 2015-12-17 フェイスブック,インク. ソーシャルペイによるオンライン広告
JP2014109992A (ja) * 2012-12-04 2014-06-12 Yahoo Japan Corp 広告情報提供装置および広告情報提供方法
JP2017507434A (ja) * 2014-03-11 2017-03-16 リアルアイズ・オーウー ウェブベースの広告インベントリを生成し、ウェブベースの広告をターゲティングする方法
JP2016024631A (ja) * 2014-07-18 2016-02-08 ヤフー株式会社 提示装置、提示方法及び提示プログラム
JP2016045584A (ja) * 2014-08-20 2016-04-04 ヤフー株式会社 応答生成装置、応答生成方法及び応答生成プログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022108073A1 (ko) * 2020-11-20 2022-05-27 삼성전자주식회사 서버 및 그의 제어 방법

Also Published As

Publication number Publication date
WO2019125486A1 (en) 2019-06-27
JP2019125357A (ja) 2019-07-25
JP2021131908A (ja) 2021-09-09
CN110110317A (zh) 2019-08-09
JP7178248B2 (ja) 2022-11-25
JP7129439B2 (ja) 2022-09-01

Similar Documents

Publication Publication Date Title
US11900928B2 (en) System and method for adapted interactive experiences
JP7129439B2 (ja) インタラクティブなエクスペリエンスに適合させた自然言語文法
Ye et al. Social presence, telepresence and customers’ intention to purchase online peer-to-peer accommodation: A mediating model
US20200320604A1 (en) Information Provision System, Information Provision Method, and Storage Medium
US10096319B1 (en) Voice-based determination of physical and emotional characteristics of users
US9015050B2 (en) System and method for targeted advertising
Maroufkhani et al. How do interactive voice assistants build brands' loyalty?
US10839424B1 (en) Voice user interface advertising control method
US20110029365A1 (en) Targeting Multimedia Content Based On Authenticity Of Marketing Data
CN113421143A (zh) 辅助直播的处理方法、装置及电子设备
JP2008052449A (ja) 対話型エージェントシステム及び方法
Yuan et al. The effect of advertising strategies on a short video platform: evidence from TikTok
CN111612588B (zh) 商品呈现方法及装置、计算设备、计算机可读存储介质
Kreutzer et al. Fields of application of artificial intelligence—customer service, marketing and sales
Haryanto et al. Social Media And Viral Marketing Analysis Of Purchase Decisions Through Tiktok Applications
Rahma et al. The impact of marketing strategy on consumer’s impulsive buying behavior on Tiktok live
Paraman et al. Dynamic effect of flow on impulsive consumption: evidence from Southeast Asian Live streaming platforms
Whang Voice Shopping: The effect of the consumer-voice assistant parasocial relationship on the consumer's perception and decision making
Saad Toward Better Digital Advertising: The Role of the Anthropomorphic Virtual Agent
EP3502923A1 (en) Natural language grammars adapted for interactive experiences
Chang et al. A content-based metric for social media influencer marketing
JP7260263B2 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
JP2021162997A (ja) 情報処理装置及び情報処理方法
Tran How Sound Branding Influences Customer’s Perception–Case company: Blinkist, non-fiction book summary application
JP7294924B2 (ja) 対話エージェントシステム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200304

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210316

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210616

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210921

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20211125

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220318

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220726

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220822

R150 Certificate of patent or registration of utility model

Ref document number: 7129439

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150