JP7166350B2 - 対話装置 - Google Patents

対話装置 Download PDF

Info

Publication number
JP7166350B2
JP7166350B2 JP2020546851A JP2020546851A JP7166350B2 JP 7166350 B2 JP7166350 B2 JP 7166350B2 JP 2020546851 A JP2020546851 A JP 2020546851A JP 2020546851 A JP2020546851 A JP 2020546851A JP 7166350 B2 JP7166350 B2 JP 7166350B2
Authority
JP
Japan
Prior art keywords
information
response
word
registered
related information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020546851A
Other languages
English (en)
Other versions
JPWO2020054451A1 (ja
Inventor
美祐 佐藤
可奈子 大西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Publication of JPWO2020054451A1 publication Critical patent/JPWO2020054451A1/ja
Application granted granted Critical
Publication of JP7166350B2 publication Critical patent/JP7166350B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、ユーザと対話を行う対話装置に関する。
特許文献1(特開2017-222402号公報)には、対話システムにおいてユーザ発話に応じて適切な応答を行うことができる発話候補生成装置について記載されている。この発話候補生成装置は、ユーザ発話を形態素解析して抽出した単語および対話行為を検索クエリとした発話データベースの検索結果に基づいた発話候補を生成することについての記載がある。
特開2017-222402号公報
しかしながら、特許文献1に記載の発話データベースは、SNS(Social Network System)などの所定のサイトをクロールすることによって得た情報であることから、発話内容の品質が悪い場合があり得る。一方で、発話内容を向上させようとして管理者が発話内容を生成することもできるが、多大なコストがかかる。
そこで、上述の問題を解決するために、本発明は、低コストで発話内容の品質を向上させることのできる発話装置を提供することを目的とする。
本発明は、複数の登録単語を、相互に関連性を示す関連情報を用いて構造的に記憶する記憶部と、ユーザの発話内容を解析する解析部と、前記発話内容から主単語を抽出する抽出部と、前記主単語をキーにして、前記記憶部を検索して、対応する登録単語および関連情報を、応答単語および応答関連情報として取得する検索部と、前記応答単語および応答関連情報を用いて応答内容を生成して出力する応答部と、を備え、前記記憶部は、前記関連情報で関連付けられる登録単語で示されている状態が継続しているか否かを示す継続情報を記憶し、前記応答部は、前記継続情報が、前記状態が継続していることを示している場合には、当該状態が現在形で表現される応答内容を生成し、前記継続情報が、前記状態が継続していないことを示している場合には、当該状態は過去において発生した状態であることを示す応答内容を生成する。
この発明によれば、複数の登録単語を、相互に関連性を示す関連情報を用いて構造的に記憶する記憶部を用いて、ユーザとの対話を行うための応答内容を生成する。よって、低コストで対話内容の品質を向上させることができる。
本発明によると、低コストで対話内容の品質を向上させることができる。
本開示の一実施形態の対話装置の機能構成を示すブロック図である。 グラフデータベースを模式的に示した模式図である。 時間情報を含んだエッジ情報およびノード情報を示す模式図を示す。 テンプレートデータベース106の具体例を示す図である。 対話装置の処理動作を示すフローチャートである。 エッジ情報に類似度を含んだグラフデータベース105の模式図である。 共通するノード情報を選択するための処理概念を示す模式図である。 グラフデータベース105の一部を示す模式図である。 補足文を生成することができる対話装置100の動作を示すフローチャートである。 プロパティリストテーブルの具体例を示す。 本開示の一実施の形態に係る対話装置100のハードウェア構成の一例を示す図である。
添付図面を参照しながら本発明の実施形態を説明する。可能な場合には、同一の部分には同一の符号を付して、重複する説明を省略する。
[本実施形態]
図1は、本開示の一実施形態の対話装置100の機能構成を示すブロック図である。図1に示される通り、対話装置100は、ユーザ端末200から発話情報を受信し、その対話情報に対応した対話情報を送信することで、ユーザ端末200のユーザは、対話を楽しむことができる。
図1に示される通り、この対話装置100は、対話部101(応答部)、抽出部102(解析部、抽出部)、検索部103(検索部)、対話情報生成部104(応答部)、グラフデータベース105(記憶部)およびテンプレートデータベース106を含んで構成されている。
対話部101は、ユーザ端末200から送信された発話情報であるテキスト情報を受信し、また、ユーザ端末200に対する対話情報であるテキスト情報を送信する部分である。図1においては、対話部101は、ネットワークを介してユーザ端末200と送受信しているが、これに限るものではなく、直接対話してもよい。その場合、音声による対話またはテキスト情報の入出力による対話を行う。
抽出部102は、ユーザ端末200から送信されたテキスト情報を解析して、発話情報の話題である焦点情報(トピック情報)を抽出する部分である。焦点情報は、テキスト情報を形態素解析して得られた単語およびその前後の文字における特徴ベクトル(意味ベクトル)に基づいて、抽出される情報であり、単語またはテキストで表される。この焦点情報の抽出処理は、公知の技術である。以下、焦点情報を、トピック情報とする。
検索部103は、トピック情報をキーにして、グラフデータベース105を検索し、トピック情報から派生しているエッジ情報およびノード情報を取得する部分である。なお、検索部103は、検索した複数のエッジ情報およびノード情報のうち、所定条件に従った一のエッジ情報および一のノード情報を選択して取得する。例えば、検索部103は、ランダムに一のエッジ情報およびその一のエッジ情報に対応する一のノード情報を選択する。
また、検索部103は、対話装置100の設定に応じて複数文を生成するために、一文目の対話情報を生成した後、トピック情報を変更して、他のノード情報等の検索処理を繰り返し行うことにしてもよい。例えば、検索部103は、一文目の対話情報の作成に用いたノード情報をトピック情報として、グラフデータベース105を検索して、そのトピック情報から派生するエッジ情報およびノード情報を取得する。
対話情報生成部104は、取得されたエッジ情報およびノード情報に基づいて対話情報を生成する部分である。具体的には、以下の通りである。
対話情報生成部104は、テンプレートデータベース106を参照して、取得したエッジ情報に応じたテンプレートを取得する。例えば、エッジ情報が「所属チーム」を示していれば、エッジ情報で関連付けられているノード情報が示す所属チーム名を挿入するためのテンプレートを取得する。テンプレートデータベース106において、テンプレートは、エッジ情報ごとに用意されている。また、テンプレートは、過去バージョン(過去形のテンプレート)および現在バージョン(現在形のテンプレート)が用意されている場合がある。なお、テンプレートとは、文章の定型文であって、エッジ情報に対応するノード情報およびトピック情報を貼り付けることで、文章を構成するデータである。
対話情報生成部104は、エッジ情報に付随する時間情報に基づいて、エッジ情報で関連付けられているノード情報が示す状態または焦点情報との関係性が現在継続中であるか否かを判断する。そして、対話情報生成部104は、現在継続中であるか否かに応じて、過去バージョンまたは現在バージョンのテンプレートを取得する。時間情報に付随されるエッジ情報を含んだグラフデータベース105については、後述する。
対話情報生成部104は、取得したテンプレートの指定された位置に、エッジ情報に基づいたノード情報、およびトピック情報を挿入することで、対話情報を生成する。
なお、対話情報生成部104は、グラフデータベース105において、トピック情報であるノード情報に向かうエッジ情報が所定数以上(例えば30以上)である場合には、そのトピック情報には補足文が必要と判断し、補足文生成処理を行うことにしてもよい。その補足文生成処理は後述する。
対話情報生成部104は、エッジ情報およびノード情報を用いて対話情報を生成する。これを指定された数だけ、繰り返し処理することで、複数文の対話情報を生成する。なお、対話情報同士をつなげるための接続詞を適宜挿入してもよい。
グラフデータベース105は、対話情報を生成するためのノード情報およびエッジ情報を、構造的に関連付けて記憶するデータベースである。図2は、このグラフデータベース105の具体例を模式的に示す図である。グラフデータベース105は、複数の登録単語を、相互に関連性を示す関連情報を用いて構造的に記述するものであり、単語と単語との関係を示す情報を記述している。図2に示される通り、単語は、ノード情報として扱われ、ノード情報同士の関係はエッジ情報で示されている。例えば、ノード情報:中村俊輔から、エッジ情報:出身地を用いて、他のノード情報:横浜が派生している。これは、中村俊輔の出身地として、ノード情報:横浜が関連付けられていることを示す。すなわち、ノード情報:中村俊輔と、ノード情報:横浜は、エッジ情報:出身地で関連付けられている。ノード情報の派生方向は、図2においては矢印によって表現されている。派生先のノード情報が、派生元のノード情報を説明するため情報であり、そのために派生方向が定義されている。
なお、ノード情報:横浜から、さらに別のエッジ情報を用いて他のノード情報に関連付けられてもよい。グラフデータベース105は、ノード情報をエッジ情報を用いて他のノード情報に関連付けることを繰り返すことにより、ノード情報を用いた知識データを構造化することができる。
グラフデータベース105は、データベース運用者が人手により生成してもよいが、インターネットの情報サイトまたは辞書サイトから、公知のグラフデータベース生成アルゴリズムに従って生成される。
図3に、時間情報を含んだエッジ情報およびノード情報を示す模式図を示す。図3に示されるとおり、エッジ情報:所属チームには、スタート時間とエンド時間とが含まれている。これはノード情報:中村俊輔が、ノード情報:横浜Fマリノスに、エッジ情報:所属チームとして、所属していた期間を示す。エンド時間が示されていない場合には、現在継続中であると判断できる。また、スタート時間およびエンド時間が含まれていない場合には、現在および過去の概念がないエッジ情報と捉えることができる。その場合には、現在継続中と同じ扱いとなる。例えば、エッジ情報として出身地を考えた場合には、エッジ情報:出身地は、時間的な終わりがある情報ではない。そのようなエッジ情報には、スタート時間およびエンド時間を含ませる必要はない。またはスター時間のみをエッジ情報に含ませればよい。なお、現在継続中であるか否かを示すための情報としてスタート時間などに限定する必要はなく、単に“現在継続中”という情報がエッジ情報に含まれてもよい。
図4は、テンプレートデータベース106の具体例を示す図である。図4に示されるとおり、現在形、過去形に分けて、テンプレートが記述されている。さらに、トピック情報のノード情報およびその派生先となるノード情報を挿入するための空欄が形成されている。また、テンプレートデータベース106は、エッジ情報に応じたテンプレートを記憶している。図4においては、エッジ情報:所属チームのテンプレートを示す。このテンプレートは、その空欄に、トピック情報に対応するノード情報およびエッジ情報:所属チームで派生するノード情報が挿入されるように構成されている。
このように構成された対話装置100の動作について説明する。図5は、対話装置100の動作を示すフローチャートである。対話装置100において、対話部101が、ユーザ端末200から発話情報を受信すると、抽出部102は、その発話情報を解析する(S101)。
抽出部102は、ユーザの発話情報からトピック情報を抽出する(S102)。ここで、対話情報生成部104は、i=1を設定し、生成する対話情報の数の管理を行う(S103)。i≦num(閾値)であるときには(S104:YES)、対話情報生成部104は、対話情報の数が、予め定めた数に達していないと判断し、検索部103は、トピック情報から派生するエッジ情報およびノード情報を検索する。検索部103は、複数のエッジ情報およびノード情報を検索した場合には、所定ルール(例えばランダムに選択)に従って一のエッジ情報および一のノード情報を選択して取得する(S105)。なお、事前の設定等により複数のエッジ情報および複数のノード情報を選択してもよい。
また、ステップS105において、二文目以降の対話情報を生成する場合には、検索部103は、その前に生成された対話情報と共通するノード情報およびエッジ情報を取得してもよい。その処理の詳細については後述する。
そして、対話情報生成部104は、エッジ情報に応じたテンプレートを取得する(S106)。対話情報生成部104は、トピック情報、および取得したノード情報をテンプレートに挿入して、対話情報を生成する(S107)。
そして、対話情報生成部104は、i≧2であれば(S108:YES)、先に生成した対話情報に、S107において生成した対話情報を結合する(S109)。
つぎに、対話情報生成部104は、つぎの対話情報を生成するために、トピック情報を変更する。例えば、対話情報生成部104は、新たなトピック情報をS105で取得したノード情報に変更する(S110)。そして、対話情報生成部104は、iを一つインクリメントし(S111)、事前に定められた数に達するまで対話情報の生成を行う。
事前に定められた数に達すると(S104:NO)、対話部101は、対話情報生成部104で生成した対話情報をユーザ端末200に出力する(S112)。
[ノード情報の選択バリエーション]
つぎに、本開示の一実施形態の対話装置100におけるステップS105の処理におけるバリエーションについて説明する。上述したとおり、検索部103は、トピック情報から派生するエッジ情報およびノード情報を検索する際、ランダムに選択した一のエッジ情報および一のノード情報を検索したが、当然にこれに限るものではない。
例えば、検索部103は、トピック情報から派生する複数のエッジ情報の中から、ノード情報間の類似度の一番高いノード情報または所定値以上の類似度のノード情報を選択してもよい。図6に、エッジ情報に類似度を含んだグラフデータベース105の模式図を示す。図に示されているように、グラフデータベース105には、ノード情報同士がエッジ情報を用いて連結されているが、ノード情報同士の類似度がエッジ情報に含まれている。ノード情報は、単語であることから、単語間の類似度がエッジ情報に含まれていることになる。この類似度は、グラフデータベース105を構築する際に、word2vecなどの公知の自然言語解析アルゴリズムによって算出され、エッジ情報に付加されている。図6においては、ノード情報:中村俊輔と、ノード情報:横浜Fマリノスとの類似度は、0.53である。一方、ノード情報:中村俊輔と、ノード情報:横浜の類似度は、0.20であり、ノード情報:中村俊輔と、ノード情報:セルティックFCの類似度は、0.52である。この場合、検索部103は、エッジ情報:所属チーム、ノード情報:横浜Fマリノスを選択する。
この類似度を用いた選択処理を採用した場合、以下の対話情報が生成される。
「中村俊輔は、横浜・F・マリノスに所属していたんだ」
また、別のバリエーションとして、検索部103は、トピック情報のカテゴリに応じた一のエッジ情報および一のノード情報を選択してもよい。例えば、トピック情報:中村俊輔は、エッジ情報:カテゴリとして、ノード情報:人に対して派生して構造化されている。これは、トピック情報:中村俊輔のカテゴリは、“人”であることを示している。
したがって、トピック情報が、エッジ情報:カテゴリとして、ノード情報:人に派生して構造化されている場合には、検索部103は、検索した複数のエッジ情報およびノード情報のうち、「出身地」「誕生日」など予め定めたエッジ情報で派生するノード情報を選択してもよい。上記は一例であり、エッジ情報:カテゴリとして、ノード情報:人に限定するものではない。グラフデータベース105において、予め定めたエッジ情報に対して、予め定めたノード情報に構造化されている場合には、検索部103は、その予め定めたノード情報を選択することとしてもよい。
この特定のエッジ情報:出身地に対応するノード情報:横浜を選択する処理を採用する場合は、以下の対話情報が生成される。
「中村俊輔は、横浜出身なんだ。」
[共通ノード情報を用いた対話情報の生成]
つぎに、二文目以降の対話情報を生成する際の処理について説明する。検索部103は、二文目以降の対話情報を生成する際において、最初にユーザが発話した発話情報から抽出したトピック情報と共通するノード情報およびエッジ情報を取得することにしてもよい。以下、図7を用いて、説明する。
図7は、共通するノード情報を選択するための処理概念を示す模式図である。図7を例にとると、検索部103は、トピック情報であるノード情報:中村俊輔をキーにして、エッジ情報:出身地、ノード情報:横浜市を取得し、対話情報生成部104は、一文目の対話情報「中村俊輔は横浜市出身なんだよ」を生成する。
そして、対話情報生成部104が、二文目の対話情報を生成するために、検索部103は、ノード情報:横浜市をキーにして、他のノード情報を検索する。具体的には、まず、検索部103は、ノード情報に対して派生された複数の他のノード情報を検索する。この例においては、エッジ情報で逆方向に派生されたノード情報を検索する。そして、その中から、トピック情報であったノード情報:中村俊輔と共通する共通ノード情報に関連付けられる他のノード情報を選択する。図7の例では、共通ノード情報:サッカー日本代表に関連付けられるノード情報:岡野雅行およびエッジ情報:出身地を、他のノード情報および他のエッジ情報として選択する。
対話情報生成部104は、他のノード情報:岡野雅行、他のエッジ情報:出身地、共通ノード情報:サッカー日本代表、そのエッジ情報:所属チームを用いて、テンプレートデータベースからテンプレートを選択する。
テンプレートデータベース106には、共通ノード情報を用いたときのためのテンプレートが用意されており、一つ目のエッジ情報(例えば出身地)、その時間情報、二つ目のエッジ情報(例えば所属チーム)、その時間情報に対応付けたテンプレートが用意されている。
例えば、一つ目エッジ情報:出身地および二つ目のエッジ情報:所属チームに対応するテンプレートとして、「[トピック情報のノード情報]と同じ[共通ノード情報]だった[他のノード情報]も[ノード情報]出身なんだ」が用意されている。なお、説明の便宜上時間情報についての説明は割愛しているが、時間情報(現在または過去)を考慮したテンプレートも用意されている。
対話情報生成部104は、トピック情報、共通ノード情報、他のノード情報、ノード情報をそれぞれ挿入することで、対話情報を生成することができる。
この処理によって、対話に関連性ができ自然な対話情報を生成することができる。
なお、テンプレートデータベース106のデータベースを簡略化するために、以下の処理も考えられる。
すなわち、二文目用のテンプレートまたは共通ノード情報専用のテンプレートを用意しておくことは手間がかかる。したがって、通常のテンプレートとして、「[他のノード情報]も[ノード情報]出身なんだ」を用意しておき、対話情報生成部104は、他のノード情報および他のエッジ情報をテンプレートに挿入することで対話情報を生成することができる。
この場合、さらに三文目として、対話情報生成部104は、「[他のノード情報]は、[トピック情報のノード情報]と同じ「共通ノード情報」なんだ」とのテンプレートを取り出し、対話情報を生成するようにしてもよい。トピック情報および共通ノード情報は、すでに、検索部103が取得していることから、二文目および三文目を同タイミングで生成することができる。
上記バリエーションについては、それぞれ組み合わせて利用することもできる。例えば、共通ノード情報を有するノード情報が存在しない場合には、単語間類似度を用いてノード情報を選択してもよい。また、単語間類似度を用いてノード情報を選択する場合に、その類似度が所定値以上に達したノード情報が存在しない場合には、ランダムでノード情報を選択してもよい。なお、単語間類似度が所定以上に達したノード情報が存在しない場合に、共通ノードを有するノード情報の検索・選択を行ってもよい。
[補足文生成処理]
つぎに、本開示の第2の実施形態について説明する。この実施形態においては、対話情報に挿入されるノード情報が一般に知られていない単語(いわゆるマニアックな単語)である場合に、その補足をするための補足文を生成することに特徴がある。
図8を用いて、この実施形態の前提となる状況について説明する。図8は、グラフデータベース105の一部を示す模式図である。ノード情報:香川真司に対して、ノード情報:ビル・カウリッツから、エッジ情報:ファンで派生している。ビル・カウリッツは、日本においてはあまり知られていない人物とし、グラフデータベース105においても、あまり知られていない人物としてデータベース化されている。
このようなグラフデータベースがあった場合において、対話装置100は、ユーザに対する対話情報として、「ビル・カウリッツは、香川真司のファンなんです」と出力したとする。上記したとおり、ビル・カウリッツは、日本ではあまり知られていない人物であることから、ユーザは理解できない場合がある。
そのため、ビル・カウリッツを補足するための補足文を生成する必要がある。以下、その処理について説明する。
図9は、補足文を生成することができる対話装置100の動作を示すフローチャートである。
ステップS101~S109までは、図5に示される処理と同じである。トピック情報に基づいた一文目の対話情報が生成されると、検索部103は、そのトピック情報に基づいて抽出されたノード情報がマニアックな情報であるか否かを判断する(S109a)。検索部103は、そのノード情報がマニアックな情報であるか否かの判断基準としては、グラフデータベース105において、ノード情報に向けられるエッジ情報の数に基づいて判断する。ノード情報に向けられるエッジ情報の数が少ない、例えば、30以下である場合には、そのノード情報は別のノード情報から参照されることがないと判断できる。すなわち、そのノード情報は、一般的に知られていない情報と判断することができる。
なお、ユーザが発話した発話内容から抽出したノード情報については、検索部103は、マニアックな情報と判断できる場合であっても、マニアックな情報と判断しない。例えば、対話装置100は、抽出部102が抽出した、ユーザの発話情報から得たノード情報を履歴情報として記憶する履歴情報記憶部を備え、履歴情報として記憶されたノード情報については、検索部103は、上記の条件を満たしたとしてもマニアックな情報と判断しない。
検索部103は、ノード情報がマニアックな情報であると判断すると、そのノード情報を補足するための補足用ノード情報およびエッジ情報の検索を行う。例えば、検索部103は、ノード情報のカテゴリに基づいて、ノード情報を捕捉するための補足用ノード情報を特定するために、一または複数のエッジ情報を、プロパティリストテーブルを用いて選択する。検索部103は、選択したエッジ情報:職業・国籍に基づいたノード情報を特定する。このノード情報が、トピック情報に基づいて抽出されたノード情報を補足するための補足用ノード情報となる。
以下詳細に説明する。図10にプロパティリストテーブルの具体例を示す。このプロパティリストテーブル(図示せず)は、対話装置100に備えられている。図に示されるとおり、このプロパティテーブルには、カテゴリ、プロパティリスト、およびテンプレートが対応付けて記述されている。カテゴリは、エッジ情報により示される情報であり、このカテゴリ欄には、エッジ情報:カテゴリにより特定されるノード情報が記述される。プロパティリストは、ノード情報を補足するための補足用ノード情報を特定するためのエッジ情報を示す。このプロパティリストで特定されるエッジ情報およびそのノード情報が、マニアックなノード情報を補足するための情報である。
例えば、図10において、カテゴリが“人”に対して、プロパティリストが“国籍”および“職業”、およびテンプレートが対応付けられている。ここでのテンプレートは、「[マニアックと判断されたノード情報]は、[国籍を示すノード情報]の[職業を示すノード情報]です。」である。
対話情報生成部104は、このプロパティリストテーブルを用いて、まずマニアックと判断されたノード情報からエッジ情報:カテゴリで派生するノード情報を取得する(S109b)。図8に示されるとおり、ノード情報:ビル・カウリッツからエッジ情報:カテゴリで派生する情報は、ノード情報:人である。従って、ビル・カウリッツは人であることが分かる。
また、対話情報生成部104は、プロパティリストテーブルを参照して、ノード情報のエッジ情報:カテゴリに基づいて、補足用ノード情報を特定するためのエッジ情報を特定する(S109c)。図10の例では、ノード情報のカテゴリが人である場合のプロパティリストは、エッジ情報:国籍/職業であることを示す。
そして、対話情報生成部104は、マニアックなノード情報から、S109cで特定されたエッジ情報で派生するノード情報を取得する(S109d)。図10に示されるとおり、マニアックなノード情報:ビル・カウリッツから、エッジ情報:国籍/職業で派生する補足用ノード情報は、それぞれ補足用ノード情報:歌手、ドイツである。したがって、対話情報生成部104は、ビル・カウリッツはドイツ出身で、歌手であることを示す補足文を生成することができる。
対話情報生成部104は、プロパティリストテーブルを参照して、トピック情報から得られたノード情報のカテゴリに応じたテンプレートを取得する(S109e)。図10の例ではトピック情報から得られたノード情報のカテゴリは“人”であることから、“人”に対応するテンプレートを取得する。そして、対話情報生成部104は、取得したテンプレートに、補足用ノード情報を挿入することで、補足文となる対話情報を生成する(S109f)。図10の例では、テンプレートは「[マニアックと判断されたノード情報]は、[エッジ情報:国籍のノード情報]の[エッジ情報:職業のノード情報]です」であることから、それぞれノード情報を挿入することで補足文となる対話情報を生成することができる。
つぎに、本実施形態の対話装置100の作用効果について説明する。本実施形態における対話装置100は、複数の登録単語であるノード情報を、相互に関連性を示す関連情報であるエッジ情報を用いて構造的に記憶するグラフデータベース105を備える。
なお、上記実施形態においては、グラフデータベース105は、方向性を持たせたエッジ情報で、ノード情報同士を関連付けて記憶しているが、必ずしも方向性は必要ではないが、方向性を持たせた方が、ノード情報同士の関連性を正確に把握することができる。
そして、抽出部102は、対話部101が受け付けたユーザの発話内容を解析し、発話内容から主単語であるトピック情報を抽出する。上記本実施形態では、抽出部102は、ノード情報:中村俊輔を抽出する。
検索部103は、トピック情報であるノード情報をキーにして、グラフデータベース105を検索して、対応するノード情報(応答情報)およびエッジ情報(応答関連情報)を取得する。上記本実施形態では、検索部103は、エッジ情報:所属チーム、ノード情報:横浜マリノスを取得する。
対話情報生成部104は、取得したノード情報およびエッジ情報を用いて応答内容である対話情報を生成する。対話部101は、生成した対話情報をユーザ端末200に出力する。
この構成により、ノード情報同士を、エッジ情報を用いて相互に関連付けて記憶するグラフデータベースを用いて、対話情報を生成することができる。よって、質のよい対話情報を自動的に生成することができる。さらに、グラフデータベース105を用いるため、その生成コストを低減させることができる。生成コストの低減は、対話装置100におけるCPU等のプロセッサの処理負荷低減、また対話生成のための処理アルゴリズムの簡易化に貢献する。
また、対話装置100において、対話情報生成部104は、取得したエッジ情報に対応するテンプレートを取得し、当該テンプレートにノード情報を挿入して対話情報を生成し、対話部101が対話情報を出力する。
この構成により、エッジ情報に応じたテンプレートに基づいて対話情報を生成することができる。よって、自然な形の対話を可能にする。例えば、エッジ情報:所属チームに対応するテンプレートを取得することで、自然な対話となる対話情報を生成できる。
また、対話装置100において、グラフデータベース105は、エッジ情報で関連付けられるノード情報の状態が継続しているか否かを示すスタート時間およびエンド時間で示される継続情報を記憶する。対話情報生成部104は、このスタート時間およびエンド時間から示される継続情報に基づいて対話情報を生成する。
この構成により、関連付けられるノード情報が過去の状態であるか、現在継続している状態であるかに応じた対話情報を生成することができる。よって、自然な対話を可能にする。なお、必ずしもスタート時間およびエンド時間で継続状態を示す必要はなく、単に継続中という情報がエッジ情報に付随させてもよい。
また、対話装置100において、グラフデータベース105は、トピック情報に一致するノード情報に対して複数の他のノード情報がそれぞれエッジ情報で関連付けて記憶されているとする。この場合、検索部103は、複数の他のノード情報から一のノード情報をランダムに選択して、テンプレートに挿入される応答単語およびテンプレートを選択するための応答関連情報とすることとしてもよい。
この構成により、ノード情報を一つに絞り込むことができ、自然な対話情報を生成することができる。なお、一のノード情報に限るものではなく、2つまたはそれ以上のノード情報としてもよい。
また、対話装置100において、グラフデータベース105は、さらにノード情報同士の類似度を記憶している。グラフデータベース105において、トピック情報に一致するノード情報に対して複数の他のノード情報が関連付けて記憶されている場合、検索部103は、類似度に基づいて一のノード情報を選択して、テンプレートに挿入される応答単語およびテンプレートを選択するための応答関連情報として取得することとしてもよい。
この構成により、トピック情報に類似するノード情報を選択することができ、ユーザの発話に対して関連性のある対話情報を生成することができる。
また、対話装置100において、グラフデータベース105が、トピック情報に一致するノード情報に対して複数の他のノード情報が関連付けて記憶されているとする。
検索部103は、トピック情報に一致するノード情報からエッジ情報で関連付けられる他のノード情報のうち、所定の関連性(例えば、カテゴリ)を示すエッジ情報のノード情報(例えば、人)に基づいて他のエッジ情報(例えば、出身地、誕生日)で関連付けられるノード情報(出身地が横浜、誕生日の日付)を選択する。
トピック情報のカテゴリが“人”である場合に、その“人”の誕生日、出身地を対話情報とすることが対話する上で自然な場合がある。本実施形態においては、検索部103は、トピック情報のカテゴリに応じたノード情報を選択するようにしたことで、相互に関連性のある自然な対話を可能にする。なお、本実施形態においては、トピック情報において所定の関連性を示すエッジ情報として“カテゴリ”を例に挙げたが当然にこれに限定するものではない。トピック情報に関連性の高いエッジ情報であればよい。
また、本実施形態の対話装置100において、検索部103は、トピック情報に基づいて抽出されたノード情報に対する精通度合いを判定する。すなわち補足情報が必要か否かを判断する。そして、検索部103は、精通度合いが所定条件を満たす場合には、トピック情報に基づいて抽出されたノード情報(マニアックな単語:ビル・カウリッツ)の所定の関連性を示すエッジ情報(カテゴリ)のノード情報(人)に基づいて、補足用のテンプレートに挿入される補足応答単語(補足用のノード情報:歌手)および補足用のテンプレートを選択するための補足応答関連情報(補足用のエッジ情報:職業)として取得する。対話情報生成部104は、対話情報に加えて、補足用のノード情報および補足用のエッジ情報を用いた補足用の対話情報を生成する。
この構成により、精通度合いの小さいノード情報、いわゆるマニアックな単語については、補足のための対話情報を生成することで、ユーザにとって理解が困難な対話をすることを防止することができる。
例えば、検索部103は、マニアックな単語であるか否かは、グラフデータベース105においてその派生方向に基づいて判断することができる。すなわち、あるノード情報に対して多くの他のノード情報からエッジ情報を使って関連付けがなされている場合には、そのノード情報は、多数のノード情報に引用されていると判断でき、一般的に知られている単語と判断できる。逆にその数が少ない場合(所定値未満である場合)には、一般的には知られていないマニアックな単語であると判断できる。なお、本実施形態においては、所定の関連性を示すエッジ情報として“カテゴリ”を例に挙げたが当然にこれに限定するものではない。ノード情報を補足する上で関連性の高いエッジ情報であればよい。
また、対話装置100において、トピック情報に対して取得されたノード情報(図7における横浜市)を用いた第1の応答内容が生成された後、検索部103は、この取得されたノード情報(図7における横浜市)に関連付けられる他のノード情報(図7における岡野雅行)を、テンプレートに挿入される応答単語として取得する。ここで、応答単語として取得された他のノード情報(図7における岡野雅行)と、トピック情報に一致するノード情報(図7における中村俊輔)とは、エッジ情報(図7における所属チーム)を用いて関連付けられるノード情報(図7におけるサッカー日本代表)を共通にする。すなわち、検索部103は、トピック情報のノード情報と共通にする共通ノード情報に関連付けられる他のノード情報を、応答単語として、取得する。
対話情報生成部104は、第1の応答内容に加えて、他のノード情報(応答単語)を含んだ第2の応答内容を生成する。
この構成により、自然な形で対話を発展させることができる。
上記実施形態の説明に用いたブロック図は、機能単位のブロックを示している。これらの機能ブロック(構成部)は、ハードウェア及びソフトウェアの少なくとも一方の任意の組み合わせによって実現される。また、各機能ブロックの実現方法は特に限定されない。すなわち、各機能ブロックは、物理的又は論理的に結合した1つの装置を用いて実現されてもよいし、物理的又は論理的に分離した2つ以上の装置を直接的又は間接的に(例えば、有線、無線などを用いて)接続し、これら複数の装置を用いて実現されてもよい。機能ブロックは、上記1つの装置又は上記複数の装置にソフトウェアを組み合わせて実現されてもよい。
機能には、判断、決定、判定、計算、算出、処理、導出、調査、探索、確認、受信、送信、出力、アクセス、解決、選択、選定、確立、比較、想定、期待、見做し、報知(broadcasting)、通知(notifying)、通信(communicating)、転送(forwarding)、構成(configuring)、再構成(reconfiguring)、割り当て(allocating、mapping)、割り振り(assigning)などがあるが、これらに限られない。たとえば、送信を機能させる機能ブロック(構成部)は、送信部(transmitting unit)や送信機(transmitter)と呼称される。いずれも、上述したとおり、実現方法は特に限定されない。
例えば、本開示の一実施の形態における対話装置100などは、本開示の対話方法の処理を行うコンピュータとして機能してもよい。図11は、本開示の一実施の形態に係る対話装置100のハードウェア構成の一例を示す図である。上述の対話装置100は、物理的には、プロセッサ1001、メモリ1002、ストレージ1003、通信装置1004、入力装置1005、出力装置1006、バス1007などを含むコンピュータ装置として構成されてもよい。
なお、以下の説明では、「装置」という文言は、回路、デバイス、ユニットなどに読み替えることができる。対話装置100のハードウェア構成は、図に示した各装置を1つ又は複数含むように構成されてもよいし、一部の装置を含まずに構成されてもよい。
対話装置100における各機能は、プロセッサ1001、メモリ1002などのハードウェア上に所定のソフトウェア(プログラム)を読み込ませることによって、プロセッサ1001が演算を行い、通信装置1004による通信を制御したり、メモリ1002及びストレージ1003におけるデータの読み出し及び書き込みの少なくとも一方を制御したりすることによって実現される。
プロセッサ1001は、例えば、オペレーティングシステムを動作させてコンピュータ全体を制御する。プロセッサ1001は、周辺装置とのインターフェース、制御装置、演算装置、レジスタなどを含む中央処理装置(CPU:Central Processing Unit)によって構成されてもよい。例えば、上述の抽出部102、および検索部103、対話情報生成部104などは、プロセッサ1001によって実現されてもよい。
また、プロセッサ1001は、プログラム(プログラムコード)、ソフトウェアモジュール、データなどを、ストレージ1003及び通信装置1004の少なくとも一方からメモリ1002に読み出し、これらに従って各種の処理を実行する。プログラムとしては、上述の実施の形態において説明した動作の少なくとも一部をコンピュータに実行させるプログラムが用いられる。例えば、対話装置100の抽出部102、検索部103、対話情報生成部104は、メモリ1002に格納され、プロセッサ1001において動作する制御プログラムによって実現されてもよく、他の機能ブロックについても同様に実現されてもよい。上述の各種処理は、1つのプロセッサ1001によって実行される旨を説明してきたが、2以上のプロセッサ1001により同時又は逐次に実行されてもよい。プロセッサ1001は、1以上のチップによって実装されてもよい。なお、プログラムは、電気通信回線を介してネットワークから送信されても良い。
メモリ1002は、コンピュータ読み取り可能な記録媒体であり、例えば、ROM(Read Only Memory)、EPROM(Erasable Programmable ROM)、EEPROM(Electrically Erasable Programmable ROM)、RAM(Random Access Memory)などの少なくとも1つによって構成されてもよい。メモリ1002は、レジスタ、キャッシュ、メインメモリ(主記憶装置)などと呼ばれてもよい。メモリ1002は、本開示の一実施の形態に係る対話方法を実施するために実行可能なプログラム(プログラムコード)、ソフトウェアモジュールなどを保存することができる。
ストレージ1003は、コンピュータ読み取り可能な記録媒体であり、例えば、CD-ROM(Compact Disc ROM)などの光ディスク、ハードディスクドライブ、フレキシブルディスク、光磁気ディスク(例えば、コンパクトディスク、デジタル多用途ディスク、Blu-ray(登録商標)ディスク)、スマートカード、フラッシュメモリ(例えば、カード、スティック、キードライブ)、フロッピー(登録商標)ディスク、磁気ストリップなどの少なくとも1つによって構成されてもよい。ストレージ1003は、補助記憶装置と呼ばれてもよい。上述の記憶媒体は、例えば、メモリ1002及びストレージ1003の少なくとも一方を含むデータベース、サーバその他の適切な媒体であってもよい。
通信装置1004は、有線ネットワーク及び無線ネットワークの少なくとも一方を介してコンピュータ間の通信を行うためのハードウェア(送受信デバイス)であり、例えばネットワークデバイス、ネットワークコントローラ、ネットワークカード、通信モジュールなどともいう。通信装置1004は、例えば周波数分割複信(FDD:Frequency Division Duplex)及び時分割複信(TDD:Time Division Duplex)の少なくとも一方を実現するために、高周波スイッチ、デュプレクサ、フィルタ、周波数シンセサイザなどを含んで構成されてもよい。例えば、上述の対話部101などは、通信装置1004によって実現されてもよい。対話部101は、送信部と受信部とで、物理的に、または論理的に分離された実装がなされてもよい。
入力装置1005は、外部からの入力を受け付ける入力デバイス(例えば、キーボード、マウス、マイクロフォン、スイッチ、ボタン、センサなど)である。出力装置1006は、外部への出力を実施する出力デバイス(例えば、ディスプレイ、スピーカー、LEDランプなど)である。なお、入力装置1005及び出力装置1006は、一体となった構成(例えば、タッチパネル)であってもよい。
また、プロセッサ1001、メモリ1002などの各装置は、情報を通信するためのバス1007によって接続される。バス1007は、単一のバスを用いて構成されてもよいし、装置間ごとに異なるバスを用いて構成されてもよい。
また、対話装置100は、マイクロプロセッサ、デジタル信号プロセッサ(DSP:Digital Signal Processor)、ASIC(Application Specific Integrated Circuit)、PLD(Programmable Logic Device)、FPGA(Field Programmable Gate Array)などのハードウェアを含んで構成されてもよく、当該ハードウェアにより、各機能ブロックの一部又は全てが実現されてもよい。例えば、プロセッサ1001は、これらのハードウェアの少なくとも1つを用いて実装されてもよい。
情報の通知は、本開示において説明した態様/実施形態に限られず、他の方法を用いて行われてもよい。例えば、情報の通知は、物理レイヤシグナリング(例えば、DCI(Downlink Control Information)、UCI(Uplink Control Information))、上位レイヤシグナリング(例えば、RRC(Radio Resource Control)シグナリング、MAC(Medium Access Control)シグナリング、報知情報(MIB(Master Information Block)、SIB(System Information Block)))、その他の信号又はこれらの組み合わせによって実施されてもよい。また、RRCシグナリングは、RRCメッセージと呼ばれてもよく、例えば、RRC接続セットアップ(RRC Connection Setup)メッセージ、RRC接続再構成(RRC Connection Reconfiguration)メッセージなどであってもよい。
本開示において説明した各態様/実施形態は、LTE(Long Term Evolution)、LTE-A(LTE-Advanced)、SUPER 3G、IMT-Advanced、4G(4th generation mobile communication system)、5G(5th generation mobile communication system)、FRA(Future Radio Access)、NR(new Radio)、W-CDMA(登録商標)、GSM(登録商標)、CDMA2000、UMB(Ultra Mobile Broadband)、IEEE 802.11(Wi-Fi(登録商標))、IEEE 802.16(WiMAX(登録商標))、IEEE 802.20、UWB(Ultra-WideBand)、Bluetooth(登録商標)、その他の適切なシステムを利用するシステム及びこれらに基づいて拡張された次世代システムの少なくとも一つに適用されてもよい。また、複数のシステムが組み合わされて(例えば、LTE及びLTE-Aの少なくとも一方と5Gとの組み合わせ等)適用されてもよい。
本開示において説明した各態様/実施形態の処理手順、シーケンス、フローチャートなどは、矛盾の無い限り、順序を入れ替えてもよい。例えば、本開示において説明した方法については、例示的な順序を用いて様々なステップの要素を提示しており、提示した特定の順序に限定されない。
情報等は、上位レイヤ(又は下位レイヤ)から下位レイヤ(又は上位レイヤ)へ出力され得る。複数のネットワークノードを介して入出力されてもよい。
入出力された情報等は特定の場所(例えば、メモリ)に保存されてもよいし、管理テーブルを用いて管理してもよい。入出力される情報等は、上書き、更新、又は追記され得る。出力された情報等は削除されてもよい。入力された情報等は他の装置へ送信されてもよい。
判定は、1ビットで表される値(0か1か)によって行われてもよいし、真偽値(Boolean:true又はfalse)によって行われてもよいし、数値の比較(例えば、所定の値との比較)によって行われてもよい。
本開示において説明した各態様/実施形態は単独で用いてもよいし、組み合わせて用いてもよいし、実行に伴って切り替えて用いてもよい。また、所定の情報の通知(例えば、「Xであること」の通知)は、明示的に行うものに限られず、暗黙的(例えば、当該所定の情報の通知を行わない)ことによって行われてもよい。
以上、本開示について詳細に説明したが、当業者にとっては、本開示が本開示中に説明した実施形態に限定されるものではないということは明らかである。本開示は、請求の範囲の記載により定まる本開示の趣旨及び範囲を逸脱することなく修正及び変更態様として実施することができる。したがって、本開示の記載は、例示説明を目的とするものであり、本開示に対して何ら制限的な意味を有するものではない。
ソフトウェアは、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、ハードウェア記述言語と呼ばれるか、他の名称で呼ばれるかを問わず、命令、命令セット、コード、コードセグメント、プログラムコード、プログラム、サブプログラム、ソフトウェアモジュール、アプリケーション、ソフトウェアアプリケーション、ソフトウェアパッケージ、ルーチン、サブルーチン、オブジェクト、実行可能ファイル、実行スレッド、手順、機能などを意味するよう広く解釈されるべきである。
また、ソフトウェア、命令、情報などは、伝送媒体を介して送受信されてもよい。例えば、ソフトウェアが、有線技術(同軸ケーブル、光ファイバケーブル、ツイストペア、デジタル加入者回線(DSL:Digital Subscriber Line)など)及び無線技術(赤外線、マイクロ波など)の少なくとも一方を使用してウェブサイト、サーバ、又は他のリモートソースから送信される場合、これらの有線技術及び無線技術の少なくとも一方は、伝送媒体の定義内に含まれる。
本開示において説明した情報、信号などは、様々な異なる技術のいずれかを使用して表されてもよい。例えば、上記の説明全体に渡って言及され得るデータ、命令、コマンド、情報、信号、ビット、シンボル、チップなどは、電圧、電流、電磁波、磁界若しくは磁性粒子、光場若しくは光子、又はこれらの任意の組み合わせによって表されてもよい。
なお、本開示において説明した用語及び本開示の理解に必要な用語については、同一の又は類似する意味を有する用語と置き換えてもよい。例えば、チャネル及びシンボルの少なくとも一方は信号(シグナリング)であってもよい。また、信号はメッセージであってもよい。また、コンポーネントキャリア(CC:Component Carrier)は、キャリア周波数、セル、周波数キャリアなどと呼ばれてもよい。
本開示において使用する「システム」及び「ネットワーク」という用語は、互換的に使用される。
また、本開示において説明した情報、パラメータなどは、絶対値を用いて表されてもよいし、所定の値からの相対値を用いて表されてもよいし、対応する別の情報を用いて表されてもよい。例えば、無線リソースはインデックスによって指示されるものであってもよい。
上述したパラメータに使用する名称はいかなる点においても限定的な名称ではない。さらに、これらのパラメータを使用する数式等は、本開示で明示的に開示したものと異なる場合もある。様々なチャネル(例えば、PUCCH、PDCCHなど)及び情報要素は、あらゆる好適な名称によって識別できるので、これらの様々なチャネル及び情報要素に割り当てている様々な名称は、いかなる点においても限定的な名称ではない。
本開示においては、「移動局(MS:Mobile Station)」、「ユーザ端末(user terminal)」、「ユーザ装置(UE:User Equipment)」、「端末」などの用語は、互換的に使用され得る。
移動局は、当業者によって、加入者局、モバイルユニット、加入者ユニット、ワイヤレスユニット、リモートユニット、モバイルデバイス、ワイヤレスデバイス、ワイヤレス通信デバイス、リモートデバイス、モバイル加入者局、アクセス端末、モバイル端末、ワイヤレス端末、リモート端末、ハンドセット、ユーザエージェント、モバイルクライアント、クライアント、又はいくつかの他の適切な用語で呼ばれる場合もある。
本開示で使用する「判断(determining)」、「決定(determining)」という用語は、多種多様な動作を包含する場合がある。「判断」、「決定」は、例えば、判定(judging)、計算(calculating)、算出(computing)、処理(processing)、導出(deriving)、調査(investigating)、探索(looking up、search、inquiry)(例えば、テーブル、データベース又は別のデータ構造での探索)、確認(ascertaining)した事を「判断」「決定」したとみなす事などを含み得る。また、「判断」、「決定」は、受信(receiving)(例えば、情報を受信すること)、送信(transmitting)(例えば、情報を送信すること)、入力(input)、出力(output)、アクセス(accessing)(例えば、メモリ中のデータにアクセスすること)した事を「判断」「決定」したとみなす事などを含み得る。また、「判断」、「決定」は、解決(resolving)、選択(selecting)、選定(choosing)、確立(establishing)、比較(comparing)などした事を「判断」「決定」したとみなす事を含み得る。つまり、「判断」「決定」は、何らかの動作を「判断」「決定」したとみなす事を含み得る。また、「判断(決定)」は、「想定する(assuming)」、「期待する(expecting)」、「みなす(considering)」などで読み替えられてもよい。
「接続された(connected)」、「結合された(coupled)」という用語、又はこれらのあらゆる変形は、2又はそれ以上の要素間の直接的又は間接的なあらゆる接続又は結合を意味し、互いに「接続」又は「結合」された2つの要素間に1又はそれ以上の中間要素が存在することを含むことができる。要素間の結合又は接続は、物理的なものであっても、論理的なものであっても、或いはこれらの組み合わせであってもよい。例えば、「接続」は「アクセス」で読み替えられてもよい。本開示で使用する場合、2つの要素は、1又はそれ以上の電線、ケーブル及びプリント電気接続の少なくとも一つを用いて、並びにいくつかの非限定的かつ非包括的な例として、無線周波数領域、マイクロ波領域及び光(可視及び不可視の両方)領域の波長を有する電磁エネルギーなどを用いて、互いに「接続」又は「結合」されると考えることができる。
本開示において使用する「に基づいて」という記載は、別段に明記されていない限り、「のみに基づいて」を意味しない。言い換えれば、「に基づいて」という記載は、「のみに基づいて」と「に少なくとも基づいて」の両方を意味する。
本開示において使用する「第1の」、「第2の」などの呼称を使用した要素へのいかなる参照も、それらの要素の量又は順序を全般的に限定しない。これらの呼称は、2つ以上の要素間を区別する便利な方法として本開示において使用され得る。したがって、第1及び第2の要素への参照は、2つの要素のみが採用され得ること、又は何らかの形で第1の要素が第2の要素に先行しなければならないことを意味しない。
上記の各装置の構成における「手段」を、「部」、「回路」、「デバイス」等に置き換えてもよい。
本開示において、「含む(include)」、「含んでいる(including)」及びそれらの変形が使用されている場合、これらの用語は、用語「備える(comprising)」と同様に、包括的であることが意図される。さらに、本開示において使用されている用語「又は(or)」は、排他的論理和ではないことが意図される。
本開示において、例えば、英語でのa, an及びtheのように、翻訳により冠詞が追加された場合、本開示は、これらの冠詞の後に続く名詞が複数形であることを含んでもよい。
本開示において、「AとBが異なる」という用語は、「AとBが互いに異なる」ことを意味してもよい。なお、当該用語は、「AとBがそれぞれCと異なる」ことを意味してもよい。「離れる」、「結合される」などの用語も、「異なる」と同様に解釈されてもよい
100…対話装置、200…ユーザ端末、101…対話部、102…抽出部、103…検索部、104…対話情報生成部、105…グラフデータベース、106…テンプレートデータベース。

Claims (7)

  1. 複数の登録単語を、相互に関連性を示す関連情報を用いて構造的に記憶する記憶部と、
    ユーザの発話内容を解析する解析部と、
    前記発話内容から主単語を抽出する抽出部と、
    前記主単語をキーにして、前記記憶部を検索して、対応する登録単語および関連情報を、応答単語および応答関連情報として取得する検索部と、
    前記応答単語および前記応答関連情報を用いて応答内容を生成して出力する応答部と、
    を備え、
    前記記憶部は、前記関連情報で関連付けられる登録単語で示されている状態が継続しているか否かを示す継続情報を記憶し、
    前記応答部は、
    前記継続情報が、前記状態が継続していることを示している場合には、当該状態が現在形で表現される応答内容を生成し、
    前記継続情報が、前記状態が継続していないことを示している場合には、当該状態は過去において発生した状態であることを示す応答内容を生成する、
    対話装置。
  2. 複数の登録単語を、相互に関連性を示す関連情報を用いて構造的に記憶する記憶部と、
    ユーザの発話内容を解析する解析部と、
    前記発話内容から主単語を抽出する抽出部と、
    前記主単語をキーにして、前記記憶部を検索して、対応する登録単語および関連情報を、応答単語および応答関連情報として取得する検索部と、
    前記応答単語および前記応答関連情報を用いて応答内容を生成して出力する応答部と、
    を備え、
    前記検索部は、前記主単語に基づいて応答単語として取得された登録単語に対して補足情報が必要か否かを判断し、
    前記検索部は、補足情報が必要である場合には、前記応答単語として抽出された登録単語の所定の関連性を示す関連情報の登録単語に基づいて、補足応答単語および補足応答関連情報として取得し、
    前記応答部は、前記応答内容に加えて、前記補足応答単語および補足応答関連情報を用いた補足応答内容をさらに生成し、
    前記記憶部は、前記関連情報に方向性を持たせて前記登録単語同士を関連付け、
    前記検索部は、前記応答単語として抽出された登録単語に対して、所定数未満の他の登録単語から前記関連情報で関連付けがなれているか否かを判断することで、補足情報が必要であるか否かを判断する、
    対話装置。
  3. 応答内容を生成するためのテンプレートと応答関連情報とを対応付けたテンプレートデータベースをさらに備え、
    前記応答部は、取得された前記応答関連情報に対応するテンプレートを取得し、当該テンプレートに前記応答単語を挿入した応答内容を生成して出力する、
    請求項1または2に記載の対話装置。
  4. 前記記憶部において、前記主単語に一致する登録単語に対して複数の他の登録単語がそれぞれ関連情報で関連付けて記憶されている場合、前記検索部は、前記複数の他の登録単語から登録単語をランダムに選択して、応答単語および応答関連情報として取得する、請求項1~3のいずれか一項に記載の対話装置。
  5. 前記記憶部は、さらに前記登録単語同士の類似度を記憶しており、
    前記記憶部において、前記主単語に一致する登録単語に対して複数の他の登録単語が記憶されている場合、前記検索部は、前記類似度に基づいて登録単語を選択して、応答単語および応答関連情報として取得する、請求項1~3のいずれか一項に記載の対話装置。
  6. 前記記憶部において、前記主単語に一致する登録単語に対して複数の他の登録単語が記憶されている場合、
    前記検索部は、前記主単語に一致する登録単語から関連情報で関連付けられる他の登録単語のうち所定の関連性を示す関連情報の登録単語に基づいて他の関連情報で関連付けられる登録単語を選択して、応答単語および応答関連情報として取得する、請求項1~3のいずれか一項に記載の対話装置。
  7. 前記検索部は、主単語に対して取得された登録単語を用いた第1の応答内容が生成された後、前記登録単語に関連付けられる他の登録単語を、応答単語として取得し、
    当該応答単語は、前記主単語に一致する登録単語が関連情報を用いて関連付けられる登録単語に、共通して関連付けられており、
    前記応答部は、前記第1の応答内容に加えて、他の登録単語を含んだ第2の応答内容を生成する、
    請求項1~6のいずれか一項に記載の対話装置。
JP2020546851A 2018-09-13 2019-08-29 対話装置 Active JP7166350B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2018171815 2018-09-13
JP2018171815 2018-09-13
PCT/JP2019/033970 WO2020054451A1 (ja) 2018-09-13 2019-08-29 対話装置

Publications (2)

Publication Number Publication Date
JPWO2020054451A1 JPWO2020054451A1 (ja) 2021-08-30
JP7166350B2 true JP7166350B2 (ja) 2022-11-07

Family

ID=69778275

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020546851A Active JP7166350B2 (ja) 2018-09-13 2019-08-29 対話装置

Country Status (3)

Country Link
US (1) US20210312919A1 (ja)
JP (1) JP7166350B2 (ja)
WO (1) WO2020054451A1 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190098110A (ko) * 2019-08-02 2019-08-21 엘지전자 주식회사 지능형 프레젠테이션 방법
US11928096B2 (en) * 2020-12-16 2024-03-12 Sap Se Systems and methods using generic database search models
US20230067688A1 (en) * 2021-08-27 2023-03-02 Microsoft Technology Licensing, Llc Knowledge base with type discovery
US12210831B2 (en) * 2021-08-27 2025-01-28 Microsoft Technology Licensing, Llc. Knowledge base with type discovery
US12494058B2 (en) * 2021-12-07 2025-12-09 Insight Direct Usa, Inc. Relationship modeling and key feature detection based on video data
CN114625899B (zh) * 2022-03-14 2023-09-08 北京百度网讯科技有限公司 信息处理方法、装置、电子设备以及存储介质
JP7761190B1 (ja) * 2024-11-29 2025-10-28 株式会社エクサウィザーズ 方法、プログラム、情報処理装置及び情報処理システム

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003202895A (ja) 2002-01-10 2003-07-18 Sony Corp 対話装置及び対話制御方法、記憶媒体、並びにコンピュータ・プログラム
US20070239432A1 (en) 2006-03-30 2007-10-11 Microsoft Corporation Common word graph based multimodal input
WO2011036762A1 (ja) 2009-09-25 2011-03-31 株式会社東芝 音声対話装置およびプログラム
JP2015118710A (ja) 2015-01-09 2015-06-25 株式会社東芝 対話装置、方法及びプログラム
WO2017212689A1 (ja) 2016-06-08 2017-12-14 シャープ株式会社 応答装置および応答装置の制御方法、制御プログラム

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5148366A (en) * 1989-10-16 1992-09-15 Medical Documenting Systems, Inc. Computer-assisted documentation system for enhancing or replacing the process of dictating and transcribing
JP2001005488A (ja) * 1999-06-18 2001-01-12 Mitsubishi Electric Corp 音声対話システム
US20070174258A1 (en) * 2006-01-23 2007-07-26 Jones Scott A Targeted mobile device advertisements
JP4609527B2 (ja) * 2008-06-03 2011-01-12 株式会社デンソー 自動車用情報提供システム
US20100017381A1 (en) * 2008-07-09 2010-01-21 Avoca Semiconductor Inc. Triggering of database search in direct and relational modes
US9575963B2 (en) * 2012-04-20 2017-02-21 Maluuba Inc. Conversational agent
KR101353521B1 (ko) * 2012-05-10 2014-01-23 경북대학교 산학협력단 키워드 추출 방법 및 시스템, 그리고 대화 보조 장치
GB201814121D0 (en) * 2018-08-30 2018-10-17 Liopa Ltd Liopa

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003202895A (ja) 2002-01-10 2003-07-18 Sony Corp 対話装置及び対話制御方法、記憶媒体、並びにコンピュータ・プログラム
US20070239432A1 (en) 2006-03-30 2007-10-11 Microsoft Corporation Common word graph based multimodal input
WO2011036762A1 (ja) 2009-09-25 2011-03-31 株式会社東芝 音声対話装置およびプログラム
JP2015118710A (ja) 2015-01-09 2015-06-25 株式会社東芝 対話装置、方法及びプログラム
WO2017212689A1 (ja) 2016-06-08 2017-12-14 シャープ株式会社 応答装置および応答装置の制御方法、制御プログラム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
久保村 千明、亀田 弘之,連想概念辞書を利用した話題制御,電子情報通信学会技術研究報告,日本,一般社団法人電子情報通信学会,2013年10月12日,第113巻 第253号,pp.25-30
山内 祐輝 外4名,対話システムにおける単語間の関係性を用いた話題誘導応答文生成,電子情報通信学会技術研究報告,日本,一般社団法人電子情報通信学会,2012年12月13日,第112巻 第369号,pp.13-19

Also Published As

Publication number Publication date
JPWO2020054451A1 (ja) 2021-08-30
US20210312919A1 (en) 2021-10-07
WO2020054451A1 (ja) 2020-03-19

Similar Documents

Publication Publication Date Title
JP7166350B2 (ja) 対話装置
JP6802364B2 (ja) 対話システム
JP7054732B2 (ja) 対話システム
JP7323370B2 (ja) 審査装置
JP7054731B2 (ja) 対話システム
JP7016405B2 (ja) 対話サーバ
JP7087095B2 (ja) 対話情報生成装置
JP7216199B2 (ja) 対話システム
JPWO2019216054A1 (ja) 対話サーバ
JP7548912B2 (ja) リランキング装置
US20200372054A1 (en) Conversation system
JP2019179394A (ja) 情報提示システム
WO2024241734A1 (ja) 文脈文決定システム、機械翻訳装置および学習装置
JP2019175054A (ja) 文章マッチングシステム
JP2024148616A (ja) 情報処理装置
WO2025191808A1 (ja) 情報処理装置および情報処理方法
JP2025135970A (ja) 装置および情報処理方法
WO2025191809A1 (ja) 情報処理装置および情報処理方法
WO2025262809A1 (ja) 装置および方法
WO2025257982A1 (ja) プロンプト生成装置及び方法
JP2020035261A (ja) トピック分割装置
CN112000797A (zh) 基于神经网络的文本处理方法、设备、装置和存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210212

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220510

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220613

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221018

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221025

R150 Certificate of patent or registration of utility model

Ref document number: 7166350

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250