JP6828812B2 - 情報処理装置、情報処理方法及びプログラム - Google Patents

情報処理装置、情報処理方法及びプログラム Download PDF

Info

Publication number
JP6828812B2
JP6828812B2 JP2019518776A JP2019518776A JP6828812B2 JP 6828812 B2 JP6828812 B2 JP 6828812B2 JP 2019518776 A JP2019518776 A JP 2019518776A JP 2019518776 A JP2019518776 A JP 2019518776A JP 6828812 B2 JP6828812 B2 JP 6828812B2
Authority
JP
Japan
Prior art keywords
pair
utterance
expressions
text
act
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019518776A
Other languages
English (en)
Other versions
JPWO2018212142A1 (ja
Inventor
拓也 川田
拓也 川田
定政 邦彦
邦彦 定政
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2018212142A1 publication Critical patent/JPWO2018212142A1/ja
Application granted granted Critical
Publication of JP6828812B2 publication Critical patent/JP6828812B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation
    • G06F40/56Natural language generation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Machine Translation (AREA)
  • Electromagnetism (AREA)

Description

本発明は、対話テキストの意味を解析するための情報処理装置、情報処理方法、及びプログラムに関する。
従来、複数人の発話行為を表すテキストを分析して、有用な情報を抽出する技術の開発が進められている。なお、以下においては、複数人の発話から構成される一連のやり取りを表すテキストを、対話テキストと呼ぶ。また、対話テキストのうち、一つの発話を表すテキストを、発話テキストと呼ぶ。例えば、特許文献1には、複数の発話の内容を含む対話テキストを解析する装置が開示されている。
特許文献1に開示された解析装置では、対話テキストにおいて応答ペア(隣接ペア)となる第一の発話と第二の発話とが特定され、第一の発話の事象が第二の発話で否定されているか否かが判定される。そして、第一の発話の事象が第二の発話で否定されている場合、否定された第一の発話の事象を対話テキストから除いたデータが、テキスト処理用データとして生成される。このようにして生成されたテキスト処理用データでは、対話の中で否定された事象が削除されているので、データマイニング等のテキスト処理を精度良く行うことが可能になる。
上記のような対話テキストをコンピュータによって処理するためには、自然言語で表された対話テキストを、論理形式の言語(形式言語)に変換する必要がある。そこで、従来、自然言語を形式言語に変換するために、意味解析器(semantic parser)が用いられている(例えば、非特許文献1参照)。意味解析器では、予め設定されたパラメータに基づいて、自然言語で表されたテキストが形式言語の式に変換される。
特許第5867410号公報
Percy Liang, Michael Jordan, and Dan Klein. 2011. Learning dependency-based compositional semantics. In Proceedings of the Human Language Technology Conference of the Association for Computational Linguistics, pages 590-599, Portland, Oregon.
ところで、対話テキストでは、対話テキストを構成する発話テキスト間において、「依頼−同意」及び「質問−回答」といった隣接ペアに代表される発話行為上の依存関係がみられる場合がある。
しかしながら、従来の意味解析器が解析できる対象は一つの独立した発話テキストに限定され、一つの発話テキストの意味を解析する際に、対話テキスト中の他の発話テキストを参照することはできない。言い換えると、従来の意味解析器では、一つの独立した発話テキストごとに意味解析が実行されるので、一つの発話テキストの意味解析を行なう際に、他の発話テキストとの依存関係を考慮することができない。
例えば、A社とB社との対話テキスト中に「私たちもコンテナ船を選びます(We will choose containership, too.)」というB社の発話テキストが含まれているとする。この場合、前後の文脈を考慮しなければ、上記B社の発話テキストが示す意味は、「私たちもコンテナ船を買います」と解釈されたり、「私たちもコンテナ船に乗ります」と解釈されたりすることが考えられる。しかし、例えば、B社の上記発話テキストの前に「A社がB社に対して、(不定期船ではなく)コンテナ船の運賃値上げを提案している」という文脈があると仮定すると、B社の上記発話テキストの内容は、B社の同意行為として解釈される。すなわち、B社の上記発話テキストは、B社もコンテナ船の運転値上げに同意したことを意味していると解釈できる。このように、対話テキストが、文脈によって(すなわち、他の発話テキストとの関係によって)、解釈が変わる曖昧な発話テキストを含む場合、発話テキスト間の依存関係を考慮した意味解析を行なうことができない従来の意味解析器では、対話テキスト全体を精度良く意味解析することは困難である。
そのため、対話テキスト全体をコンピュータによって精度良く意味解析するためには、対話テキストの中から、依存関係を有する発話テキストのペアを適切に特定する必要がある。これによって、発話テキスト間の依存関係を考慮した意味解析を行なうことが可能になり、各発話テキストを適切な形式言語に変換することが可能になる。
本発明の目的の一例は、依存関係を有する発話テキストを特定することを可能にする、情報処理装置、情報処理方法、及びプログラムを提供することにある。
上記目的を達成するため、本発明の一側面における情報処理装置は、
対話テキストを構成する複数の発話テキストをそれぞれ、予め設定されたパラメータを用いて発話内行為を表す述語を含む形式言語に変換することによって、複数の発話行為式を生成する、発話行為式生成部と、
互いに関連する一対の発話内行為を表す述語によってそれぞれ構成された複数の述語ペアを示すペア情報に基づいて、前記対話テキスト中の任意の発話テキストから前記発話行為式生成部によって生成された発話行為式と、前記任意の発話テキスト以外の複数の発話テキストから前記発話行為式生成部によって生成された複数の発話行為式のうち前記任意の発話行為式に含まれる述語と前記述語ペアを構成する述語を含む一つの発話行為式とを、隣接ペアを示す発話行為式のペアとして抽出する、隣接ペア抽出部と、
を備えたことを特徴とする。
また、上記目的を達成するため、本発明の一側面における情報処理方法は、
(a)対話テキストを構成する複数の発話テキストをそれぞれ、予め設定されたパラメータを用いて発話内行為を表す述語を含む形式言語に変換することによって、複数の発話行為式を生成する、ステップと、
(b)互いに関連する一対の発話内行為を表す述語によってそれぞれ構成された複数の述語ペアを示すペア情報に基づいて、前記対話テキスト中の任意の発話テキストから前記ステップ(a)で生成された発話行為式と、前記任意の発話テキスト以外の複数の発話テキストから前記ステップ(a)で生成された複数の発話行為式のうち前記任意の発話行為式に含まれる述語と前記述語ペアを構成する述語を含む一つの発話行為式とを、隣接ペアを示す発話行為式のペアとして抽出する、ステップと、
を備えたことを特徴とする。
更に、上記目的を達成するため、本発明の一側面におけるプログラムは、
コンピュータに、
(a)対話テキストを構成する複数の発話テキストをそれぞれ、予め設定されたパラメータを用いて発話内行為を表す述語を含む形式言語に変換することによって、複数の発話行為式を生成する、ステップと、
(b)互いに関連する一対の発話内行為を表す述語によってそれぞれ構成された複数の述語ペアを示すペア情報に基づいて、前記対話テキスト中の任意の発話テキストから前記ステップ(a)で生成された発話行為式と、前記任意の発話テキスト以外の複数の発話テキストから前記ステップ(a)で生成された複数の発話行為式のうち前記任意の発話行為式に含まれる述語と前記述語ペアを構成する述語を含む一つの発話行為式とを、隣接ペアを示す発話行為式のペアとして抽出する、ステップと、
を実行させる命令を含む、ことを特徴とする。
以上のように本発明によれば、依存関係を有する発話テキストを特定することができる。
図1は、本実施の形態における情報処理装置を示すブロック図である。 図2は、本発明の実施の形態における情報処理装置の具体的構成を示すブロック図である。 図3は、ペア情報格納部に格納されるペア情報の一例を示す図である。 図4は、発話行為式生成部に入力される発話テキスト及び発話行為式生成部によって生成される発話行為式の一例を示す図である。 図5は、発話行為式のペアの一例を示す図である。 図6は、対話情報の一例を示す図である。 図7は、本発明の実施の形態における情報処理装置の動作を示すフロー図である。 図8は、本発明の実施の形態における情報処理装置を実現するコンピュータの一例を示すブロック図である。
(実施の形態)
以下、本発明の実施の形態における、情報処理装置、情報処理方法及びプログラムについて、図1〜8を参照しながら説明する。
[装置構成]
図1は、本実施の形態における情報処理装置10を示すブロック図である。図1に示すように、本実施の形態おける情報処理装置10は、発話行為式生成部12と、隣接ペア抽出部14とを備えている。
発話行為式生成部12には、自然言語で記述された対話テキストが入力される。本実施形態では、対話テキストは、複数の発話テキストによって構成される。なお、本実施形態においては、複数の発話者の発話から構成される一連のやり取りを表すテキストを、対話テキストと呼ぶ。また、対話テキストのうち、一つの発話を表すテキストを、発話テキストと呼ぶ。
発話行為式生成部12は、発話行為式生成手段として機能する。具体的には、発話行為式生成部12は、複数の発話テキストをそれぞれ、予め設定されたパラメータを用いて発話内行為を表す述語を含む形式言語に変換する。これにより、各発話テキストから、形式言語で記述された発話行為式が生成される。本実施形態では、発話行為式生成部12は、各発話テキストを、1以上の発話行為式に変換する。なお、発話行為式生成部12としては、自然言語のテキストが入力されるとパラメータに基づいて形式言語の式を出力する公知の意味解析器を用いることができる。具体的には、例えば、非特許文献1に開示された技術を発話行為式生成部12に利用することができる。
隣接ペア抽出部14は、隣接ペア抽出手段として機能する。具体的には、隣接ペア抽出部14は、発話行為式生成部12によって生成された複数の発話行為式の中から、隣接ペアを示す発話行為式のペアを抽出する。なお、本実施形態において隣接ペアとは、任意の発話者の発話行為(以下、第1成分の発話行為という。)と、その発話行為に連鎖する他の発話者の発話行為(以下、第2成分の発話行為という。)との組合せのことをいう。対話テキストにおいては、一つの第1成分の発話行為に対して、複数の第2成分の発話行為が存在する場合がある。
また、本実施形態では、隣接ペア抽出部14は、予め設定されたペア情報を用いて、隣接ペアを示す発話行為式のペアを抽出する。詳細は後述するが、このペア情報は、複数の述語ペアを示す情報である。本実施形態において述語ペアとは、互いに関連する発話内行為(illocutionary acts)を表す述語のペアである。また、本実施形態において発話内行為とは、発話行為によって、その発話行為に含まれる発話者の意図が生じることをいう。具体的には、発話内行為とは、発話行為によって、質問、提案、回答、同意、反対、意志、忠告、命令、依頼等の発話者の意図が生じることをいう。したがって、本実施形態において述語ペアとは、一の発話内行為を示す述語(以下、第1成分の述語という。)と、その発話内行為に応答する他の発話者の発話内行為を示す述語(以下、第2成分の述語という。)とのペアである。本実施形態では、例えば、「質問(第1成分)」と「回答(第2成分)」との述語ペア、「提案(第1成分)」と「同意(第2成分)」との述語ペア、および「提案(第1成分)」と「反対(第2成分)」との述語ペアといった複数の述語ペアが、ペア情報として予め設定されている。
詳細は後述するが、本実施形態では、隣接ペア抽出部14は、例えば、発話行為式生成部12によって任意の一つの発話テキストから生成された1以上の発話行為式(以下、第1成分候補の発話行為式という。)の中から、第1成分の述語を有する発話行為式を抽出する。以下、第1成分候補の発話行為式から抽出された発話行為式を、第1成分の発話行為式という。また、第1成分候補の発話行為式の元となった発話テキストを、第1成分の発話テキストという。
次に、隣接ペア抽出部14は、上述のペア情報に基づいて、上記第1成分候補の発話行為式以外の複数の発話行為式(以下、第2成分候補の発話行為式という。)の中から、第1成分の発話行為式が有する第1成分の述語に対応する第2成分の述語を有する発話行為式を抽出する。以下、第2成分候補の発話行為式から抽出された発話行為式を、第2成分の発話行為式という。また、第2成分候補の発話行為式の元となった発話テキストを、第2成分の発話テキストという。
本実施形態では、隣接ペア抽出部14は、上記のようにして抽出した第1成分の発話行為式と第2成分の発話行為式とを、隣接ペアを示す発話行為式のペアとして出力する。
以上のように、本実施形態では、予め設定されたペア情報に基づいて、複数の発話テキストから生成された複数の発話行為式の中から、隣接ペアを示す発話行為式のペアを抽出することができる。より具体的には、任意に抽出された第1成分の発話行為式が有する第1成分の述語を考慮して、第2成分の発話行為式を抽出することができる。したがって、本実施形態では、第1成分の発話行為の内容を考慮して、第2成分の発話行為式を抽出することができる。言い換えると、一つの発話テキスト(第2成分の発話テキスト)の意味解析を行なう際に、他の発話テキスト(第1成分の発話テキスト)との依存関係を考慮することができる。これにより、各発話テキストを適切な形式言語に変換することが可能になる。
続いて、図2を用いて、本発明の実施の形態における情報処理装置の構成について更に具体的に説明する。図2には、本発明の実施の形態における情報処理装置の具体的構成を示すブロック図が示されている。
図2を参照して、本実施形態に係る情報処理装置10は、上述の発話行為式生成部12及び隣接ペア抽出部14に加えて更に、対話テキスト入力部16、パラメータ格納部18、ペア情報格納部20、アラートペア格納部22、及びアラート部24を備えている。また、本実施形態では、隣接ペア抽出部14は、隣接ペア候補抽出部14a、隣接ペア判定部14b、及び対話構造構成部14cを含む。
本実施形態では、パラメータ格納部18には、自然言語のテキストを形式言語に変換する際に発話行為式生成部12によって利用されるパラメータが格納されている。なお、上述したように、自然言語のテキストを形式言語に変換する技術としては、公知の意味解析器の技術を利用できるので、発話行為式生成部12及びパラメータ格納部18の詳細な説明は省略する。
ペア情報格納部20には、ペア情報が格納されている。図3は、ペア情報格納部20に格納されるペア情報の一例を示す図である。図3に示すように、本実施形態では、ペア情報格納部20には、ペア情報として、複数の述語ペアと、各述語ペアに付与された重みが格納されている。なお、図3の例では、「提案」を第1成分の述語とする4つの述語ペアと、「質問」を第1成分の述語とする4つの述語ペアが示されているが、述語ペアの組み合わせ、述語ペアの数、及び各述語ペアの重みは図3の例に限定されず、適宜設定することができる。
アラートペア格納部22には、アラート述語ペアが格納されている。本実施形態においてアラート述語ペアとは、例えば、情報処理装置10の管理者によって予め設定される述語ペアである。本実施形態では、例えば、「提案−同意」の述語ペアが、アラート述語ペアとしてアラートペア格納部22に格納されている。アラート述語ペアについては後述する。
図2を参照して、対話テキスト入力部16は、発話行為式生成部12に対話テキストを入力する。なお、本実施形態では、対話テキスト入力部16は、例えば、メール又は対話ログ等から、対話テキスト(複数の発話者の発話テキスト)を抽出し、抽出した対話テキストを発話行為式生成部12へ入力する。
発話行為式生成部12は、パラメータ格納部18に格納されたパラメータを用いて、対話テキスト入力部16から入力された各発話テキストを、形式言語で記述された発話行為式に変換する。
図4に、発話行為式生成部12に入力される発話テキスト及び発話行為式生成部12によって生成される発話行為式の一例を示す。図4に示すように、本実施形態では、発話行為式生成部12は、各発話テキストを、1以上の発話行為式に変換する。なお、図4に示した発話行為式は一例であり、発話行為式生成部12が、各発話テキストを3以上の発話行為式に変換してもよい。また、図4に示した形式言語は一例であり、発話行為式生成部12が、他の形式言語で記述された発話行為式を生成してもよい。
図2を参照して、発話行為式生成部12は、生成した発話行為式を隣接ペア抽出部14の隣接ペア候補抽出部14aへ入力する。隣接ペア候補抽出部14aは、ペア情報格納部20に格納されたペア情報に基づいて、発話行為式生成部12から入力された複数の発話行為式の中から、隣接ペアに対応する発話行為式のペアの候補を抽出する。
具体的には、隣接ペア候補抽出部14aは、まず、ペア情報(図3参照)に基づいて、複数の発話行為式の中から、第1成分の述語を有する発話行為式を抽出する。例えば、図4に示す複数の発話行為式が隣接ペア候補抽出部14aに入力された場合、隣接ペア候補抽出部14aは、まず、第1成分の述語「提案」を有するA社の発話行為式「提案(A,e1)∧値上げ({A,B},運賃(コンテナ船))」を抽出する。
次に、隣接ペア候補抽出部14aは、ペア情報(図3参照)に基づいて、A社の発話行為式の第1成分の述語「提案」と述語ペアを構成する第2成分の述語「質問」を有するB社の発話行為式「質問(B,e2)∧設定(A,運賃)」を、発話行為式「提案(A,e1)∧値上げ({A,B},運賃(コンテナ船))」のペア候補として抽出する。更に、図4及び図5を参照して、隣接ペア候補抽出部14aは、第2成分の述語「同意」を有するB社の発話行為式「同意(B,e1)」及び第2成分の述語「意志」を有するB社の発話行為式「意志(B)∧選択(B)」をそれぞれ、発話行為式「提案(A,e1)∧値上げ({A,B},運賃(コンテナ船))」のペア候補として抽出する。
詳細な説明は省略するが、図5に示すように、A社の発話行為式「質問(A,e1)∧値上げ({A,B},運賃(コンテナ船))」についても同様に、ペア情報に基づいて、発話行為式「検討(B)∧値上げ(B,運賃(不定期船))」、「同意(B,e1)」及び「意志(B)∧選択(B)」がペア候補の発話行為式として抽出される。また、図示は省略するが、第1成分の述語を有する他の発話行為式についても同様に、発話行為式ごとにペア候補となる発話行為式が抽出される。このようにして、隣接ペア候補抽出部14aは、隣接ペアに対応する発話行為式のペアの候補を抽出し、抽出した複数のペアの候補を隣接ペア判定部14bに入力する。
図2を参照して、隣接ペア判定部14bは、ペア情報格納部20に格納されたペア情報に基づいて、隣接ペア候補抽出部14aから入力された複数のペアの候補の中から、隣接ペアとして適切な発話行為式のペア(尤もらしいペア)を判定する。
例えば、図4の発話テキスト「私たちはコンテナ船の運賃値上げを検討していますが、いかがでしょうか。」について、図5に示すように、隣接ペアに対応する発話行為式のペアの候補として、6通りの発話行為式の組み合わせが隣接ペア判定部14bに入力されたとする。この場合、隣接ペア判定部14bは、最も大きい重みが付与された述語ペア「提案‐同意」に対応する発話行為式のペアを、隣接ペアとして尤もらしい発話行為式のペアとして判定する。すなわち、図5の例では、「提案(A,e1)∧値上げ({A,B},運賃(コンテナ船))」と「同意(B,e1)」との組み合わせが、適切な発話行為式のペアとして判定される。
本実施形態では、隣接ペア判定部14bは、発話テキストごとに、適切な発話行為式のペアの判定を行う。すなわち、隣接ペア判定部14bは、発話テキストごとに、隣接ペアを示す発話行為式のペアを探索する。詳細な説明は省略するが、例えば、図4の発話テキスト「ところで、A社様はいくらに設定するおつもりですか?」について、隣接ペア判定部14bは、「質問(B,e2)∧設定(A,運賃)」と「回答(A,e2)∧設定(A,運賃)」との組み合わせを、適切な発話行為式のペアとして判定する。
隣接ペア判定部14bは、適切な発話行為式のペアとして判定した発話行為式の組合せを、対話構造構成部14cに入力する。対話構造構成部14cは、対話構造構成手段として機能する。具体的には、対話構造構成部14cは、入力された発話行為式のペアごとに、対話構造を示す対話情報を生成する。本実施形態では、対話構造構成部14cは、対話情報として、形式言語で記述された対話式を生成する。例えば、「提案(A,e1)∧値上げ({A,B},運賃(コンテナ船))」と「同意(B,e1)」とのペア、及び「質問(B,e2)∧設定(A,運賃)」と「回答(A,e2)∧設定(A,運賃)」とのペアが入力された場合、対話構造構成部14cは、図6に示すような2つの対話情報(対話式)を生成する。本実施形態では、対話構造構成部14cは、隣接ペア判定部14bから入力された発話行為式のペアごとに、発話行為式のペアに含まれる述語ペア(本実施形態では、「提案‐同意」の述語ペア及び「質問−回答」の述語ペア)を用いて対話情報を生成する。本実施形態では、対話構造構成部14cは、例えば、ペア情報格納部20に格納されたペア情報に基づいて、発話行為式のペアごとに、対話情報を生成する。対話構造構成部14cは、生成した対話情報を、アラート部24に入力する。また、本実施形態では、対話構造構成部14cは更に、生成した対話情報を、例えば図示しない表示装置等に出力し、表示する。
アラート部24は、アラート手段として機能する。具体的には、アラート部24は、アラートペア格納部22に格納されているアラート述語ペアに基づいて、アラート信号を生成する。具体的には、アラート部24は、対話構造構成部14cから入力された対話情報がアラート述語ペアを有している場合に、アラート信号を生成する。例えば、「提案−同意」のアラート述語ペアがアラートペア格納部22に格納されており、更に、図6に示した2つの対話情報がアラート部24に入力されたとする。この場合には、アラート部24は、一方の対話情報「提案(e1)‐同意(e1)∧値上げ(運賃)」が、アラート述語ペア「提案−同意」を有していると判定し、アラート信号を生成する。本実施形態では、アラート部24は、例えば、図示しない表示装置等にアラート信号を出力し、アラート情報を表示させる。なお、上記のアラート述語ペアは一例であり、他のアラート述語ペアがアラートペア格納部22に格納されていてもよい。また、アラートペア格納部22に格納されるアラート述語ペアの数は1つに限定されず、複数のアラート述語ペアがアラートペア格納部22に格納されていてもよい。
以上のように、本実施形態に係る情報処理装置10では、一つの発話テキストの意味解析を行なう際に、他の発話テキストとの依存関係を考慮することができる。これにより、例えば、上記のように、「選択します」という発話テキストを、「選択」という述語ではなく、「同意」という述語に変換することが可能となる。すなわち、発話テキスト間の依存関係を考慮して、各発話テキストを適切な形式言語に変換することが可能になる。
また、本実施形態では、隣接ペア抽出部14によって対話情報が生成されるので、ユーザは、対話情報を確認することによって、複数の発話者によって、どのようなやり取りが行われていたのかを容易に把握することができる。更に、本実施形態では、アラート部24は、アラートペア格納部22に予め格納されたアラート述語ペアに基づいて、アラート信号を生成する。したがって、アラート述語ペアを適切に設定することによって、例えば、複数の発話者によって、特定の規則に反する会話(例えば、コンプライアンス違反に関する会話)が行われていることを検知することが可能になる。
[装置動作]
次に、本発明の実施の形態における情報処理装置の動作について図7を用いて説明する。図7は、本発明の実施の形態における情報処理装置の動作を示すフロー図である。以下の説明においては、適宜図1〜図6を参酌する。また、本実施の形態では、情報処理装置10を動作させることによって、情報処理方法が実施される。よって、本実施の形態における情報処理方法の説明は、以下の情報処理装置10の動作説明に代える。
図7を参照して、情報処理装置10においては、上述したように、まず、対話テキスト入力部16が、発話行為式生成部12に対話テキスト(複数の発話テキスト)を入力する(ステップS1)。次に、発話行為式生成部12が、パラメータ格納部18に格納されたパラメータを用いて、対話テキスト入力部16から入力された各発話テキストを、形式言語で記述された発話行為式に変換する(ステップS2)。
次に隣接ペア候補抽出部14aが、ペア情報格納部20に格納されたペア情報に基づいて、発話行為式生成部12が生成した複数の発話行為式の中から、隣接ペアに対応する発話行為式のペアの候補を抽出する(ステップS3)。
次に、隣接ペア判定部14bが、ペア情報格納部20に格納されたペア情報に基づいて、隣接ペア候補抽出部14aから入力された複数のペアの候補の中から、隣接ペアとして尤もらしい発話行為式のペアを抽出する(ステップS4)。本実施形態では、ステップS4において、発話テキストごとに、隣接ペアとして尤もらしい発話行為式のペアが抽出される。
次に、対話構造構成部14cは、発話テキストごとに隣接ペア判定部14bから入力された発話行為式のペアに基づいて、対話構造を示す対話情報を生成する(ステップS5)。
次に、アラート部24は、対話構造構成部14cが生成した対話情報に、アラート述語ペアが含まれているか否かを判別する(ステップS6)。対話情報にアラート述語ペアが含まれている場合、アラート部24は、アラート信号を生成して、表示装置等にアラート情報を表示させる(ステップS7)。
一方、ステップS6において、対話情報にアラート述語ペアが含まれていない場合、アラート部24は、アラート信号を生成することなく、処理を終了する。
なお、上述の実施形態では、発話者の数が2である場合を例に挙げて説明したが、発話者の数は3以上であってもよい。
[プログラム]
本発明の実施の形態におけるプログラムは、コンピュータに、図7に示すステップS1〜S7を実行させるプログラムであればよい。このプログラムをコンピュータにインストールし、実行することによって、本実施の形態における情報処理装置と情報処理方法とを実現することができる。この場合、情報処理装置となるコンピュータのプロセッサは、発話行為式生成部12、隣接ペア抽出部14、対話テキスト入力部16、及びアラート部24として機能し、処理を行なう。また、本実施の形態では、パラメータ格納部18、ペア情報格納部20、及びアラートペア格納部22は、コンピュータに備えられたハードディスク等の記憶装置に、これらを構成するデータファイルを格納することによって、又はこのデータファイルが格納された記録媒体をコンピュータと接続された読取装置に搭載することによって実現されている。
また、本実施の形態におけるプログラムは、複数のコンピュータによって構築されたコンピュータシステムによって実行されてもよい。この場合は、例えば、各コンピュータが、それぞれ、発話行為式生成部12、隣接ペア候補抽出部14a、隣接ペア判定部14b、対話構造構成部14c、対話テキスト入力部16、及びアラート部24のいずれかとして機能してもよい。また、パラメータ格納部18、ペア情報格納部20、及びアラートペア格納部22は、本実施の形態におけるプログラムを実行するコンピュータとは別のコンピュータ上に構築されていても良い。
[物理構成]
ここで、本実施の形態におけるプログラムを実行することによって、情報処理装置を実現するコンピュータについて図を用いて説明する。図8は、本発明の実施の形態における情報処理装置を実現するコンピュータの一例を示すブロック図である。
図8に示すように、コンピュータ110は、CPU(Central Processing Unit)111と、メインメモリ112と、記憶装置113と、入力インターフェイス114と、表示コントローラ115と、データリーダ/ライタ116と、通信インターフェイス117とを備える。これらの各部は、バス121を介して、互いにデータ通信可能に接続される。なお、コンピュータ110は、CPU111に加えて、又はCPU111に代えて、GPU(Graphics Processing Unit)、又はFPGA(Field-Programmable Gate Array)を備えても良い。
CPU111は、記憶装置113に格納された、本実施の形態におけるプログラム(コード)をメインメモリ112に展開し、これらを所定順序で実行することにより、各種の演算を実施する。メインメモリ112は、典型的には、DRAM(Dynamic Random Access Memory)等の揮発性の記憶装置である。また、本実施の形態におけるプログラムは、コンピュータ読み取り可能な記録媒体120に格納された状態で提供される。なお、本実施の形態におけるプログラムは、通信インターフェイス117を介して接続されたインターネット上で流通するものであってもよい。
また、記憶装置113の具体例としては、ハードディスクドライブの他、フラッシュメモリ等の半導体記憶装置が挙げられる。入力インターフェイス114は、CPU111と、キーボードおよびマウスといった入力機器118との間のデータ伝送を仲介する。表示コントローラ115は、ディスプレイ装置119と接続され、ディスプレイ装置119での表示を制御する。
データリーダ/ライタ116は、CPU111と記録媒体120との間のデータ伝送を仲介し、記録媒体120からのプログラムの読み出し、およびコンピュータ110における処理結果の記録媒体120への書き込みを実行する。通信インターフェイス117は、CPU111と、他のコンピュータとの間のデータ伝送を仲介する。
また、記録媒体120の具体例としては、CF(Compact Flash(登録商標))およびSD(Secure Digital)等の汎用的な半導体記憶デバイス、フレキシブルディスク(Flexible Disk)等の磁気記憶媒体、またはCD−ROM(Compact Disk Read Only Memory)などの光学記憶媒体が挙げられる。
なお、本実施の形態における情報処理装置は、プログラムがインストールされたコンピュータではなく、各部に対応したハードウェアを用いることによっても実現可能である。更に、情報処理装置は、一部がプログラムで実現され、残りの部分がハードウェアで実現されていてもよい。
上述した実施の形態の一部又は全部は、以下に記載する(付記1)〜(付記12)によって実現することができるが、以下の記載に限定されるものではない。
(付記1)
対話テキストを構成する複数の発話テキストをそれぞれ、予め設定されたパラメータを用いて発話内行為を表す述語を含む形式言語に変換することによって、複数の発話行為式を生成する、発話行為式生成部と、
互いに関連する一対の発話内行為を表す述語によってそれぞれ構成された複数の述語ペアを示すペア情報に基づいて、前記対話テキスト中の任意の発話テキストから前記発話行為式生成部によって生成された発話行為式と、前記任意の発話テキスト以外の複数の発話テキストから前記発話行為式生成部によって生成された複数の発話行為式のうち前記任意の発話行為式に含まれる述語と前記述語ペアを構成する述語を含む一つの発話行為式とを、隣接ペアを示す発話行為式のペアとして抽出する、隣接ペア抽出部と、
を備えたことを特徴とする、情報処理装置。
(付記2)
前記ペア情報において、前記複数の述語ペアそれぞれに予め重みが付与されており、
前記任意の発話テキストから生成された一又は複数の発話行為式と、前記任意の発話テキスト以外の一つの発話テキストから生成された一又は複数の発話行為式とによって複数の発話行為式のペアが構成される場合、前記隣接ペア抽出部は、前記ペア情報において最も大きい重みが付与された前記述語ペアを含む発話行為式のペアを、前記隣接ペアを示す発話行為式のペアとして抽出する、
付記1に記載の情報処理装置。
(付記3)
前記隣接ペア抽出部は、前記発話テキストごとに、前記隣接ペアを示す発話行為式のペアを探索する、
付記1又は2に記載の情報処理装置。
(付記4)
前記隣接ペアを示す発話行為式のペアごとに、該発話行為式のペアに含まれる前記述語ペアを用いて、形式言語で記述された対話情報を生成する対話構造構成部と、
前記対話構造構成部が生成した対話情報に予め設定されたアラート述語ペアが含まれる場合にアラート信号を生成するアラート部と、
を更に備える、
付記1から3のいずれかに記載の情報処理装置。
(付記5)
(a)対話テキストを構成する複数の発話テキストをそれぞれ、予め設定されたパラメータを用いて発話内行為を表す述語を含む形式言語に変換することによって、複数の発話行為式を生成する、ステップと、
(b)互いに関連する一対の発話内行為を表す述語によってそれぞれ構成された複数の述語ペアを示すペア情報に基づいて、前記対話テキスト中の任意の発話テキストから前記ステップ(a)で生成された発話行為式と、前記任意の発話テキスト以外の複数の発話テキストから前記ステップ(a)で生成された複数の発話行為式のうち前記任意の発話行為式に含まれる述語と前記述語ペアを構成する述語を含む一つの発話行為式とを、隣接ペアを示す発話行為式のペアとして抽出する、ステップと、
を備えたことを特徴とする、情報処理方法。
(付記6)
前記ペア情報において、前記複数の述語ペアそれぞれに予め重みが付与されており、
前記任意の発話テキストから生成された一又は複数の発話行為式と、前記任意の発話テキスト以外の一つの発話テキストから生成された一又は複数の発話行為式とによって複数の発話行為式のペアが構成される場合、前記(b)のステップでは、前記ペア情報において最も大きい重みが付与された前記述語ペアを含む発話行為式のペアを、前記隣接ペアを示す発話行為式のペアとして抽出する、
付記5に記載の情報処理方法。
(付記7)
前記(b)のステップでは、前記発話テキストごとに、前記隣接ペアを示す発話行為式のペアを探索する、
付記5又は6に記載の情報処理方法。
(付記8)
(c)前記(b)のステップで抽出された発話行為式のペアごとに、該発話行為式のペアに含まれる前記述語ペアを用いて、形式言語で記述された対話情報を生成する、ステップと、
(d)前記(c)のステップで生成された対話情報に予め設定されたアラート述語ペアが含まれる場合にアラート信号を生成する、ステップと、
を更に備える、
付記5から7のいずれかに記載の情報処理方法。
(付記9)
コンピュータに、
(a)対話テキストを構成する複数の発話テキストをそれぞれ、予め設定されたパラメータを用いて発話内行為を表す述語を含む形式言語に変換することによって、複数の発話行為式を生成する、ステップと、
(b)互いに関連する一対の発話内行為を表す述語によってそれぞれ構成された複数の述語ペアを示すペア情報に基づいて、前記対話テキスト中の任意の発話テキストから前記ステップ(a)で生成された発話行為式と、前記任意の発話テキスト以外の複数の発話テキストから前記ステップ(a)で生成された複数の発話行為式のうち前記任意の発話行為式に含まれる述語と前記述語ペアを構成する述語を含む一つの発話行為式とを、隣接ペアを示す発話行為式のペアとして抽出する、ステップと、
を実行させる命令を含む、プログラム
(付記10)
前記ペア情報において、前記複数の述語ペアそれぞれに予め重みが付与されており、
前記任意の発話テキストから生成された一又は複数の発話行為式と、前記任意の発話テキスト以外の一つの発話テキストから生成された一又は複数の発話行為式とによって複数の発話行為式のペアが構成される場合、前記(b)のステップでは、前記ペア情報において最も大きい重みが付与された前記述語ペアを含む発話行為式のペアを、前記隣接ペアを示す発話行為式のペアとして抽出する、
付記9に記載のプログラム
(付記11)
前記(b)のステップでは、前記発話テキストごとに、前記隣接ペアを示す発話行為式のペアを探索する、
付記9又は10に記載のプログラム
(付記12)
記コンピュータに、
(c)前記(b)のステップで抽出された発話行為式のペアごとに、該発話行為式のペアに含まれる前記述語ペアを用いて、形式言語で記述された対話情報を生成する、ステップと、
(d)前記(c)のステップで生成された対話情報に予め設定されたアラート述語ペアが含まれる場合にアラート信号を生成する、ステップと、
を更に実行させる、
付記9から11のいずれかに記載のプログラム
以上、実施の形態を参照して本願発明を説明したが、本願発明は上記実施の形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
この出願は、2017年5月17日に出願された日本出願特願2017−098383を基礎とする優先権を主張し、その開示の全てをここに取り込む。
以上のように、本発明によれば、依存関係を有する発話テキストを特定することによって、各発話テキストの意味を適切に解析することができる。
10 情報処理装置
12 発話行為式生成部
14 隣接ペア抽出部
16 対話テキスト入力部
18 パラメータ格納部
20 ペア情報格納部
22 アラートペア格納部
24 アラート部
110 コンピュータ
111 CPU
112 メインメモリ
113 記憶装置
114 入力インターフェイス
115 表示コントローラ
116 データリーダ/ライタ
117 通信インターフェイス
118 入力機器
119 ディスプレイ装置
120 記録媒体
121 バス

Claims (12)

  1. 対話テキストを構成する複数の発話テキストをそれぞれ、予め設定されたパラメータを用いて発話内行為を表す述語を含む形式言語に変換することによって、複数の発話行為式を生成する、発話行為式生成手段と、
    互いに関連する一対の発話内行為を表す述語によってそれぞれ構成された複数の述語ペアを示すペア情報に基づいて、前記対話テキスト中の任意の発話テキストから前記発話行為式生成手段によって生成された発話行為式と、前記任意の発話テキスト以外の複数の発話テキストから前記発話行為式生成手段によって生成された複数の発話行為式のうち前記任意の発話行為式に含まれる述語と前記述語ペアを構成する述語を含む一つの発話行為式とを、隣接ペアを示す発話行為式のペアとして抽出する、隣接ペア抽出手段と、
    を備えたことを特徴とする、情報処理装置。
  2. 前記ペア情報において、前記複数の述語ペアそれぞれに予め重みが付与されており、
    前記任意の発話テキストから生成された一又は複数の発話行為式と、前記任意の発話テキスト以外の一つの発話テキストから生成された一又は複数の発話行為式とによって複数の発話行為式のペアが構成される場合、前記隣接ペア抽出手段は、前記ペア情報において最も大きい重みが付与された前記述語ペアを含む発話行為式のペアを、前記隣接ペアを示す発話行為式のペアとして抽出する、
    請求項1に記載の情報処理装置。
  3. 前記隣接ペア抽出手段は、前記発話テキストごとに、前記隣接ペアを示す発話行為式のペアを探索する、
    請求項1又は2に記載の情報処理装置。
  4. 前記隣接ペアを示す発話行為式のペアごとに、該発話行為式のペアに含まれる前記述語ペアを用いて、形式言語で記述された対話情報を生成する対話構造構成手段と、
    前記対話構造構成手段が生成した対話情報に予め設定されたアラート述語ペアが含まれる場合にアラート信号を生成するアラート手段と、
    を更に備える、
    請求項1から3のいずれかに記載の情報処理装置。
  5. (a)対話テキストを構成する複数の発話テキストをそれぞれ、予め設定されたパラメータを用いて発話内行為を表す述語を含む形式言語に変換することによって、複数の発話行為式を生成する、ステップと、
    (b)互いに関連する一対の発話内行為を表す述語によってそれぞれ構成された複数の述語ペアを示すペア情報に基づいて、前記対話テキスト中の任意の発話テキストから前記ステップ(a)で生成された発話行為式と、前記任意の発話テキスト以外の複数の発話テキストから前記ステップ(a)で生成された複数の発話行為式のうち前記任意の発話行為式に含まれる述語と前記述語ペアを構成する述語を含む一つの発話行為式とを、隣接ペアを示す発話行為式のペアとして抽出する、ステップと、
    を備えたことを特徴とする、情報処理方法。
  6. 前記ペア情報において、前記複数の述語ペアそれぞれに予め重みが付与されており、
    前記任意の発話テキストから生成された一又は複数の発話行為式と、前記任意の発話テキスト以外の一つの発話テキストから生成された一又は複数の発話行為式とによって複数の発話行為式のペアが構成される場合、前記(b)のステップでは、前記ペア情報において最も大きい重みが付与された前記述語ペアを含む発話行為式のペアを、前記隣接ペアを示す発話行為式のペアとして抽出する、
    請求項5に記載の情報処理方法。
  7. 前記(b)のステップでは、前記発話テキストごとに、前記隣接ペアを示す発話行為式のペアを探索する、
    請求項5又は6に記載の情報処理方法。
  8. (c)前記(b)のステップで抽出された発話行為式のペアごとに、該発話行為式のペアに含まれる前記述語ペアを用いて、形式言語で記述された対話情報を生成する、ステップと、
    (d)前記(c)のステップで生成された対話情報に予め設定されたアラート述語ペアが含まれる場合にアラート信号を生成する、ステップと、
    を更に備える、
    請求項5から7のいずれかに記載の情報処理方法。
  9. コンピュータに、
    (a)対話テキストを構成する複数の発話テキストをそれぞれ、予め設定されたパラメータを用いて発話内行為を表す述語を含む形式言語に変換することによって、複数の発話行為式を生成する、ステップと、
    (b)互いに関連する一対の発話内行為を表す述語によってそれぞれ構成された複数の述語ペアを示すペア情報に基づいて、前記対話テキスト中の任意の発話テキストから前記ステップ(a)で生成された発話行為式と、前記任意の発話テキスト以外の複数の発話テキストから前記ステップ(a)で生成された複数の発話行為式のうち前記任意の発話行為式に含まれる述語と前記述語ペアを構成する述語を含む一つの発話行為式とを、隣接ペアを示す発話行為式のペアとして抽出する、ステップと、
    を実行させる命令を含む、プログラム
  10. 前記ペア情報において、前記複数の述語ペアそれぞれに予め重みが付与されており、
    前記任意の発話テキストから生成された一又は複数の発話行為式と、前記任意の発話テキスト以外の一つの発話テキストから生成された一又は複数の発話行為式とによって複数の発話行為式のペアが構成される場合、前記(b)のステップでは、前記ペア情報において最も大きい重みが付与された前記述語ペアを含む発話行為式のペアを、前記隣接ペアを示す発話行為式のペアとして抽出する、
    請求項9に記載のプログラム
  11. 前記(b)のステップでは、前記発話テキストごとに、前記隣接ペアを示す発話行為式のペアを探索する、
    請求項9又は10に記載のプログラム
  12. 前記コンピュータに、
    (c)前記(b)のステップで抽出された発話行為式のペアごとに、該発話行為式のペアに含まれる前記述語ペアを用いて、形式言語で記述された対話情報を生成する、ステップと、
    (d)前記(c)のステップで生成された対話情報に予め設定されたアラート述語ペアが含まれる場合にアラート信号を生成する、ステップと、
    を更に実行させる、請求項9から11のいずれかに記載のプログラム
JP2019518776A 2017-05-17 2018-05-14 情報処理装置、情報処理方法及びプログラム Active JP6828812B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2017098383 2017-05-17
JP2017098383 2017-05-17
PCT/JP2018/018613 WO2018212142A1 (ja) 2017-05-17 2018-05-14 情報処理装置、情報処理方法及びコンピュータ読み取り可能な記録媒体

Publications (2)

Publication Number Publication Date
JPWO2018212142A1 JPWO2018212142A1 (ja) 2020-03-19
JP6828812B2 true JP6828812B2 (ja) 2021-02-10

Family

ID=64274203

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019518776A Active JP6828812B2 (ja) 2017-05-17 2018-05-14 情報処理装置、情報処理方法及びプログラム

Country Status (3)

Country Link
US (1) US20210157987A1 (ja)
JP (1) JP6828812B2 (ja)
WO (1) WO2018212142A1 (ja)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8321220B1 (en) * 2005-11-30 2012-11-27 At&T Intellectual Property Ii, L.P. System and method of semi-supervised learning for spoken language understanding using semantic role labeling
JP2014232258A (ja) * 2013-05-30 2014-12-11 株式会社東芝 連携業務支援装置、方法およびプログラム

Also Published As

Publication number Publication date
US20210157987A1 (en) 2021-05-27
JPWO2018212142A1 (ja) 2020-03-19
WO2018212142A1 (ja) 2018-11-22

Similar Documents

Publication Publication Date Title
CN108089974B (zh) 利用定义的输入格式来测试应用
US10089296B2 (en) System and method for sentiment lexicon expansion
CN108595629B (zh) 用于答案选择系统的数据处理方法及应用
EP3113174A1 (en) Method for building a speech feature library, method, apparatus, and device for speech synthesis
Kawahara et al. Rapid development of a corpus with discourse annotations using two-stage crowdsourcing
JP7381052B2 (ja) 問合せ対応支援装置、問合せ対応支援方法、プログラム及び記録媒体
JP7155625B2 (ja) 検査装置、検査方法、プログラム及び学習装置
KR20150084706A (ko) 온톨로지의 지식 학습 장치 및 그의 방법
KR102280490B1 (ko) 상담 의도 분류용 인공지능 모델을 위한 훈련 데이터를 자동으로 생성하는 훈련 데이터 구축 방법
US11176311B1 (en) Enhanced section detection using a combination of object detection with heuristics
WO2022039803A1 (en) Identifying noise in verbal feedback using artificial text from non-textual parameters and transfer learning
JP6828812B2 (ja) 情報処理装置、情報処理方法及びプログラム
JP4361299B2 (ja) 評価表現抽出装置、プログラム、及び記憶媒体
KR102363958B1 (ko) 이중 클러스터링 기반 소비자 인식 분석 방법, 장치 및 프로그램
US20220391596A1 (en) Information processing computer-readable recording medium, information processing method, and information processing apparatus
Mutuvi et al. Multilingual epidemic event extraction
US11347928B2 (en) Detecting and processing sections spanning processed document partitions
JP6907703B2 (ja) 解析装置、解析方法、および解析プログラム
JP7135730B2 (ja) 要約生成方法及び要約生成プログラム
CN117909505B (zh) 事件论元的抽取方法及相关设备
WO2018179729A1 (ja) インデックス生成プログラム、データ検索プログラム、インデックス生成装置、データ検索装置、インデックス生成方法、及びデータ検索方法
US20220092260A1 (en) Information output apparatus, question generation apparatus, and non-transitory computer readable medium
US20230394327A1 (en) Generating datasets for scenario-based training and testing of machine learning systems
US20230237275A1 (en) Systems and methods for an end-to-end evaluation and testing framework for task-oriented dialog systems
CN117909505A (zh) 事件论元的抽取方法及相关设备

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191111

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191111

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20201222

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210104

R150 Certificate of patent or registration of utility model

Ref document number: 6828812

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150