JP7276448B2 - 言語処理装置、言語処理方法及び言語処理プログラム - Google Patents

言語処理装置、言語処理方法及び言語処理プログラム Download PDF

Info

Publication number
JP7276448B2
JP7276448B2 JP2021528084A JP2021528084A JP7276448B2 JP 7276448 B2 JP7276448 B2 JP 7276448B2 JP 2021528084 A JP2021528084 A JP 2021528084A JP 2021528084 A JP2021528084 A JP 2021528084A JP 7276448 B2 JP7276448 B2 JP 7276448B2
Authority
JP
Japan
Prior art keywords
term
verb
case
history database
term occurrence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021528084A
Other languages
English (en)
Other versions
JPWO2020255234A1 (ja
Inventor
毅 小倉
成哲 小河原
高弘 山口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Publication of JPWO2020255234A1 publication Critical patent/JPWO2020255234A1/ja
Application granted granted Critical
Publication of JP7276448B2 publication Critical patent/JP7276448B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/313Selection or weighting of terms for indexing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/027Concept to speech synthesisers; Generation of natural phrases from machine-based concepts
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/183Speech classification or search using natural language modelling using context dependencies, e.g. language models
    • G10L15/19Grammatical context, e.g. disambiguation of the recognition hypotheses based on word sequence rules
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • G10L2015/227Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of the speaker; Human-factor methodology

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、コンピュータを用いた自然言語処理技術に関する。
コンピュータによる自然言語の文の意味理解においては、動詞や形容詞などの述語を意味の中心に据え、述語とその周辺に共起する名詞(項)との関係を分析する述語項構造解析(非特許文献1第107頁より説明を一部抜粋)が重要な処理となる。自然言語の文を構成する単語は互いに文中で関係を持っており、この文中での単語間の関係のことを格という(非特許文献2第71頁より説明を一部抜粋)。述語項構造解析は、述語である動詞の周辺に共起したそれぞれの項が、その動詞に対してどの格としての役割を果たしているかを解析する処理である。そして、このような処理をコンピュータで行う際に重要な役割を果たす情報が格フレームである。
格フレームとは、ある言語における用言(特に動詞)が述語となった場合にどのような格を取り得るか、そして、それぞれの格の役割を果たす名詞として具体的にどのような名詞が文中に共起しやすいかの情報を、動詞の語義や用法毎に記述したものである。格フレームの例(英語における動詞‘take’の例)を図1に示す(非特許文献2第74頁より抜粋)。
格フレームはその言語に関する広範な情報を含むものである。そのため、ある発話において省略された格の項を得るために、聞き返し発話を生成するシステムが提案されている(例えば、非特許文献3参照。)。
「自然言語処理」、黒橋禎夫、放送大学教材1570153-1-1511 「自然言語処理の基礎」、奥村学、コロナ社、ISBN978-4-339-02451-7 「曖昧性を持ったユーザ発話に対する格フレームを用いた聞き返し発話候補の生成」、古川智雅、吉野幸一郎、須藤克仁、中村哲、言語処理学会 第24回年次大会 発表論文集、pp.905~908(2018年3月)
非特許文献3に記載の技術は聞き返し発話を生成するものであるため、聞き返された発話者が当該格の項を応答しない場合、省略された格に対応する項に関する情報を得ることができない。
本開示は、格に対応する項に関する情報を取得可能にすることを目的とする。
上記目的を達成するために、本開示は、動詞の語義又は用法ごとに動詞の格及び項が紐付いた項出現パターンを格納した項出現履歴データベースを用いる。本開示は、項出現履歴データベースを用いることで、格に対応する項の情報を取得可能にする。
項出現履歴データベースは、ユーザの利用する装置に格納されていてもよいし、ネットワークを介するなどのユーザの利用する装置の外に格納されていてもよい。
本開示に係る言語処理装置は、
検索対象である動詞及び出力対象格、並びに検索条件である当該動詞の格及び項の組合せを含む出力要求をユーザから取得し、
動詞の格及び項が紐付いた項出現パターンを動詞の語義又は用法ごとに格納した項出現履歴データベースを参照し、
前記検索条件に含まれる動詞の格及び項の組合せと一致する項出現パターンを前記項出現履歴データベースから取得し、
前記項出現履歴データベースから取得した項出現パターンから前記検索対象に含まれる動詞の格に対応する項を抽出し、抽出した項を用いて、ユーザへの応答を生成する。
本開示に係る言語処理方法は、
検索対象である動詞及び出力対象格、並びに検索条件である当該動詞の格及び項の組合せを含む出力要求をユーザから取得し、
動詞の格及び項が紐付いた項出現パターンを動詞の語義又は用法ごとに格納した項出現履歴データベースを参照し、
前記検索条件に含まれる動詞の格及び項の組合せと一致する項出現パターンを前記項出現履歴データベースから取得し、
前記項出現履歴データベースから取得した項出現パターンから前記検索対象に含まれる動詞の格に対応する項を抽出し、抽出した項を用いて、ユーザへの応答を生成する。
本開示に係る言語処理プログラムは、本開示に係る方法に備わる各ステップをコンピュータに実行させるためのプログラムであり、本開示に係る装置に備わる各機能部としてコンピュータを実現させるためのプログラムである。
本開示によれば、格に対応する項に関する情報を取得することができる。
格フレームの例を示したものである。 本開示のシステム構成の一例を示す。 項出現履歴の一例を示したものである。 本開示に係る項出現履歴を構築する方法の一例を示すフロー図である。 本開示を実施するための第1の実施形態を示したものである。 第1の実施形態における質問の例を示したものである。 第1の実施形態における回答の例を示したものである。 本開示を実施するための第2の実施形態を示したものである。 発話文判定部の出力の例を示したものである。
以下、本開示の実施形態について、図面を参照しながら詳細に説明する。なお、本開示は、以下に示す実施形態に限定されるものではない。これらの実施の例は例示に過ぎず、本開示は当業者の知識に基づいて種々の変更、改良を施した形態で実施することができる。なお、本明細書及び図面において符号が同じ構成要素は、相互に同一のものを示すものとする。
図2は、本開示のシステムのブロック図を示している。本開示のシステムは、本開示の言語処理装置として機能するコンピュータ100を含む。コンピュータ100は、ネットワーク135に接続されていてもよい。
ネットワーク135は、データ通信ネットワークである。ネットワーク135は、プライベートネットワーク又はパブリックネットワークであってよく、パーソナル・エリア・ネットワーク、ローカル・エリア・ネットワーク、キャンパス・エリア・ネットワーク、メトロポリタン・エリア・ネットワーク、ワイド・エリア・ネットワーク、又はインターネット、のいずれか又はすべてを含むことができる。通信は、ネットワーク135を介して電子信号及び光信号によって行われる。
コンピュータ100は、プロセッサ110、及びプロセッサ110に接続されたメモリ115を含む。プロセッサ110は、命令に応答し且つ命令を実行する論理回路で構成される電子デバイスである。メモリ115は、コンピュータプログラムがエンコードされた有形のコンピュータが読み取り可能な記憶媒体である。
メモリ115は、プログラムモジュール120を記憶する。プログラムモジュール120は、本明細書に記載の処理を実行するようにプロセッサ110を制御するための命令を含む。プログラムモジュール120は、すでにメモリ115へと格納されているものとして示されているが、メモリ115へと後に格納されるように記憶装置140上に位置するように構成されてもよい。記憶装置140は、プログラムモジュール120を記憶する有形のコンピュータが読み取り可能な記憶媒体である。記憶装置140は、ランダムアクセスメモリ、或いは図示されていない遠隔のストレージシステムに位置し、且つネットワーク135を介してコンピュータ100へと接続される他の種類の電子記憶デバイスであってよい。
本開示に係るシステムは、ネットワーク135を介してコンピュータ100へと接続されるユーザデバイス130を含む。プロセッサ110は、プログラムモジュール120の実行の結果をユーザ装置130へと出力する。ユーザデバイス130は、例えば、ユーザが情報及びコマンドの選択をプロセッサ110へと伝えることを可能にするためのキーボード又は音声認識サブシステムなどの入力デバイスが挙げられる。ユーザ装置130は、表示装置又はプリンタ或いは音声合成装置などの出力デバイスを更に含む。
(本開示の概要)
本開示のシステムは、コンピュータ100が、対話履歴を蓄積し、対話履歴の中で使われた動詞の意味内容ごとに、格とその格に対応する項を記録したデータベースを構築する。このデータベースを項出現履歴と呼ぶ。項出現履歴の一例を図3に示す。
図1の説明で述べたように一般に1つの動詞は複数の語義や用法(以下では簡単のため用法と記す)を持ち、動詞の用法毎に格フレームが記述される。例えば、「take」という動詞の場合、「撮る」「食べる」「乗る」といった用法がある。動詞の格及び項が紐付いた項出現パターンは、この用法ごとに格納される。
本開示のシステムは、ある1つの動詞が有する複数の格フレームを元にして、格フレーム毎に項出現履歴を構築する。格フレームの有する格の種類や個数は用法ごとに異なるのが一般的であり、ここでは用法1が有する格の種類の総数をnとしている。さらに、本実施形態では、簡単のため、時間に関する記述を表す項、および、修飾語の役割を果たす項を、格として一律に扱う。
格は、例えば、文法上の名詞の格である「表層格」である。表層格は、構文解析によって文の構造が決まればそれに対応してほぼ自動的に決定することができる格であり、例えば、主格、目的格、所有格である。
格は、フィルモアの格文法理論における「深層格」を含む(例えば、非特許文献1第108頁表9-1、及び非特許文献2第72頁表5.1参照)。深層格は、文中の動詞に対してその単語がもつ深層的な意味役割まで捉えたものであり、動作主格(Agent)、経験者格(Experiencer)、道具格(Instrument)、対象格(Object)、源泉格(Source)、目標格(Goal)、場所格(Location)、時間格(Time)を含む。
また、日本語の場合、格は、日本語の動詞として一般的なガ格、ヲ格、二格、デ格、ノ格を含む。ここで、「ガ格」は「主格」に相当し、「ヲ格」は目的格に相当する。格は、日本語のように、助詞によって定められる格を含む。
図中の項出現パターン、すなわち、項出現履歴の各行は、発話文そのものを記録した対話履歴において、当該動詞が当該用法で出現した各出現回における、それぞれの格の役割を果たした具体的な名詞の一覧を記載したものである。図中のTi(j)は、項出現パターンiにおける格jの役割を果たした項(名詞)である。例えば、ガ格に相当するTi(1)には、その動調の動作主(主語)、すなわち“誰が”を示す人名等が入り、ヲ格に相当するTi(2)には、その動詞の目的語を示す名詞が入る、等である。例えば、「撮る」という動詞の格フレームにおいて、主格「he」と目的格「photo」が含まれている場合、格1の項T1(1)は「he」、格2の項T1(2)は「photo」となる。
ここで、項出現パターンは、発話者を特定できるよう、発話者を特定可能な発話者IDが紐付けて格納される。出現回数は、項出現パターンと発話者IDの組み合わせ毎にカウントしたものである。
本開示では、図4に示す手順で、処理対象言語の各動詞の格フレーム毎にこの項出現履歴を構築する。
(手順S101)
発話文そのものを記録した対話履歴の1つの発話文について、形態素解析(例えば、非特許文献2第3章「形態素解析」参照。)、構文解析(例えば、非特許文献2第4章「構文解析」参照。)、述語項構造解析(例えば、非特許文献1第9章「意味の解析(2)」及び非特許文献2第5章「意味解析」参照。)を実施する。形態素解析の結果、意味を持つ最小の言語単位である「形態素」が特定される。「形態素」は、例えば単語(word)である。構文解析の結果、構文構造が特定される。述語項構造解析の結果、発話文中の述語動詞の用法とそれぞれの格に対応する項となった名詞が特定される。
(手順S102)
当該動詞の当該用法の項出現履歴の中に、手順S101で特定した項の一覧に相当する項出現パターン、すなわち、全ての格に対応する名詞(項)が手順S101で特定した項の一覧と同一で、かつ、発話者IDが当該発話文の発話者を示すIDである項出現パターン、が存在するか否かを検査する。そのような項出現パターンが存在する場合、その出現回数欄の数字を1つ増加させる。ここで、出現回数欄の数字の初期値は0とする。そのような項出現パターンが存在しない場合は、手順S101で特定した項の一覧と当該発話文の発話者を示す発話者IDとの組を新たな項出現パターンとして、当該用法の項出現履歴に新規登録する。このとき、対応する出現回数欄の数字を1とする。
(手順S103)
対話履歴の中に未処理の発話文が残っていれば、処理対象の発話文を1つ後の発話文として手順S101に戻る。対話履歴の中に未処理の発話文が残っていなければ処理を終了する。
(本開示の効果)
本開示のシステムは、各手順を実行する手段を備え、過去の対話で使用された動詞の格の項となった名詞に関する履歴を作成し、項出現履歴データベースに蓄積する。このため、本開示は、ある格の項に関する聞き返しをされた人が当該格の項を特定する意図を明確に持っていない場合や当該格に関する記憶を有していない場合でも、項出現履歴データベースを参照し、意思決定したり、過去の情報を確認することができる。また、聞き返しができないような状況においては、当該格の項の情報を取得したい者が項出現履歴データベースを参照して所望の格の項の情報を確認することができる。
(第1の実施形態)
図5は、本実施形態の一例を表すブロック図である。本実施形態においては、コンピュータ100が、項出現履歴DB(DataBase)14及びユーザ要求処理部15を備え、ユーザからの出力要求に対し、項出現履歴DB14を参照することで、出力要求に応じた動詞の格に対応する項の情報をユーザに返す。項出現履歴DB14は、プロセッサ110に接続されている記憶装置125に格納されている。本実施形態においては、項出現履歴DB14を構築するために、コンピュータ100が、対話履歴蓄積処理を実行する対話履歴蓄積部11、対話履歴DB12、項出現履歴生成処理を実行する項出現履歴生成部13を備える。
対話履歴蓄積部11は、対話の中で発話された発話文そのものの履歴を蓄積する。項出現履歴生成部13は、対話履歴DB12から発話文を取り出し、それを用いて項出現パターンを生成する。生成された項出現パターンは、項出現履歴DB14に格納される。ユーザ要求処理部15は、この項出現履歴DB14に格納された項出現パターンを利用して、対話履歴の中で使われた動詞の格の項に関する情報を取得する。
対話履歴蓄積処理、項出現履歴生成処理、ユーザ要求処理の3つの処理は、それぞれ独立に並行して実行される。例えば、ユーザ要求処理では項出現履歴を利用する。そのため、対話履歴蓄積処理及び項出現履歴生成処理は、ユーザ要求処理の前に事前に行われる。このように、本実施形態は、過去の項出現履歴を使って所望の格の項の情報を検索する。ここで、過去の項出現履歴に用いられる対話は、ユーザ要求処理部15に入力可能なユーザを含む、任意のユーザの発話を含む。
(対話履歴蓄積処理)
対話履歴蓄積部11は、対話履歴蓄積処理を実行し、発話文を対話履歴DB12へ蓄積する。対話履歴DB12は、プロセッサ110に接続されている記憶装置125に格納されている。
対話履歴蓄積部11は、発話文を取得する発話入力部21を備える。音声による対話の場合、発話入力部21は、発話音声をマイク等を介してコンピュータ100内に入力する任意の装置である。テキストベースの対話の場合、発話入力部21は、話者によってテキスト入力された発話テキストをコンピュータ100内に入力する任意の装置である。発話入力部21は対話に参加している話者ごとに用意する。ここで、発話者を特定する方法は任意であり、必ずしも話者毎に発話入力部21を用意する必要はない。
音声による対話の場合、対話履歴蓄積部11は、テキスト変換部22を備える。テキスト変換部22は、発話入力部21を介して入力された音声データを、既存の音声認識技術を用いてテキストデータに変換する任意の装置である。テキストベースの対話の場合、テキスト変換部22は何もしない。テキスト変換部22は各発話入力部21から送られてくる発話文を一括してテキストデータに変換処理し、変換後の発話テキストを対話履歴DB12へ蓄積する。
(項出現履歴生成処理)
項出現履歴生成部13は、対話履歴DB12に蓄積された発話文に対して項出現履歴生成処理を実行し、項出現パターンを項出現履歴DB14に格納する。
述語項構造解析部31は、対話履歴DB12内の発話テキストを取り出し、それに対して、手順S101と手順S103の処理を行う。形態素解析、構文解析及び述語項構造解析には手順S101で説明した既存の技術が使用できる。項出現パターン生成部32は、手順S102の処理を行う。
(ユーザ要求処理)
ユーザ要求処理部15は、項出現履歴DB14に格納された項出現パターンを用いてユーザ要求処理を実行する。本実施形態のシステムのユーザは、本システムの利用時においては他者との対話は行っておらず、過去の項出現履歴DB14を使って所望の格の情報を検索する処理を実施する。
質問入力部52は、ユーザからの出力要求を入力する手段である。ユーザからの出力要求は、ユーザが所望の情報を獲得するための、検索対象及び検索条件を含む質問を入力する手段である。格の項情報に関する質問は、検索対象である動詞、検索条件である前記動詞の格とその項の値の組合せを指定した格の条件指定、同じく検索条件である発話者指定、及び項の値を獲得したい格を指定した出力対象格を含む。
項出現履歴DBインタフェース51は、質問入力部52に入力されたユーザからの出力要求を項出現履歴DB14のデータベース形式に対応する検索命令(クエリ)に変換して項出現履歴DB14へのクエリを投入する処理、および、クエリに対する項出現履歴DB14からの応答を情報表示部53へ渡す処理を行う。例えば、項出現履歴DB14を一般的なSQL(Structured Query Language)形式で構築した場合、このDBに対するSQL形式のクエリ/応答を扱う機能を担う。
情報表示部53は、項出現履歴DB14からの応答を、ユーザ装置130が読みとれる形式に変換して、ユーザ装置130に表示する。
図6及び図7に、ユーザ要求処理部15の処理の具体例を示す。本例は、ユーザが実施形態のシステムを用いて、過去の項出現履歴をもとにノートを注文する際の冊数の傾向を調べた例である。
図6は、ユーザによる質問入力部52への入力例を示す。ノートの発注について調べたい場合、質問入力部52は、検索条件及び検索対象を指定する。検索対象とする動詞を「注文する」に指定し、検索条件として、「ヲ格」が「ノート」であることを指定する。そして、質問入力部52は、項の情報を獲得したい出力対象格として、「注文する」という動詞が持つ格の1つである「数量を表す修飾語」を指定する。なお、同図の例では発話者は指定していない。
ここで、動詞が持つ格は、動詞によって異なる。そのため、質問入力部52は、動詞がユーザによって指定された場合、ユーザから指定された動詞に紐付く格のリストを表示することが好ましい。これにより、質問入力部52は、1以上の任意の出力対象格を指定することができる。
また、質問入力部52は、発話者を指定可能であってもよい。発話者指定欄に特定の発話者IDを指定した場合、図3の項出現履歴のうちの“発話者ID”が指定された発話者の項出現パターンのみを検索対象とする。発話者IDが指定されなかった場合は、全発話者の発話の項出現パターンを検索対象とする。
項出現履歴DBインタフェース51は、この質問を項出現履歴DB14へのクエリに変換し、項出現履歴DB14へ投入する。出現履歴DB14は、質問入力部52からのクエリに含まれる動詞、格の項、及び発話者IDと一致する項出現パターンを抽出し、項出現履歴DBインタフェース51へ応答する。例えば、項出現履歴DB14は、「注文する」という動詞の、ヲ格の項が「ノート」という名詞となっている、全ての用法の全ての項出現パターンを抽出する。そして、項出現履歴DBインタフェース51は、抽出された項出現パターンに含まれている「数量を表す修飾語」の格の項を情報表示部53に出力する。これにより、情報表示部53は、質問入力部52に入力された出力対象格に対応する項を、ユーザ装置130に表示することができる。
前記クエリに対する応答は、情報表示部53によって、例えば図7のように加工され表示される。この例では、検索結果として、出現した名詞の項の種類と、それらの出現回数の組を出力する。出現回数については、ノートの注文における発注冊数のヒストグラムを表示している。すなわち、例えばある項出現パターンの「数量を表す修飾語」の格の項が10という数値で、その出現回数欄の数値が5であった場合、当該項出現パターンに該当し、かつ、ノートを10冊注文すると発言された出現回数が5回であったと解釈している。このヒストグラムから、ユーザはノートの発注に関する過去の傾向を知ることができる。
このように、情報表示部53は、出力対象格の結果の表示において項出現パターンの出現回数欄の数値を考慮した集計を行うが、集計の仕方は任意の形態をとってよい。例えば、項の一覧を出現回数順に配列したり、項が数値の場合は最大値、最小値、平均値などの演算結果を表示する、などの任意の処理を行ってよい。
図6及び図7の例では、発話者が指定されていないため、冊数情報についての発話者毎の区別は行っていない。質問入力部52において発話者が指定された場合、図7に示したグラフを発話者毎に表示する。
図6及び図7の例では検索条件として、「ヲ格」が「ノート」であり、項の情報を獲得したい出力対象格が「数量を表す修飾語」である例を示したが、本開示は任意の検索条件及び獲得したい任意の格の情報に適用することができる。
例えば、図6の例において、項の情報を獲得したい出力対象格として「デ格」が指定された場合、図7における「冊数」に代えて、ネットで、ショップで、サイトで、インターネットで、xx店で、などの「デ格」の項が表示される。また、図6の例において、項の情報を獲得したい出力対象格として「ノ格」が指定された場合、図7における「冊数」に代えて、ルーズリーフの、xxx社の、A4サイズの、再生紙の、などの「ノ格」の項が表示される。
なお、本実施形態では、質問入力部52へ入力された1つの動詞に対する全ての用法に含まれる全ての項出現パターンを全て抽出する例を示したが、本開示はこれに限定されない。例えば、質問入力部52は、指定された動詞に複数の用法がある場合、検索対象の動詞に紐付く用法のリストを表示してもよい。この場合、質問入力部52は、表示されている用法のうちのユーザから指定された1以上の任意の数の検索対象の用法を、動詞として指定する。
また、本実施形態では、ユーザが質問入力部52に動詞、格の指定条件及び出力要求を入力する例を示したが、本開示はこれに限定されない。例えば、質問入力部52は、「ノートを注文した数」という入力を受けた場合、述語項構造解析部31と同様の処理を行い、この入力から動詞が「注文する」であることを特定し、「ヲ格」が「ノート」であることを特定し、検索対象の動詞の出力対象格が数に関するものであることを特定してもよい。このように、本開示の質問入力部52は任意のインタフェースを採用しうる。
このように、本実施形態は、質問入力部52のインタフェースのデザイン次第でどのような形の集計・出力を指定することもできる。また、出力対象格の種類や数の指定方法、出力結果の表示方法についても任意のデザインを採用しうる。
(第2の実施形態)
図8は、本実施形態の一例を表すブロック図である。本実施形態では、テキスト表示部71、述語項構造解析部72、項出現パターン生成部73及び発話文判定部74をさらに備える。
テキスト変換部22は、対話の全参加者の発話文をテキストデータに変換する。テキスト表示部71は、対話の全参加者の発話テキストを、対話の全参加者に対して表示する。これにより、対話の全参加者が、全発話者の発言を閲覧することができる。
さらに、本実施形態は、対話の全参加者が、質問入力部52及び情報表示部53を利用することもできる。この構成により、対話の全参加者は、自身が参加する現在進行中の対話の内容や状況を鑑みながら項出現履歴を利用することができる。これらの点が第1の実施形態とは異なる。
テキスト変換部22の出力、すなわち、進行中の対話の発話文をテキスト化した発話テキストは、対話履歴DB12やテキスト表示部71へ送られるとともに、述語項構造解析部72と項出現パターン生成部73を経由して、項出現履歴インタフェース51内に備わる発話文判定部74へも送られる。
述語項構造解析部72及び項出現パターン生成部73は、項出現履歴生成部13と同様の処理を行う。このため、発話文判定部74は、現在進行中の発話の項出現パターンを取得することができる。
発話文判定部74は、入力された項出現パターン及び項出現履歴DB14内に蓄積された項出現パターンを参照して、現在進行中の発話に対する、事前に定められた判定処理を実行する。その処理内容は任意の内容を指定することができる。そして、発話文判定部74は、結果を表示する必要がある場合にはその判定結果を情報表示部53へ渡す。これにより、対話に参加しているユーザは、現在進行中の対話に関連する必要な情報や次に発言すべき内容に関する示唆を自動で即時に入手できる。その他の部分については第1の実施形態と同じである。
図9に、発話文判定部74によって実行される処理の例を示す。この例は、発話文判定部74が、項出現履歴データベース14において項に相当する名詞が発話の中で陽に指定(発話)されている割合が高い格について、項出現パターン生成部73で生成された項出現パターンの中でそれが明示的に指定されているか否かを判定する。そして、指定されていないことを検出した場合には、発話文判定部74は、その旨の警告と、当該格の項に関する過去の履歴を提示する。
図の例では、対話参加者であるユーザBから発せられた「ノートを注文しておいて」という発話文の中の「注文する」という動詞を抽出する。そして、ヲ格に相当する項が「ノート」という名詞となっている過去の項出現パターンを項出現履歴データベース14から特定する。そして、「数量に関する修飾語」という出力対象格に相当する項が陽に指定されている割合が基準となる閾値より高いこと、さらに、進行中の対話においてはその項が明示されていないことを検出する。そして、その旨を警告する表示と、その値の項出現履歴における傾向を表示している。
例えば、情報表示部53は、ユーザ装置130における、発話文表示部D71に発話文「ノートを注文しておいて」とユーザBが発言した旨を表示する。また、情報表示部53は、ユーザ装置130における、コメント表示部D53に警告の対象となっている動詞「注文する」及び警告の対象となっている格に対応するメッセージ「数量が指定されていません」を表示する。
情報表示部53は、発話文表示部D71及びコメント表示部D53の表示を、対話の全参加者のユーザ装置130に表示してもよいが、ユーザBのユーザ装置130のみに表示してもよい。本実施形態では、発話者に対応した項出現パターンを取得したが、発話者を特定しない項出現パターンを取得してもよい。
本開示の装置はコンピュータとプログラムによっても実現でき、プログラムを記録媒体に記録することも、ネットワークを通して提供することも可能である。
本開示は情報通信産業に適用することができる。
11:対話履歴蓄積部
12:対話履歴データベース
21:発話入力部
22:テキスト変換部
13:項出現履歴生成部
31、72:述語項構造解析部
32、73:項出現パターン生成部
14:項出現履歴データベース
15:ユーザ要求処理部
51:項出現履歴DBインタフェース
52:質問入力部
53:情報表示部
71:テキスト表示部
74:発話文判定部
100:コンピュータ
110:プロセッサ
115:メモリ
120:プログラムモジュール
125、140:記憶装置
130:ユーザ装置
135:ネットワーク

Claims (7)

  1. 検索対象である動詞及び出力対象格、並びに検索条件である当該動詞の格及び項の組合せを含む出力要求をユーザから取得し、
    動詞の格及び項が紐付いた項出現パターンを動詞の語義又は用法ごとに格納した項出現履歴データベースを参照し、
    前記検索条件に含まれる動詞の格及び項の組合せと一致する項出現パターンを前記項出現履歴データベースから取得し、
    前記項出現履歴データベースから取得した項出現パターンから出力対象格に対応する項を抽出し、抽出した項を用いて、ユーザへの応答を生成する、
    言語処理装置。
  2. 前記項出現パターンは、動詞の格及び項にさらに発話者の識別情報が紐付いており、
    対話に含まれる発話文のテキストデータを発話者ごとに蓄積する対話履歴データベースから発話文を取得し、
    発話文に含まれる動詞及び当該動詞の語義又は用法を抽出し、発話文に含まれる名詞のなかから動詞の格として用いられている名詞を特定し、動詞の格及び項及び発話者の識別情報が紐付いた項出現パターンを作成し、前記動詞の語義又は用法に応じて、前記項出現履歴データベースに格納する、
    請求項1に記載の言語処理装置。
  3. 前記項出現履歴データベースは、項出現パターンの出現回数をさらに格納し、
    発話文に含まれる項出現パターンが既に前記項出現履歴データベースに格納されている場合、前記項出現履歴データベースに格納されている項出現パターンの出現回数を増加させ、
    項出現パターンの出現回数を用いて、前記ユーザへの応答を生成する、
    請求項2に記載の言語処理装置。
  4. 前記ユーザを含む複数のユーザの対話が入力され、
    前記複数のユーザの対話に含まれる発話文に含まれる動詞を抽出し、
    発話文に含まれる名詞のなかから動詞の格として用いられている名詞を特定し、
    発話文に含まれる動詞と当該動詞の格に用いられている名詞との組合せに対応する項出現パターンを前記項出現履歴データベースから取得し、
    前記項出現履歴データベースから取得した項出現パターンを用いて事前に定められた処理を実行し、処理結果を前記複数のユーザのうちの少なくとも一人に提示する、
    請求項2又は3に記載の言語処理装置。
  5. 前記項出現履歴データベースから取得する項出現パターンは、発話文に含まれる動詞と当該動詞の格に用いられている名詞との組合せに加え、更に発話者の識別情報に対応する項出現パターンである、
    請求項4に記載の言語処理装置。
  6. 検索対象である動詞及び出力対象格、並びに検索条件である当該動詞の格及び項の組合せを含む出力要求をユーザから取得し、
    動詞の格及び項が紐付いた項出現パターンを動詞の語義又は用法ごとに格納した項出現履歴データベースを参照し、
    前記検索条件に含まれる動詞の格及び項の組合せと一致する項出現パターンを前記項出現履歴データベースから取得し、
    前記項出現履歴データベースから取得した項出現パターンから出力対象格に対応する項を抽出し、抽出した項を用いて、ユーザへの応答を生成する、
    言語処理方法。
  7. コンピュータに、
    検索対象である動詞及び出力対象格、並びに検索条件である当該動詞の格及び項の組合せを含む出力要求をユーザから取得する手順、
    動詞の格及び項が紐付いた項出現パターンを動詞の語義又は用法ごとに格納した項出現履歴データベースを参照する手順、
    前記検索条件に含まれる動詞の格及び項の組合せと一致する項出現パターンを前記項出現履歴データベースから取得する手順、
    前記項出現履歴データベースから取得した項出現パターンから出力対象格に対応する項を抽出し、抽出した項を用いて、ユーザへの応答を生成する手順、
    を実行させるための言語処理プログラム。
JP2021528084A 2019-06-18 2019-06-18 言語処理装置、言語処理方法及び言語処理プログラム Active JP7276448B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2019/024003 WO2020255234A1 (ja) 2019-06-18 2019-06-18 言語処理装置、言語処理方法及び言語処理プログラム

Publications (2)

Publication Number Publication Date
JPWO2020255234A1 JPWO2020255234A1 (ja) 2020-12-24
JP7276448B2 true JP7276448B2 (ja) 2023-05-18

Family

ID=74036992

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021528084A Active JP7276448B2 (ja) 2019-06-18 2019-06-18 言語処理装置、言語処理方法及び言語処理プログラム

Country Status (3)

Country Link
US (1) US11971915B2 (ja)
JP (1) JP7276448B2 (ja)
WO (1) WO2020255234A1 (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007206888A (ja) 2006-01-31 2007-08-16 Toyota Central Res & Dev Lab Inc 応答生成装置、方法及びプログラム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6310150B2 (ja) * 2015-03-20 2018-04-11 株式会社東芝 意図理解装置、方法およびプログラム

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007206888A (ja) 2006-01-31 2007-08-16 Toyota Central Res & Dev Lab Inc 応答生成装置、方法及びプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
吉野 幸一郎 KOICHIRO YOSHINO,述語項の類似度に基づく情報抽出・推薦を行う音声対話システム,情報処理学会論文誌 論文誌ジャーナル Vol.52 No.12 [CD-ROM],日本,一般社団法人情報処理学会,2011年12月15日,第52巻 第12号,pp.3386-3397

Also Published As

Publication number Publication date
WO2020255234A1 (ja) 2020-12-24
JPWO2020255234A1 (ja) 2020-12-24
US20220382790A1 (en) 2022-12-01
US11971915B2 (en) 2024-04-30

Similar Documents

Publication Publication Date Title
JP7346609B2 (ja) 自然言語理解(nlu)フレームワークを使用して意味探索を実行するシステムおよび方法
Gardent et al. Creating training corpora for nlg micro-planning
US10902041B2 (en) Systems and methods for learning semantic patterns from textual data
Tur et al. Spoken language understanding: Systems for extracting semantic information from speech
US7949676B2 (en) Information search system, information search supporting system, and method and program for information search
US11126793B2 (en) Unsupervised induction of user intents from conversational customer service corpora
US10460028B1 (en) Syntactic graph traversal for recognition of inferred clauses within natural language inputs
JP6676110B2 (ja) 発話文生成装置とその方法とプログラム
US10896222B1 (en) Subject-specific data set for named entity resolution
US10997223B1 (en) Subject-specific data set for named entity resolution
Griol et al. Combining speech-based and linguistic classifiers to recognize emotion in user spoken utterances
US20050131677A1 (en) Dialog driven personal information manager
WO2013088287A1 (en) Generation of natural language processing model for information domain
JP5620349B2 (ja) 対話装置、対話方法および対話プログラム
JP2000353161A (ja) 自然言語生成における文体制御方法及び装置
WO2021063524A1 (en) Unsupervised induction of user intents from conversational customer service corpora
Govindaraj et al. Intensified sentiment analysis of customer product reviews using acoustic and textual features
CN114742054A (zh) 一种面向开放领域的混合式信息抽取方法与系统
JP5636309B2 (ja) 音声対話装置および音声対話方法
JP7276448B2 (ja) 言語処理装置、言語処理方法及び言語処理プログラム
Aliero et al. Systematic review on text normalization techniques and its approach to non-standard words
JP3009636B2 (ja) 音声言語解析装置
Sayeedunnisa et al. Sarcasm detection: a contemporary research affirmation of recent literature
WO2017119060A1 (ja) 情報提示システム
JP2015210342A (ja) 発話生成手法学習装置、発話生成手法選択装置、発話生成手法学習方法、発話生成手法選択方法、プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211110

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221108

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221227

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230404

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230417

R150 Certificate of patent or registration of utility model

Ref document number: 7276448

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150