WO2023042316A1 - 質問回答装置、質問回答方法、およびプログラム - Google Patents

質問回答装置、質問回答方法、およびプログラム Download PDF

Info

Publication number
WO2023042316A1
WO2023042316A1 PCT/JP2021/033986 JP2021033986W WO2023042316A1 WO 2023042316 A1 WO2023042316 A1 WO 2023042316A1 JP 2021033986 W JP2021033986 W JP 2021033986W WO 2023042316 A1 WO2023042316 A1 WO 2023042316A1
Authority
WO
WIPO (PCT)
Prior art keywords
data
question
passage
answer
unit
Prior art date
Application number
PCT/JP2021/033986
Other languages
English (en)
French (fr)
Inventor
要 笠原
裕一郎 関口
Original Assignee
日本電信電話株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電信電話株式会社 filed Critical 日本電信電話株式会社
Priority to PCT/JP2021/033986 priority Critical patent/WO2023042316A1/ja
Priority to JP2023548013A priority patent/JPWO2023042316A1/ja
Publication of WO2023042316A1 publication Critical patent/WO2023042316A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

質問データに対する回答データを生成する質問回答装置100は、質問データの特徴が分類された所定の質問タイプと質問データに適合するパッセージデータとを受付け、質問タイプに基づいて、機械読解が必要であるか否かを判定し、機械読解が不要であると判定した場合、パッセージデータを回答データとし、機械読解が必要であると判定した場合、質問データおよびパッセージデータに基づいて、機械読解によりパッセージデータから抽出された回答テキストデータを回答データとする質問判定部10を備える。

Description

質問回答装置、質問回答方法、およびプログラム
 本開示は、質問回答装置、質問回答方法、およびプログラムに関する。
 近年、ユーザにより自然言語で入力された質問に対する回答を、コンピュータが自動で生成する質問応答技術が注目を集めている。このような質問応答技術の1つとして、自然言語で入力された質問に対して、同じく自然言語で記述された文書内から回答部分を抽出する抽出型の機械読解が知られている(例えば、非特許文献1参照)。機械読解による質問応答技術では、ニューラルネットワークを用いて、質問とマニュアルなどの文書に記述されている回答部分との照合を行っており、一問一答式の質問応答タスクでは、人と同等以上の回答精度を達成できることが知られている(例えば、非特許文献2参照)。その一方で、抽出型ニューラル機械読解では、学習時のみならず推論時にもコンピュータにGPU(Graphic Processing Unit)の装備を必要とすることが多く、ニューラルネットワークを用いない質問応答技術と比べて概して処理時間が長くなる傾向がある。
 機械読解による質問応答技術の応用の1つとして、コンタクトセンタのオペレータ支援がある。オペレータは、顧客からの問合せに対して、マニュアル、契約書などの各種資料を調べて回答を行う。この際、調べる時間を短縮することを目的として、機械読解による質問応答技術が使用されている。質問への回答候補は、機械読解による質問応答技術を用いることで探し出されて、オペレータに表示される。対象の文書は、複数存在するため、これらの文書の全てを、ニューラルネットワークを用いた機械読解で処理すると時間がかかってしまう。そこで、文書を段落などの細かい単位(パッセージ)に分割し、質問と関連性の高いパッセージを情報検索技術で絞り込み、個々に機械読解して回答部分を抽出する。抽出された回答部分を、オペレータへの回答候補として表示する、あるいは、パッセージと共に強調して表示する(例えば、非特許文献3参照)。情報検索技術と機械読解による質問応答技術とを組み合わせたこのような技術を、以下、「大規模機械読解」と呼ぶ。
Hwee Tou Ng, Leong Hwee Teo, Jennifer Lai Pheng Kwan: A Machine Learning Approach to Answering Questions for Reading Comprehension Tests. 2000 Joint SIGDAT Conference on Empirical Methods in Natural Language Processing and Very Large Corpora, p.124-132, 2000 M. Seo, A. Kembhavi, A. Farhadi, and H. Hajishirzi. 2017. Bidirectional attention flow for machine comprehension. In ICLR. Kyosuke Nishida, Itsumi Saito, Atsushi Otsuka,Kosuke Nishida, Narichika Nomoto, and Hisako Asano, Toward Natural Language Understanding by Machine Reading Comprehension, NTT Technical Review, Vol. 17, No. 9, pp.9-14 2019
 ニューラルネットワークを用いた機械読解では、文書、質問、および質問に対する簡潔な回答を教師データとしてニューラルネットワークの学習モデルが生成されるため、機械読解の結果も短く出力される傾向がある。
 しかしながら、コンタクトセンタにおいてオペレータは、顧客の様々なタイプの質問を受け付ける。例えば、ある条件を満たす製品の名称、製品の有効期限、サービスに特定のオプションが含まれるかどうか、などのような抽出型ニューラル機械読解に適合する1語から数語程度で簡潔に回答できるタイプの質問がある。その一方で、例えば、顧客が知らない製品の概要、契約したサービスにおいて希望するオプションが何故含まれないかについての理由、などのような複数の文または段落レベルのテキストで表現する必要がある説明的な回答が期待されるタイプの質問もある。
 抽出型ニューラル機械読解では、後者のような説明的な回答が期待されるタイプの質問に対して、期待される回答の一部しか出力しない場合がある。具体的には、例えば、「〇〇の特徴とは何か」という質問に対して、パッセージからテキスト「〇〇の特徴は以下のとおりである。」のみを抽出し、文書中でこれに続く具体的な特徴の説明部分を取りこぼしてしまうことがある。あるいは、例えば、「△△はXXできるか」というような真偽を問う質問に対して、根拠の条件が複雑であり複数の文となる場合、パッセージから真偽の根拠となるテキストを抽出することはできても、その全てを抽出できないことがある。そのため、説明的な回答が期待される質問については、抽出型ニューラル機械読解を行わずに、回答を含むパッセージ自体をそのまま出力した方が適切な結果となる。
 つまり、従来の質問応答技術では、質問のタイプに応じて抽出型ニューラル機械読解の要否を適切に判定することができなかったため、質問に対する回答の精度が低くなってしまうという問題が生じていた。
 かかる事情に鑑みてなされた本開示の目的は、質問に対する回答の精度を向上させた質問回答装置、質問回答方法、およびプログラムを提供することにある。
 一実施形態に係る質問回答装置は、質問データに対する回答データを生成する質問回答装置であって、前記質問データの特徴が分類された所定の質問タイプと前記質問データに適合するパッセージデータとを受付け、前記質問タイプに基づいて、機械読解が必要であるか否かを判定し、前記機械読解が不要であると判定した場合、前記パッセージデータを前記回答データとし、前記機械読解が必要であると判定した場合、前記質問データおよび前記パッセージデータに基づいて、前記機械読解により前記パッセージデータから抽出された回答テキストデータを前記回答データとする質問判定部を備えることを特徴とする。
 一実施形態に係る質問回答方法は、質問データに対する回答データを生成する質問回答方法であって、前記質問データの特徴が分類された所定の質問タイプと前記質問データに適合するパッセージデータとを受付け、前記質問タイプに基づいて、機械読解が必要であるか否かを判定するステップと、前記機械読解が不要であると判定した場合、前記パッセージデータを前記回答データとするステップと、前記機械読解が必要であると判定した場合、前記質問データおよび前記パッセージデータに基づいて、前記機械読解により前記パッセージデータから抽出された回答テキストデータを前記回答データとするステップと、を含む、ことを特徴とする。
 一実施形態に係るプログラムは、コンピュータを、上記質問回答装置として機能させることを特徴とする。
 本開示によれば、質問に対する回答の精度を向上させた質問回答装置、質問回答方法、およびプログラムを提供することが可能となる。
第1実施形態に係る質問回答装置の構成の一例を示す図である。 第1実施形態に係る質問データの一例を示す図である。 第1実施形態に係る回答データの一例を示す図である。 第1実施形態に係る質問タイプの一例を示す図である。 第1実施形態に係るパッセージデータの一例を示す図である。 第1実施形態に係る質問データに対する質問キーワードデータの一例を示す図である。 第1実施形態に係るパッセージデータに対するパッセージキーワードデータの一例を示す図である。 第1実施形態に係るBERT(Bidirectional Encoder Representations from Transformers)読解の出力の一例を示す図である。 第1実施形態に係る質問回答方法の一例を示すフローチャートである。 第2実施形態に係る回答データの一例を示す図である。 第2実施形態に係る質問回答方法の一例を示すフローチャートである。 本実施形態に係る質問回答装置のハードウェアブロック図である。
 以下、本発明を実施するための形態について、図面を参照しながら詳細に説明する。
〔第1実施形態〕
<質問回答装置の構成>
 図1乃至図8を参照して、第1実施形態に係る質問回答装置100の構成の一例について説明する。
 質問回答装置100は、制御部(コントローラ)110と、記憶部120と、入力部130と、出力部140と、を備える。
 制御部110は、ASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)などの専用のハードウェアによって構成されてもよいし、汎用のプロセッサまたは特定の処理に特化したプロセッサによって構成されてもよいし、双方を含んで構成されてもよい。制御部110は、質問判定部10と、質問分類部20と、パッセージ検索部30と、抽出読解部40と、を備える。
 記憶部120は、1つ以上のメモリを含み、例えば、半導体メモリ、磁気メモリ、光メモリなどを含んでよい。記憶部120に含まれる各メモリは、例えば、主記憶装置、補助記憶装置、またはキャッシュメモリとして機能してよい。各メモリは、必ずしも質問回答装置100がその内部に備える必要はなく、質問回答装置100の外部に備える構成としてもよい。記憶部120は、質問回答装置100の動作に用いられる任意の情報を記憶する。記憶部120は、例えば、文書データベース121を記憶する。この他にも、記憶部120は、例えば、各種のプログラムまたはデータなどを記憶する。
 入力部130は、各種情報の入力を受け付ける。入力部130は、ユーザによる所定の操作が可能であればどのようなデバイスでもよく、例えば、マイク、タッチパネル、キーボード、マウスなどである。例えば、ユーザが、入力部130を用いて所定の操作を行うことで、質問データが制御部110へ入力される。入力部130は、質問回答装置100の外部に設けられていてもよいし、質問回答装置100と一体化されていてもよい。
 質問データは、ユーザが知りたいことを問う質問が表現されたデータ、FAQ(Frequently Asked Questions)のQのように、ユーザが知りたいであろうことがあらかじめ予測されて準備されたデータなどである。質問データの種類としては、例えば、ユーザがコンピュータ端末などを用いて直接入力したデータ、外部装置が備えるコンピュータの出力データ、外部データベースに蓄積された複数の質問データの中からユーザが選択したデータ、ユーザがAI(Artificial Intelligence)エージェント、AIスピーカなどに話しかけた音声内容がテキスト化されたデータなどが挙げられる。
 具体的には、図2に示すように、質問データは、例えば、「ISDNの伝送速度は何kbpsですか」、「ISDNについて教えてください」、「ツイストペアケーブル通信線路で高速デジタルデータ通信を行う技術とは何か」などであってよい。
 出力部140は、各種情報を出力する。出力部140は、例えば、スピーカ、液晶ディスプレイ、有機EL(Electro-Luminescence)ディスプレイなどである。出力部140は、例えば、質問データに対する回答データを出力する。出力部140は、質問回答装置100の外部に設けられていてもよいし、質問回答装置100と一体化されていてもよい。
 回答データは、質問をしたユーザにとって知りたい内容が表現されたデータである。具体的には、図3に示すように、回答データは、例えば、「64kbps」、「ISDN(アイエスディーエヌ、Integrated Services Digital Network、サービス総合デジタル網)とは交換機・中継回線・加入者線まで全てデジタル化された、パケット通信・回線交換データ通信にも利用できる公衆交換電話網である。音声は、0.3 - 3.4kHzを64kbpsの回線交換でISDN網内を伝送しているため、VoIPよりも音声品質が安定している。」、「デジタル加入者線」などであってよい。
 質問判定部10は、入力部130から入力された質問データを、質問分類部20へ出力する。質問判定部10は、質問データの特徴を示す質問テキストデータが分類された所定の質問タイプを、質問分類部20から取得する。
 質問テキストデータは、質問データが何らかの特徴量に変換されたデータである。具体的には、図4に示すように、質問テキストデータは、例えば、“何kbps”、“について”、“とは何”などであってよい。
 所定の質問タイプは、それぞれの質問テキストデータに対して付与される所定の分類名である。すなわち、所定の質問タイプは、質問データの特徴に対して付与される分類名である。具体的には、図4に示すように、所定の質問タイプは、例えば、“何kbps”に対して『数量』、“について”に対して『説明』、“とは何”に対して『名称』などであってよい。この他にも、所定の質問タイプとしては、例えば、『5W1H』、『真偽』、『その他』などが挙げられるが、これに限定されない。
 質問タイプの詳細については、例えば、下記の非特許文献を参照することができる。
  杉山弘晃、目黒豊美、東中竜一郎、「対話システムのパーソナリティを問う質問の大規模な収集と分析」、人工知能学会論文誌、DSF-518,2016
  永田昌明、齋藤邦子、松尾義博、「日本語自然文検索システム Web Answers」、言語処理学会第12回全国大会、2006
 質問判定部10は、入力部130から入力された質問データを、パッセージ検索部30へ出力する。質問判定部10は、質問データに適合するパッセージデータ(回答候補)を、パッセージ検索部30から取得する。
 パッセージデータは、文書が段落などの細かい単位(パッセージ)に分割されたテキストデータである。パッセージは、その単位が特に限定されるものではないが、自動または手動で分割可能な単位であればよく、例えば、段落(paragraph)、章(section)、節(subsection)などであってよい。パッセージデータは、文書データベース121に記憶されている。
 具体的には、図5に示すように、パッセージデータは、例えば、ID:「ISDN(アイエスディーエヌ、Integrated Services Digital Network、サービス総合デジタル網)とは交換機・中継回線・加入者線まで全てデジタル化された、パケット通信・回線交換データ通信にも利用できる公衆交換電話網である。音声は、0.3 - 3.4kHzを64kbpsの回線交換でISDN網内を伝送しているため、VoIPよりも音声品質が安定している。」、ID:「Fiber To The Home(ファイバー・トゥ・ザ・ホーム)または略してFTTH(エフ・ティー・ティー・エイチ)とは光ファイバーを伝送路として一般個人宅へ直接引き込む、アクセス系光通信の網構成方式のことである。また一般個人宅に限らず、同様の形態でサービスの提供を受ける小規模なオフィスも含めてFTTP (Fiber To The Premises: 敷地) ということもある。」、ID:「デジタル加入者線(でじたるかにゅうしゃせん、DSL:Digital Subscriber Line)とはツイストペアケーブル通信線路で高速デジタルデータ通信を行う技術、もしくは電気通信役務を指す。」などであってよい。
 質問判定部10は、質問分類部20から取得した所定の質問タイプに基づいて、機械読解が必要であるか否かを判定する。例えば、質問タイプが『説明』あるいは『その他』である場合、質問判定部10は、ユーザが説明的な回答を期待していると判定し、この場合、機械読解が不要であると判定する。例えば、質問タイプが『数量』あるいは『名称』である場合、質問判定部10は、ユーザが説明的な回答を期待していないと判定し、この場合、機械読解が必要であると判定する。
 あるいは、質問判定部10は、機械読解の研究用に作成されたデータセットで分析された質問タイプの分類(例えば、下記の非特許文献のTable2)で文字数が長くなると予想されるもの(例えば、ClauseおよびOther)以外を機械読解が必要であると判定してよい。
  P. Rajpurkar, J. Zhang, K. Lopyrev, and P. Liang. Squad: 100,000+ questions for machine comprehension of text. In EMNLP, pp. 2383-2392, 2016
 あるいは、質問判定部10は、任意の分類方法を用いる際、あらかじめ分類毎の機械読解結果の文字数の平均値を取っておき、あらかじめ設定された文字数未満の分類の場合、機械読解が必要であると判定してよい。
 質問判定部10は、機械読解が必要であると判定した場合、質問データおよびパッセージ検索部30から取得した質問データに適合するパッセージデータを、抽出読解部40へ出力する。質問判定部10は、機械読解により該パッセージデータから抽出された回答テキストデータを、抽出読解部40から取得する。質問判定部10は、該回答テキストデータを、回答データとして、出力部140へ出力する。回答テキストデータは、例えば、「64kbps」、「デジタル加入者線」などであってよい(図3参照)。
 質問判定部10は、機械読解が不要であると判定した場合、パッセージ検索部30から取得した質問データに適合するパッセージデータを、回答データとして、出力部140へ出力する。パッセージデータは、例えば、「ISDN(アイエスディーエヌ、Integrated Services Digital Network、サービス総合デジタル網)とは交換機・中継回線・加入者線まで全てデジタル化された、パケット通信・回線交換データ通信にも利用できる公衆交換電話網である。音声は、0.3 - 3.4kHzを64kbpsの回線交換でISDN網内を伝送しているため、VoIPよりも音声品質が安定している。」などであってよい(図3参照)。なお、この場合、質問判定部10は、質問データおよびパッセージ検索部30から取得した質問データに適合するパッセージデータを、抽出読解部40へ出力しない。
 上述のように、質問判定部10は、質問データの特徴が分類された所定の質問タイプと質問データに適合するパッセージデータとを受付け(入力し)、質問タイプに基づいて、機械読解が必要であるか否かを判定し、機械読解が不要であると判定した場合、パッセージデータを回答データとし、機械読解が必要であると判定した場合、質問データおよびパッセージデータに基づいて、機械読解によりパッセージデータから抽出された回答テキストデータを回答データとする。このため、高精度な回答データを効率的に生成することが可能となる。加えて、高精度な大規模機械読解が可能となる。
 質問分類部20は、質問判定部10から入力された質問データの特徴を示す質問テキストデータを、所定の質問タイプに分類する。質問分類部20は、所定の質問タイプを、質問判定部10へ出力する。質問分類部20は、所定の質問タイプを、あらかじめ設定してよい。
 質問分類部20が質問データの特徴を抽出する方法は、特に限定されるものではない。例えば、質問分類部20は、質問データを細かい単位に分割し、それぞれの単位を、特徴の集合に変換する。例えば、質問分類部20は、質問データに含まれる個々の文字の集合を特徴の集合としてよい。例えば、質問分類部20は、形態素解析器を内蔵し、質問データを、単語の集合、形態素の集合、品詞の集合などに変換して、これらを特徴の集合としてよい。
 形態素解析器の詳細については、例えば、下記の非特許文献を参照することができる。
  Taku Kudo, Kaoru Yamamoto, Yuji Matsumoto: Applying Conditional Random Fields to Japanese Morphological Analysis, Proceedings of the 2004 Conference on Empirical Methods in Natural Language Processing (EMNLP-2004), pp.230-237 (2004)
 質問分類部20は、それぞれの特徴に対応する質問タイプを決定する。質問分類部20が質問タイプを決定する方法は、特に限定されるものではない。例えば、質問分類部20は、質問として典型的に現れそうな特徴である単語(例えば、「いつ」、「いくつ」)と質問タイプ(例えば、『数量』)とを、あらかじめ対応付けておく。そして、質問分類部20は、質問を分割した単語を特徴の集合としたときに、「いつ」または「いくつ」が現れると、これらに質問タイプとして『数量』を対応させる。例えば、質問分類部20は、多数の質問データを収集しておき、それぞれの質問データについて、人手により、特徴の集合が何れの質問タイプであるかを決定し、あらかじめ対応付けておく。さらに、質問分類部20は、特徴の集合および質問タイプを教師データとして、機械学習で分類器の分類モデルを作成しておいてもよい。分類器は、特に限定されるものではなく、例えば、線形分類器、SVM(Support Vector Machine)、ニューラルネットワークなど、教師あり機械学習の分類器であれば、どのようなものであっても構わない。そして、質問分類部20は、作成した分類器を用いて、質問を分割した単語である特徴の集合を入力として、特徴の集合に対応する質問タイプを推定する。
 パッセージ検索部30は、質問判定部10から入力された質問データに適合するパッセージデータを検索する。パッセージ検索部30は、質問データから検索要求を生成し、生成した検索要求に基づいて、文書データベース121から、該検索要求に適合するパッセージデータを取得する。パッセージ検索部30が取得するパッセージデータの数は、特に限定されない。例えば、検索要求がテキストである場合、パッセージ検索部30は、文書データベース121から、該テキストを構成する文字列を含むパッセージデータを検索する。例えば、検索要求が単語の集合である場合、パッセージ検索部30は、文書データベース121から、該単語を含むパッセージデータを検索する。検索要求は、質問データが表現されているデータであればよく、例えば、質問データ自体、質問データが単語に分割された分割データの全て、あるいは、質問データが単語に分割された分割データの一部などであってよい。パッセージ検索部30は、質問データに適合するパッセージデータを、質問判定部10へ出力する。なお、文書データベース121に、質問データに適合するパッセージデータが存在しない場合、パッセージ検索部30は、質問データに適合するパッセージデータが存在しないという検索結果を、質問判定部10へ出力する。
 パッセージ検索部30は、質問データから、質問キーワードデータを抽出する。パッセージ検索部30は、例えば、質問データを単語列に分割し、分割した単語列に品詞を付与する形態素解析システムを内蔵し、質問データに含まれる名詞の単語を、質問キーワードデータとして抽出する。
 具体的には、図6に示すように、質問キーワードデータは、例えば、「ISDNの伝送速度は何kbpsですか」に対して、‘ISDN’、‘伝送’、‘速度’、‘kbps’、「ISDNについて教えてください」に対して、‘ISDN’、「ツイストペアケーブル通信線路で高速デジタルデータ通信を行う技術とは何か」に対して、‘ツイスト’、‘ペア’、‘ケーブル’、‘通信線路’、‘高速’、‘デジタル’、‘データ’、‘通信’、‘技術’などであってよい。
 パッセージ検索部30は、パッセージデータから、パッセージキーワードデータを抽出する。パッセージ検索部30は、例えば、パッセージデータを単語列に分割し、分割した単語列に品詞を付与する形態素解析システムを内蔵し、パッセージデータに含まれる名詞の単語を、パッセージキーワードデータとして抽出する。
 具体的には、図7に示すように、パッセージキーワードデータは、パッセージID:IDのパッセージデータに対して、‘ISDN’、‘アイエスディーエヌ’、‘Integrated Services Digital Network’、‘サービス’、‘総合’、‘デジタル’、‘網’、‘交換機’、‘中継’、‘回線’、‘加入者’、‘線’、‘デジタル化’、‘パケット’、‘通信’、‘回線’、‘交換’、‘データ’、‘通信’、‘公衆’、‘交換’、‘電話’、‘網’、‘音声’、‘0.3’、‘3.4’、‘kHz’、‘64’、‘kbps’、‘回線’、‘交換’、‘ISDN’、‘網’、‘内’、‘伝送’、‘VoIP’、‘音声’、‘品質’、‘安定’、パッセージID:IDのパッセージデータに対して、‘Fiber To The Home’、‘ファイバー・トゥ・ザ・ホーム’、‘FTTH’、‘エフ・ティー・ティー・エイチ’、‘光’、‘ファイバー’、‘伝送’、‘路’、‘一般’、‘個人’、‘宅’、‘アクセス’、‘系’、‘光’、‘通信’、‘網’、‘構成’、‘方式’、‘一般’、‘個人’、‘宅’、‘形態’、‘サービス’、‘提供’、‘オフィス’、‘FTTP’、‘Fiber To The Premises’、‘敷地’、パッセージID:IDのパッセージデータに対して、‘デジタル’、‘加入’、‘者’、‘線’、‘でじたるかにゅうしゃせん’、‘DSL’、‘Digital Subscriber Line’、‘ツイスト’、‘ペア’、‘ケーブル’、‘通信’、‘線’、‘路’、‘デジタル’、‘データ’、‘通信’、‘技術’、‘電気’、‘通信’、‘役務’などであってよい。
 パッセージ検索部30は、質問キーワードデータおよびパッセージキーワードデータに基づいて、質問キーワードデータとパッセージキーワードデータとの一致度が高いパッセージデータを、質問データに適合するパッセージデータとする。
 例えば、パッセージ検索部30は、質問データ「ISDNの伝送速度は何kbpsですか」について、質問キーワードデータ‘ISDN’、‘伝送’、‘速度’、‘kbps’をできるだけ多く含むパッセージデータを検索する。例えば、パッセージID:IDのパッセージデータにおいて、該質問キーワードデータとパッセージキーワードデータとが一致する件数は、“3件”である。例えば、パッセージID:IDのパッセージデータにおいて、該質問キーワードデータとパッセージキーワードデータとが一致する件数は、“1件”である。例えば、パッセージID:IDのパッセージデータにおいて、該質問キーワードデータとパッセージキーワードデータとが一致する件数は、“0件”である。したがって、パッセージ検索部30は、質問データ「ISDNの伝送速度は何kbpsですか」に適合するパッセージデータが、パッセージID:IDのパッセージデータであると判断する。
 文書データベース121は、マニュアル文書、インターネット上のフリー百科事典(例えば、Wikipedia)から抽出された文書などの複数の文書から抽出され、文書と比較して細かい単位に分割されたパッセージデータを蓄積しているデータベースである。文書データベース121には、あらかじめインデックスが作成されていてもよい。パッセージ検索部30は、インデックスを参照することで、質問データに適合するパッセージデータを高速で検索することができる。なお、記憶部120には、あらかじめ文書データベース121が記憶されている。
 抽出読解部40は、質問判定部10から入力された質問データとパッセージデータとの対に基づいて、ニューラルネットワークによる機械読解を用いて、パッセージデータから回答テキストデータを抽出する。例えば、抽出読解部40は、あらかじめ用意された、質問データ、パッセージデータ、およびパッセージデータに含まれるテキストデータにおける文字列の位置(始点および終点)を単位とする多数のデータを教師データとして、ニューラルネットワークの学習モデルを生成する。なお、学習モデルはニューラルネットワークを用いたモデルに限定されるものではない。そして、抽出読解部40は、該学習モデルを用いて、未知の質問データおよびパッセージデータに基づいて、質問に対する回答として最適な文字列を、回答テキストデータとして抽出する。抽出読解部40は、回答テキストデータを、質問判定部10へ出力する。
 図8は、BERTモデルを用いた機械読解(以下、「BERT読解」という。)の出力の一例を示す図である。例えば、抽出読解部40は、質問データ「ISDNの伝送速度は何kbpsですか」および質問データに適合するパッセージID:IDのパッセージデータに基づいて、「64kbps」という回答テキストデータを、BERT読解の出力として抽出する。例えば、抽出読解部40は、質問データ「ISDNについて教えてください」および質問データに適合するパッセージID:IDのパッセージデータに基づいて、「交換機・中継回線・加入者線まで全てデジタル化された、パケット通信・回線交換データ通信にも利用できる公衆交換電話網である。」という回答テキストデータを、BERT読解の出力として抽出する。例えば、抽出読解部40は、質問データ「ツイストペアケーブル通信線路で高速デジタルデータ通信を行う技術とは何か」および質問データに適合するパッセージID:IDのパッセージデータに基づいて、「デジタル加入者線」という回答テキストデータを、BERT読解の出力として抽出する。
 第1実施形態に係る質問回答装置100は、質問タイプに応じて機械読解の要否を適切に判定することで、高精度な回答データを生成することができる。これにより、質問に対する回答の精度を向上させた質問回答装置100を実現できる。また、不要な機械読解を実施せずに済むため、コンピュータのGPUによる計算コストを大幅に低減させることができる。また、高精度な大規模機械読解が可能な質問回答装置100を実現できる。
<質問回答方法>
 図9を参照して、第1実施形態に係る質問回答方法の一例について説明する。
 ステップ101において、質問判定部10は、質問データに含まれる質問テキストデータが分類された質問タイプを、質問分類部20から取得する。
 ステップ102において、質問判定部10は、質問データに適合するパッセージデータID(i=1,2,・・・n)を、パッセージ検索部30から取得する。
 ステップ103において、質問判定部10は、iがnより小さいか否かを判定する。質問判定部10は、iがn以下であると判定した場合(ステップ103→YES)、ステップ104の処理を行う。質問判定部10は、iがnより大きいと判定した場合(ステップ103→NO)、ステップ108の処理を行う。
 ステップ104において、質問判定部10は、質問タイプが所定のリストに含まれるか否か、すなわち、機械読解が必要であるか否かを判定する。質問判定部10は、質問タイプが所定のリストに含まれる、すなわち、機械読解が不要であると判定した場合(ステップ104→YES)、ステップ105の処理を行う。質問判定部10は、質問タイプが所定のリストに含まれない、すなわち、機械読解が必要であると判定した場合(ステップ104→NO)、ステップ106の処理を行う。所定のリストとは、例えば、上述した『説明』、『その他』を含むリストである(図4参照)。つまり、質問タイプが所定のリストに含まれるとは、質問タイプが、例えば、『説明』または『その他』に該当することを意味する。また、質問タイプが所定のリストに含まれないとは、質問タイプが、例えば、『数量』または『名称』に該当することを意味する。
 ステップ105において、質問判定部10は、パッセージ検索部30から取得した質問データに適合するパッセージデータIDを、回答データとする。
 ステップ106において、質問判定部10は、質問データおよびパッセージ検索部30から取得した質問データに適合するパッセージデータIDを、抽出読解部40へ出力し、機械読解により該パッセージデータIDから抽出された回答テキストデータrを、抽出読解部40から取得し、該回答テキストデータrを、回答データとする。
 ステップ107において、質問判定部10は、iに1を加えて、再び、ステップ103の処理を行う。
 ステップ108において、質問判定部10は、パッセージデータIDあるいは回答テキストデータrを、回答データとして、出力部140へ出力する。
 上述の質問回答方法によれば、質問タイプに応じて機械読解の要否を適切に判定することで、高精度な回答データを生成することができる。これにより、質問に対する回答の精度を向上させた質問回答方法を実現できる。
〔第2実施形態〕
 図10を参照して、第2実施形態に係る質問回答装置100Aの構成の一例について説明する。
 第2実施形態に係る質問回答装置100Aが、第1実施形態に係る質問回答装置100と異なる点は、質問判定部10Aが、質問分類部20から取得した所定の質問タイプに基づいて、機械読解が必要であるか否かを判定する前に、まず、パッセージデータの文字数に基づいて、該パッセージデータを回答データとするか否かを判定する点である。その他の構成は、同様であるため、重複した説明を省略する。
 質問回答装置100Aは、制御部110Aと、記憶部120と、入力部130と、出力部140と、を備える。制御部110は、質問判定部10Aと、質問分類部20と、パッセージ検索部30と、抽出読解部40と、を備える。
 質問判定部10Aは、パッセージ検索部30から取得した質問データに適合するパッセージデータの文字数を計測する。例えば、パッセージID:IDのパッセージデータの文字数は、190文字である。例えば、パッセージID:IDのパッセージデータの文字数は、191文字である。例えば、パッセージID:IDのパッセージデータの文字数は、98文字である。
 質問判定部10Aは、計測したパッセージデータの文字数が閾値未満であるか否かに基づいて、該パッセージデータを回答データとするか否かを判定する。閾値は、あらかじめ設定されていてよく、例えば、30文字、100文字などのように任意に設定されていてよい。質問判定部10Aが判定の際に用いる指標は、パッセージデータの単語数であってもよい。指標は、少なくとも、パッセージデータに含まれる文字の数を示すものであればよく、特に限定されるものではない。
 質問判定部10Aは、計測したパッセージデータの文字数が閾値未満である場合、該パッセージデータを回答データとすると判定し、該パッセージデータを、回答データとして、出力部140へ出力する。例えば、質問判定部10Aは、パッセージID:IDのパッセージデータの文字数(98文字)が閾値(例えば、100文字)未満である場合、パッセージID:IDのパッセージデータを回答データとすると判定し、パッセージID:IDのパッセージデータを、回答データとして、出力部140へ出力する(図10の質問データNo.3に対応する回答データ参照)。なお、この場合、質問判定部10Aは、質問データおよびパッセージ検索部30から取得した質問データに適合するパッセージデータを、抽出読解部40へ出力しない。
 質問判定部10Aは、計測したパッセージデータの文字数が閾値以上である場合、該パッセージデータを回答データとしないと判定し、さらに、質問分類部20から取得した所定の質問タイプに基づいて、機械読解が必要であるか否かを判定する。例えば、質問判定部10Aは、パッセージID:IDのパッセージデータの文字数(190文字)が閾値(例えば、100文字)以上である場合、パッセージID:IDのパッセージデータを回答データとしないと判定する。また、例えば、質問判定部10Aは、パッセージID:IDのパッセージデータの文字数(191文字)が閾値(例えば、100文字)以上である場合、パッセージID:IDのパッセージデータを回答データとしないと判定する。
 質問判定部10Aは、機械読解が必要であると判定した場合、質問データおよびパッセージ検索部30から取得した質問データに適合するパッセージデータを、抽出読解部40へ出力する。質問判定部10Aは、機械読解により該パッセージデータから抽出された回答テキストデータを、抽出読解部40から取得する。質問判定部10Aは、該回答テキストデータを、回答データとして、出力部140へ出力する。例えば、質問判定部10Aは、回答テキストデータ「64kbps」を、回答データとして、出力部140へ出力する(図10の質問データNo.1に対応する回答データ参照)。
 一方、質問判定部10Aは、機械読解が不要であると判定した場合、パッセージ検索部30から取得した質問データに適合するパッセージデータを、回答データとして、出力部140へ出力する。例えば、質問判定部10Aは、パッセージID:IDのパッセージデータを、回答データとして、出力部140へ出力する(図10の質問データNo.2に対応する回答データ参照)。なお、この場合、質問判定部10Aは、質問データおよびパッセージ検索部30から取得した質問データに適合するパッセージデータを、抽出読解部40へ出力しない。
 第2実施形態に係る質問回答装置100Aは、まず、パッセージデータの文字数に基づいて、該パッセージデータを回答データとするか否かを判定し、次に、質問タイプに応じて機械読解の要否を適切に判定することで、高精度な回答データを生成することができる。これにより、質問に対する回答の精度を向上させた質問回答装置100Aを実現できる。例えば、コンピュータ端末の画面上に、パッセージが数語から1文程度で表現されている場合、オペレータは、それらを素早く見て理解する事ができるため、機械読解を実施する必要がないにも関わらず、従来の技術では、全てのパッセージについて一律に機械読解を実施してしまっていた。このような問題を回避し、不要な機械読解を実施せずに済むため、コンピュータのGPUによる計算コストを大幅に低減させることができる。また、高精度な大規模機械読解が可能な質問回答装置100Aを実現できる。
<質問回答方法>
 図11を参照して、第2実施形態に係る質問回答方法の一例について説明する。
 ステップ201において、質問判定部10Aは、質問データの特徴を示す質問テキストデータが分類された質問タイプを、質問分類部20から取得する。
 ステップ202において、質問判定部10Aは、質問データに適合するパッセージデータID(i=1,2,・・・n)を、パッセージ検索部30から取得する。
 ステップ203において、質問判定部10Aは、iがnより小さいか否かを判定する。質問判定部10Aは、iがn以下であると判定した場合(ステップ203→YES)、ステップ204の処理を行う。質問判定部10Aは、iがnより大きいと判定した場合(ステップ203→NO)、ステップ208の処理を行う。
 ステップ204において、質問判定部10Aは、パッセージ検索部30から取得した質問データに適合するパッセージデータの文字数が閾値未満であるか否かを判定する。質問判定部10Aは、パッセージ検索部30から取得した質問データに適合するパッセージデータの文字数が閾値未満である場合(ステップ204→YES)、ステップ206の処理を行う。質問判定部10Aは、パッセージ検索部30から取得した質問データに適合するパッセージデータの文字数が閾値以上である場合(ステップ204→NO)、ステップ205の処理を行う。
 ステップ205において、質問判定部10Aは、質問タイプが所定のリストに含まれるか否か、すなわち、機械読解が必要であるか否かを判定する。質問判定部10Aは、質問タイプが所定のリストに含まれる、すなわち、機械読解が不要であると判定した場合(ステップ205→YES)、ステップ206の処理を行う。質問判定部10Aは、質問タイプが所定のリストに含まれない、すなわち、機械読解が必要であると判定した場合(ステップ205→NO)、ステップ207の処理を行う。
 ステップ206において、質問判定部10Aは、パッセージ検索部30から取得した質問データに適合するパッセージデータIDを、回答データとする。
 ステップ207において、質問判定部10Aは、質問データおよびパッセージ検索部30から取得した質問データに適合するパッセージデータIDを、抽出読解部40へ出力し、機械読解により該パッセージデータIDから抽出された回答テキストデータrを、抽出読解部40から取得し、該回答テキストデータrを、回答データとする。
 ステップ208において、質問判定部10Aは、iに1を加えて、再び、ステップ203の処理を行う。
 ステップ209において、質問判定部10Aは、パッセージデータIDあるいは回答テキストデータrを、回答データとして、出力部140へ出力する。
 上述の質問回答方法によれば、まず、パッセージデータの文字数に基づいて、該パッセージデータを回答データとするか否かを判定し、次に、質問タイプに応じて機械読解の要否を適切に判定することで、高精度な回答データを生成することができる。これにより、質問に対する回答の精度を向上させた質問回答方法を実現できる。
<変形例>
 本実施形態では、質問回答装置100,100Aが抽出型機械読解を用いる場合を一例に挙げて説明したが、機械読解の種類は、これに限定されるものではなない。例えば、質問回答装置100,100Aは、回答データをパッセージデータの範囲に限定しない生成型機械読解を用いてもよい。
 また、本実施形態では、質問回答装置100,100Aに、1つの質問データが入力される場合を一例に挙げて説明したが、複数の質問データが入力されてもよい。複数の質問データが入力される場合、質問回答装置100,100Aは、1つずつ質問データの入力を受け付け、回答データを出力することを繰り返せばよい。
<プログラム>
 上述した質問回答装置100,100Aは、コンピュータ201によって実現することができる。また、質問回答装置100,100Aとして機能させるためのプログラムが提供されてもよい。また、該プログラムは、記憶媒体に記憶されてもよいし、ネットワークを通して提供されてもよい。図12は、質問回答装置100,100Aとしてそれぞれ機能するコンピュータ201の概略構成を示すブロック図である。ここで、コンピュータ201は、汎用コンピュータ、専用コンピュータ、ワークステーション、PC(Personal Computer)、電子ノートパッドなどであってもよい。プログラム命令は、必要なタスクを実行するためのプログラムコード、コードセグメントなどであってもよい。
 図12に示すように、コンピュータ201は、プロセッサ210と、ROM(Read Only Memory)220と、RAM(Random Access Memory)230と、ストレージ240と、入力部250と、出力部260と、通信インターフェース(I/F)270とを備える。各構成は、バス280を介して相互に通信可能に接続されている。プロセッサ210は、具体的にはCPU(Central Processing Unit)、MPU(Micro Processing Unit)、GPU(Graphics Processing Unit)、DSP(Digital Signal Processor)、SoC(System on a Chip)などであり、同種又は異種の複数のプロセッサにより構成されてもよい。
 プロセッサ210は、各構成の制御、及び各種の演算処理を実行する。すなわち、プロセッサ210は、ROM220又はストレージ240からプログラムを読み出し、RAM230を作業領域としてプログラムを実行する。プロセッサ210は、ROM220又はストレージ240に記憶されているプログラムに従って、上記各構成の制御及び各種の演算処理を行う。上述した実施形態では、ROM220又はストレージ240に、本開示に係るプログラムが記憶されている。
 プログラムは、コンピュータ201が読み取り可能な記憶媒体に記憶されていてもよい。このような記憶媒体を用いれば、プログラムをコンピュータ201にインストールすることが可能である。ここで、プログラムが記憶された記憶媒体は、非一時的(non-transitory)記憶媒体であってもよい。非一時的記憶媒体は、特に限定されるものではないが、例えば、CD-ROM、DVD-ROM、USB(Universal Serial Bus)メモリなどであってもよい。また、このプログラムは、ネットワークを介して外部装置からダウンロードされる形態としてもよい。
 ROM220は、各種プログラム及び各種データを記憶する。RAM230は、作業領域として一時的にプログラム又はデータを記憶する。ストレージ240は、HDD(Hard Disk Drive)又はSSD(Solid State Drive)により構成され、オペレーティングシステムを含む各種プログラム及び各種データを記憶する。
 入力部250は、ユーザの入力操作を受け付けて、ユーザの操作に基づく情報を取得する1つ以上の入力インターフェースを含む。例えば、入力部250は、ポインティングデバイス、キーボード、マウスなどであるが、これらに限定されない。
 出力部160は、情報を出力する1つ以上の出力インターフェースを含む。例えば、出力部160は、情報を映像で出力するディスプレイ、又は情報を音声で出力するスピーカであるが、これらに限定されない。なお、出力部160は、タッチパネル方式のディスプレイである場合には、入力部250としても機能する。
 通信インターフェース(I/F)270は、外部の装置と通信するためのインターフェースである。
 以上の実施形態に関し、更に以下の付記を開示する。
 (付記項1)
 質問データに対する回答データを生成する質問回答装置であって、
 メモリと、
 前記メモリに接続された少なくとも1つのコントローラと、
 を備え、
 前記コントローラは、
 前記質問データの特徴が分類された所定の質問タイプと前記質問データに適合するパッセージデータとを受付け、
 前記質問タイプに基づいて、機械読解が必要であるか否かを判定し、
 前記機械読解が不要であると判定した場合、前記パッセージデータを前記回答データとし、前記機械読解が必要であると判定した場合、前記質問データおよび前記パッセージデータに基づいて、前記機械読解により前記パッセージデータから抽出された回答テキストデータを前記回答データとする、
 質問回答装置。
 (付記項2)
 前記コントローラは、
 前記質問データの特徴を、前記質問タイプに分類し、
 前記パッセージデータを検索し、
 前記質問データおよび前記パッセージデータに基づいて、機械読解により前記パッセージデータから回答テキストデータを抽出する、
 付記項1に記載の質問回答装置。
 (付記項3)
 前記コントローラは、前記機械読解が必要であるか否かを判定する前に、前記パッセージデータの文字数が閾値未満であるか否かを判定し、前記文字数が前記閾値未満である場合、前記パッセージデータを前記回答データとする、
 付記項1または2に記載の質問回答装置。
 (付記項4)
 質問データに対する回答データを生成する質問回答装置による質問回答方法であって、
 前記質問データの特徴が分類された所定の質問タイプと前記質問データに適合するパッセージデータとを受付けるステップと、
 前記質問タイプに基づいて、機械読解が必要であるか否かを判定するステップと、
 前記機械読解が不要であると判定した場合、前記パッセージデータを前記回答データとするステップと、
 前記機械読解が必要であると判定した場合、前記質問データおよび前記パッセージデータに基づいて、前記機械読解により前記パッセージデータから抽出された回答テキストデータを前記回答データとするステップと、
 を含む、質問回答方法。
 (付記項5)
 コンピュータによって実行可能なプログラムを記憶した非一時的記憶媒体であって、
 前記コンピュータを、付記項1から3の何れか一項に記載の質問回答装置として機能させるプログラムを記憶した非一時的記憶媒体。
 上述の実施形態は代表的な例として説明したが、本開示の趣旨および範囲内で、多くの変更および置換ができることは当業者に明らかである。したがって、本発明は、上述の実施形態によって制限するものと解するべきではなく、請求の範囲から逸脱することなく、種々の変形および変更が可能である。例えば、実施形態の構成図に記載の複数の構成ブロックを1つに組み合わせたり、あるいは1つの構成ブロックを分割したりすることが可能である。また、実施形態のフローチャートに記載の複数の工程を1つに組み合わせたり、あるいは1つの工程を分割したりすることが可能である。
 10,10A    質問判定部
 20        質問分類部
 30        パッセージ検索部
 40        抽出読解部
 100,100A  質問回答装置
 110,110A  制御部
 120       記憶部
 121       文書データベース
 130       入力部
 140       出力部
 

Claims (5)

  1.  質問データに対する回答データを生成する質問回答装置であって、
     前記質問データの特徴が分類された所定の質問タイプと前記質問データに適合するパッセージデータとを受付け、前記質問タイプに基づいて、機械読解が必要であるか否かを判定し、前記機械読解が不要であると判定した場合、前記パッセージデータを前記回答データとし、前記機械読解が必要であると判定した場合、前記質問データおよび前記パッセージデータに基づいて、前記機械読解により前記パッセージデータから抽出された回答テキストデータを前記回答データとする質問判定部を備える、
     質問回答装置。
  2.  前記質問データの特徴を、前記質問タイプに分類する質問分類部と、
     前記パッセージデータを検索するパッセージ検索部と、
     前記質問データおよび前記パッセージデータに基づいて、機械読解により前記パッセージデータから回答テキストデータを抽出する抽出読解部と、を更に備える、
     請求項1に記載の質問回答装置。
  3.  前記質問判定部は、前記機械読解が必要であるか否かを判定する前に、前記パッセージデータの文字数が閾値未満であるか否かを判定し、前記文字数が前記閾値未満である場合、前記パッセージデータを前記回答データとする、
     請求項1または2に記載の質問回答装置。
  4.  質問データに対する回答データを生成する質問回答装置による質問回答方法であって、
     前記質問データの特徴が分類された所定の質問タイプと前記質問データに適合するパッセージデータとを受付けるステップと、
     前記質問タイプに基づいて、機械読解が必要であるか否かを判定するステップと、
     前記機械読解が不要であると判定した場合、前記パッセージデータを前記回答データとするステップと、
     前記機械読解が必要であると判定した場合、前記質問データおよび前記パッセージデータに基づいて、前記機械読解により前記パッセージデータから抽出された回答テキストデータを前記回答データとするステップと、
     を含む、質問回答方法。
  5.  コンピュータを、請求項1から3の何れか一項に記載の質問回答装置として機能させるためのプログラム。
     
     
PCT/JP2021/033986 2021-09-15 2021-09-15 質問回答装置、質問回答方法、およびプログラム WO2023042316A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
PCT/JP2021/033986 WO2023042316A1 (ja) 2021-09-15 2021-09-15 質問回答装置、質問回答方法、およびプログラム
JP2023548013A JPWO2023042316A1 (ja) 2021-09-15 2021-09-15

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2021/033986 WO2023042316A1 (ja) 2021-09-15 2021-09-15 質問回答装置、質問回答方法、およびプログラム

Publications (1)

Publication Number Publication Date
WO2023042316A1 true WO2023042316A1 (ja) 2023-03-23

Family

ID=85602561

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2021/033986 WO2023042316A1 (ja) 2021-09-15 2021-09-15 質問回答装置、質問回答方法、およびプログラム

Country Status (2)

Country Link
JP (1) JPWO2023042316A1 (ja)
WO (1) WO2023042316A1 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007164462A (ja) * 2005-12-13 2007-06-28 Fuji Xerox Co Ltd 質問応答システム、質問応答方法及び質問応答プログラム
JP2011076565A (ja) * 2009-10-02 2011-04-14 Fujitsu Toshiba Mobile Communications Ltd 情報処理装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007164462A (ja) * 2005-12-13 2007-06-28 Fuji Xerox Co Ltd 質問応答システム、質問応答方法及び質問応答プログラム
JP2011076565A (ja) * 2009-10-02 2011-04-14 Fujitsu Toshiba Mobile Communications Ltd 情報処理装置

Also Published As

Publication number Publication date
JPWO2023042316A1 (ja) 2023-03-23

Similar Documents

Publication Publication Date Title
US11379548B2 (en) Analyzing concepts over time
RU2699399C2 (ru) Система и способ обнаружения орфанных высказываний
US11017301B2 (en) Obtaining and using a distributed representation of concepts as vectors
WO2021000497A1 (zh) 检索方法、装置、计算机设备和存储介质
US20170262783A1 (en) Team Formation
WO2005101235A1 (ja) 対話支援装置
US11258902B2 (en) Partial automation of text chat conversations
CN111177350A (zh) 智能语音机器人的话术形成方法、装置和系统
Bosker Using fuzzy string matching for automated assessment of listener transcripts in speech intelligibility studies
US20190155954A1 (en) Cognitive Chat Conversation Discovery
CN111695338A (zh) 基于人工智能的面试内容精炼方法、装置、设备及介质
US9805740B2 (en) Language analysis based on word-selection, and language analysis apparatus
JP4383328B2 (ja) 意味的速記のためのシステム及び方法
Chuklin et al. Using audio transformations to improve comprehension in voice question answering
JP2020166735A (ja) 生成方法、学習方法、生成プログラム、及び生成装置
WO2023042316A1 (ja) 質問回答装置、質問回答方法、およびプログラム
CN111949777A (zh) 一种基于人群分类的智能语音对话方法、装置及电子设备
KR102222637B1 (ko) 감성 분석 장치, 이를 포함하는 대화형 에이전트 시스템, 감성 분석을 수행하기 위한 단말 장치 및 감성 분석 방법
JP3691773B2 (ja) 文章解析方法とその方法を利用可能な文章解析装置
KR19990047859A (ko) 도서 문헌 데이터베이스 검색을 위한 자연언어 대화 시스템
US20240012998A1 (en) Information processing device, information processing method, and computer program product
Wyawahare et al. AI Powered Multilingual Meeting Summarization
JP2024519263A (ja) テキスト・ツー・スピーチ・モデルの訓練におけるスピーチ・ツー・テキスト・データの使用
Yellamma et al. Automatic and Multilingual Speech Recognition and Translation by using Google Cloud API
CN111666469A (zh) 语句库构建方法、装置、设备和存储介质

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21957498

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 2023548013

Country of ref document: JP