JP7485986B2 - 情報処理方法、情報処理装置、及びプログラム - Google Patents

情報処理方法、情報処理装置、及びプログラム Download PDF

Info

Publication number
JP7485986B2
JP7485986B2 JP2022543829A JP2022543829A JP7485986B2 JP 7485986 B2 JP7485986 B2 JP 7485986B2 JP 2022543829 A JP2022543829 A JP 2022543829A JP 2022543829 A JP2022543829 A JP 2022543829A JP 7485986 B2 JP7485986 B2 JP 7485986B2
Authority
JP
Japan
Prior art keywords
text
question
answer
information processing
posted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022543829A
Other languages
English (en)
Other versions
JPWO2022038662A1 (ja
Inventor
済央 野本
真奈美 伊藤
哲弥 岩田
要 船越
哲 小橋川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Publication of JPWO2022038662A1 publication Critical patent/JPWO2022038662A1/ja
Application granted granted Critical
Publication of JP7485986B2 publication Critical patent/JP7485986B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本開示は、情報処理方法、情報処理装置、及びプログラムに関する。
近年のAI技術の隆盛に伴い、AI(Artificial Intelligence)技術を使ったオフィス内の業務効率の向上が注目されている。AI技術を用いて社内に蓄積されたノウハウ及びマニュアルといった知識源へのアクセスビリティを向上させることで、社内問い合わせを効率化・自動化したり、過去のノウハウが埋没したりしてしまうのを防ぐことが期待されている。
ノウハウをオープンに蓄積する仕組みとして、QA(Questions and Answers)サイトがある。QAサイトにユーザが質問を投稿すると、その質問はQAサイトのユーザ全員に公開される。質問へ回答できるユーザが回答を投稿することで、質問を投稿したユーザは所望の回答を得ることができる。
情報検索の技術として、FAQ(Frequently Asked Questions)検索技術がある。FAQ検索技術の目的は、ユーザの質問又は発言に対して、妥当な応答を返すことである。そこで、FAQ検索技術を用いたFAQシステムは、予めFAQ(質問(Q)とそれに対する回答(A)のペア)をデータベースに保存しておき、ユーザの入力に対して情報検索のアプローチで最も妥当な候補を選択する。このようにすることで、ユーザの質問に対して適切な回答を提示することが可能になる。FAQ検索に関する技術が特許文献1に記載されている。
情報検索のユーザインタフェースとして、テキスト又は音声を通じて、自動的に会話するプログラムであるチャットボット技術を用いることが知られている。
国際公開第2018/097091号
従来のFAQシステムは、事前にFAQを人手で作成しておき、検索技術によりユーザの質問に近い回答をもったFAQを見つけ出す技術である。しかし、FAQの整備コストが高いという課題があった。すなわち、多様な問い合わせに対応するためには多くのFAQを予め人手で作成しておく必要があった。さらには一度作ったFAQもサービスの仕様又は業務内容の変更に従って人手により適宜メンテナンスする必要があった。
かかる事情に鑑みてなされた本開示の目的は、FAQシステムの整備コストを低減することが可能な情報処理方法、情報処理装置、及びプログラムを提供することにある。
一実施形態に係る情報処理方法は、質問及び回答の複数のペアと、前記複数のペアを検索するための検索用インデクスとが記録されたデータベースを参照し、入力された検索クエリに対して、当該検索クエリに対応する質問の回答を出力する情報処理装置の情報処理方法であって、前記情報処理装置の制御部が、質問者による質問の投稿と、回答者による前記質問に対する回答の投稿とを受け付けるQAサイトに投稿された、前記質問に係る少なくとも1つの第1のテキストと、前記質問に対する回答に係る少なくとも1つの第2のテキストとを含むスレッドを管理する質問回答用のデータベースを参照することと、前記少なくとも1つの第1のテキストのいずれかである第3のテキストと、前記少なくとも1つの第2のテキストのいずれかである第4のテキストとを抽出することと、前記第3のテキストと前記第4のテキストとに基づき検索用インデクスを作成することと、前記第3のテキストと、前記第4のテキストと、前記検索用インデクスとを前記データベースに登録することと、を含み、前記質問回答用のデータベースには、前記質問に対する回答に対して付与された評価結果がさらに記憶され、前記制御部は、前記少なくとも1つの第2のテキストのうち、予め定められた評価結果が付与されたテキストを、前記第4のテキストとして抽出することを特徴とする。
一実施形態に係る情報処理装置は、質問及び回答の複数のペアと、前記複数のペアを検索するための検索用インデクスとが記録されたデータベースを参照し、入力された検索クエリに対して、当該検索クエリに対応する質問の回答を出力する情報処理装置であって、質問者による質問の投稿と、回答者による前記質問に対する回答の投稿とを受け付けるQAサイトに投稿された、前記質問に係る少なくとも1つの第1のテキストと、前記質問に対する回答に係る少なくとも1つの第2のテキストとを含むスレッドを管理する質問回答用のデータベースを参照する手順と、前記少なくとも1つの第1のテキストのいずれかである第3のテキストと、前記少なくとも1つの第2のテキストのいずれかである第4のテキストとを抽出する手順と、前記第3のテキストと前記第4のテキストとに基づき検索用インデクスを作成する手順と、前記第3のテキストと、前記第4のテキストと、前記検索用インデクスとを前記データベースに登録する手順と、を実行する制御部を備え、前記質問回答用のデータベースには、前記質問に対する回答に対して付与された評価結果がさらに記憶され、前記制御部は、前記少なくとも1つの第2のテキストのうち、予め定められた評価結果が付与されたテキストを、前記第4のテキストとして抽出することを特徴とする。
一実施形態係るプログラムは、コンピュータを、上記情報処理装置として機能させることを特徴とする。
本開示によれば、FAQシステムの整備コストを低減することが可能な情報処理方法、情報処理装置、及びプログラムを提供することができる。
一実施形態に係る情報処理装置の構成例を示すブロック図である。 第1の実施形態に係る情報処理装置の機能構成例を示すブロック図である。 QAデータの一例を示す図である。 QAデータから抽出されたQ及びAのペアの一例を示す図である。 検索用インデクスの一例を示す図である。 一実施形態に係る情報処理装置の動作の一例を示すフローチャートである。 QAデータ抽出処理の一例を示すフローチャートである。 検索用インデクス作成処理の一例を示す図である。 FAQ検索処理の一例を示すフローチャートである。 第2の実施形態に係る情報処理装置の機能構成例を示すブロック図である。
<第1の実施形態>
以下、図面を参照して本開示の第1の実施形態が説明される。
図1は、本開示の一実施形態に係る情報処理装置10の構成例を示すブロック図である。情報処理装置10は、質問及び回答の複数のペアと、複数のペアを検索するための検索用インデクスとが記録されたデータベースを参照し、入力された検索クエリに対して、検索クエリに対応する質問の回答を出力する。情報処理装置10の制御部11は、後述するQAサイト20に投稿された、質問に係る少なくとも1つの第1のテキストと、質問に対する回答に係る少なくとも1つの第2のテキストとを含むスレッドを管理する質問回答用のデータベースを参照する。制御部11は、少なくとも1つの第1のテキストのいずれかである第3のテキストと、少なくとも1つの第2のテキストのいずれかである第4のテキストとを抽出する。制御部11は、第3のテキストと第4のテキストとに基づき検索用インデクスを作成し、第3のテキストと、第4のテキストと、検索用インデクスとをデータベースに登録する。このように、情報処理装置10は、QAサイト20に投稿された質問及び回答のペアを用いて、FAQシステムで用いられる検索用インデクスを自動的に拡充する。したがって、情報処理装置10によれば、FAQシステムの整備コストを低減することが可能である。
情報処理装置10は、1つ又は互いに通信可能な複数のサーバ装置である。情報処理装置10は、これらに限定されず、汎用コンピュータ、専用コンピュータ、ワークステーション、PC(Personal Computer)、電子ノートパッド等の任意の電子機器であってもよい。図1に示すように、情報処理装置10は、制御部11、記憶部12、通信部13、入力部14、出力部15、及びバス16を備える。
制御部11は、1つ以上のプロセッサを含む。一実施形態において「プロセッサ」は、汎用のプロセッサ、又は特定の処理に特化した専用のプロセッサであるが、これらに限定されない。プロセッサは、例えば、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)、DSP(Digital Signal Processor)、ASIC(Application Specific Integrated Circuit)などであってもよい。制御部11は、情報処理装置10を構成する各構成部とバス16を介して通信可能に接続され、情報処理装置10全体の動作を制御する。
記憶部12は、HDD、SSD、EEPROM、ROM、及びRAMを含む任意の記憶モジュールを含む。記憶部12は、例えば、主記憶装置、補助記憶装置、又はキャッシュメモリとして機能してもよい。記憶部12は、情報処理装置10の動作に用いられる任意の情報を記憶する。例えば、記憶部12は、システムプログラム、アプリケーションプログラム、及び通信部13によって受信された各種情報等を記憶してもよい。記憶部12は、情報処理装置10に内蔵されているものに限定されず、USB等のデジタル入出力ポート等によって接続されている外付けのデータベース又は外付け型の記憶モジュールであってもよい。HDDはHard Disk Driveの略称である。SSDはSolid State Driveの略称である。EEPROMはElectrically Erasable Programmable Read-Only Memoryの略称である。ROMはRead-Only Memoryの略称である。RAMはRandom Access Memoryの略称である。USBはUniversal Serial Busの略称である。
通信部13は、任意の通信技術によって他の装置と通信接続可能な、任意の通信モジュールを含む。通信部13は、さらに、他の装置との通信を制御するための通信制御モジュール、及び他の装置との通信に必要となる識別情報等の通信用データを記憶する記憶モジュールを含んでもよい。
入力部14は、ユーザの入力操作を受け付けて、ユーザの操作に基づく入力情報を取得する1つ以上の入力インタフェースを含む。例えば、入力部14は、物理キー、静電容量キー、ポインティングディバイス、出力部15のディスプレイと一体的に設けられたタッチスクリーン、又は音声入力を受け付けるマイク等であるが、これらに限定されない。
出力部15は、ユーザに対して情報を出力し、ユーザに通知する1つ以上の出力インタフェースを含む。例えば、出力部15は、情報を画像で出力するディスプレイ、又は情報を音声で出力するスピーカ等であるが、これらに限定されない。なお、上述の入力部14及び出力部15の少なくとも一方は、情報処理装置10と一体に構成されてもよいし、別体として設けられてもよい。
情報処理装置10の機能は、本実施形態に係るプログラムを、制御部11に含まれるプロセッサで実行することにより実現される。すなわち、情報処理装置10の機能は、ソフトウェアにより実現される。プログラムは、情報処理装置10の動作に含まれるステップの処理をコンピュータに実行させることで、当該ステップの処理に対応する機能をコンピュータに実現させる。すなわち、プログラムは、コンピュータを本実施形態に係る情報処理装置10として機能させるためのプログラムである。プログラム命令は、必要なタスクを実行するためのプログラムコード、コードセグメントなどであってもよい。
プログラムは、コンピュータが読み取り可能な記録媒体に記録されていてもよい。このような記録媒体を用いれば、プログラムをコンピュータにインストールすることが可能である。ここで、プログラムが記録された記録媒体は、非一過性の(非一時的な)記録媒体であってもよい。非一過性の記録媒体は、CD(Compact Disk)-ROM(Read-Only Memory)、DVD(Digital Versatile Disc)-ROM、BD(Blu-ray(登録商標) Disc)-ROMなどであってもよい。また、プログラムをサーバのストレージに格納しておき、ネットワークを介して、サーバから他のコンピュータにプログラムを転送することにより、プログラムは流通されてもよい。プログラムはプログラムプロダクトとして提供されてもよい。
コンピュータは、例えば、可搬型記録媒体に記録されたプログラム又はサーバから転送されたプログラムを、一旦、主記憶装置に格納する。そして、コンピュータは、主記憶装置に格納されたプログラムをプロセッサで読み取り、読み取ったプログラムに従った処理をプロセッサで実行する。コンピュータは、可搬型記録媒体から直接プログラムを読み取り、プログラムに従った処理を実行してもよい。コンピュータは、コンピュータにサーバからプログラムが転送される度に、逐次、受け取ったプログラムに従った処理を実行してもよい。このような処理は、サーバからコンピュータへのプログラムの転送を行わず、実行指示及び結果取得のみによって機能を実現する、いわゆるASP型のサービスによって実行されてもよい。「ASP」は、Application Service Providerの略称である。プログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるものが含まれる。例えば、コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータは、「プログラムに準ずるもの」に該当する。
情報処理装置10の一部又は全ての機能が、制御部11に含まれる専用回路により実現されてもよい。すなわち、情報処理装置10の一部又は全ての機能が、ハードウェアにより実現されてもよい。また、情報処理装置10は単一の情報処理装置により実現されてもよいし、複数の情報処理装置の協働により実現されてもよい。
図2は、第1の実施形態に係る情報処理装置10の機能構成例を示すブロック図である。情報処理装置10は、QAサイト20に投稿された質問及び質問対する回答に基づき、FAQシステムで用いるFAQデータを生成する。情報処理装置10は、QAデータ抽出部31、検索用インデクス作成部32、検索用インデクスDB33、及びFAQ検索部34の機能構成を備える。本実施形態では、情報処理装置10の外にQAデータDB21を有するQAサイト20が設けられている場合の例を説明するが、情報処理装置10がQAデータDB21を有するQAサイト20備えるようにしてもよい。
QAサイト20は、質問者による質問の投稿と、回答者による質問に対する回答の投稿とを受け付けるサイトである。QAサイト20は、例えば、インターネットを介して不特定のユーザがアクセスできるように構築されるが、所定の登録手続きを済ませた特定のユーザのみがアクセスできるようにしてもよい。あるいは、QAサイト20は、イントラネット等の特定のネットワークのみにおいてアクセスできるようにしてもよい。QAサイト20は、質問者による質問に基づき、その質問に関するスレッドを構築する。スレッドでは、回答者が回答を投稿することができることに加え、別の回答者が回答を加えたり、質問者が質問を追加したりすることができる。QAサイト20の質問者又は回答者等のユーザは、質問に対する回答に対して、「いいね!」、「ベストアンサー」、及び「解決済み」等のラベルにより評価結果を付与することができる。
QAサイト20は、投稿された質問に係る少なくとも1つの第1のテキストと、質問に対する回答に係る少なくとも1つの第2のテキストとを含むスレッドを管理する質問回答用のデータベースとしてのQAデータDB(database)21を有する。図3は、QAデータDB21に記録されたスレッドの一例を示す図である。
図3に例示したスレッドでは、2019/07/28 15:00にユーザ1により投稿された、「携帯電話でwifiがつながらなくなった」という質問(質問1)に関する回答及び質問等が投稿されている。このスレッドでは8つの回答(回答1~8)が投稿されており、これらのうち、回答2には「いいね!」、回答3には「解決済み」というラベルが付与されている。このように、QAデータDB21には、質問に対する回答に対して付与された評価結果も記憶される。また、ユーザ1からは、2019/07/29 14:30に質問2が投稿されている。
QAデータ抽出部31は、このようなスレッドに含まれる、質問に係る少なくとも1つのテキストから、そのスレッドの質問を代表するテキスト(第3のテキスト)を抽出する。さらに、制御部11は、このようなスレッドに含まれる、質問に対する回答に係る少なくとも1つのテキストから、代表的な回答を示すテキスト(第4のテキスト)を抽出する。このようにして、QAデータ抽出部31は、QAサイト20のQAデータDB21に蓄積されたFAQ検索に用いるQ(質問)とA(回答)のペアを抽出する。
具体的には、スレッドの質問を代表するテキストは、スレッドに含まれる質問に係るテキストのうち、最初に投稿されたテキストであることが多い。そこで、QAデータ抽出部31は、例えば、そのスレッドの質問を代表するテキストとして最初に投稿された質問に係るテキストを抽出してもよい。
また、代表的な回答を示すテキストは、回答に係るテキストのうち、「いいね!」、「ベストアンサー」、及び「解決済み」等のラベルにより評価結果が付与されたテキストであることが多い。また、複数の回答が投稿されている場合、最後に投稿された回答はそのスレッド全体の議論を踏まえた質の高い回答が投稿されていることが多い。そこで、QAデータ抽出部31は、例えば、代表的な回答を示すテキストとして、予め定められた評価結果が付与された回答に係るテキスト、又は最後に投稿された回答に係るテキストを抽出してもよい。また、「いいね!」、「ベストアンサー」、及び「解決済み」等の複数のラベルを付与することができる場合、そのラベルは質問者の満足度に応じて選択されることが多い。例えば、ここに挙げたラベルでは、「ベストアンサー」、「解決済み」、「いいね!」の順に満足度が高いと考えられる。そこで、ラベルが付与された回答が複数存在する場合、QAデータ抽出部31は、より質問者の満足度が高いと考えられるラベルが付与された回答に係るテキストを優先的に抽出するようにしてもよい。また、優先度が同じラベルが付与された回答が複数存在する場合、又は、ラベルが付与された回答が存在しない場合、QAデータ抽出部31は、投稿された日時が遅い回答を優先的に抽出してもよい。このような処理により、QAデータ抽出部31は、質問者の回答に対する代表的な回答を示すテキストを適切に抽出することができる。
図4は、図3に例示したスレッドから抽出された、質問(Q)に係るテキスト及び回答(A)に係るテキストのペアの一例を示している。質問1は、図3のスレッドの中で最初に投稿された質問に係るテキストである。回答3は、図3のスレッドの中で最も優先度の高いラベル「解決済み」が付与された回答に係るテキストである。
検索用インデクス作成部32は、QAデータ抽出部31により抽出された、質問に係るテキスト及び回答に係るテキストに基づき、質問及び回答のペアを検索するための検索用インデクスを作成する。そして、検索用インデクス作成部32は、抽出された質問に係るテキスト及び回答に係るテキストと、作成された検索用インデクスとを、検索用インデクスDB33に登録する。
図5は、検索用インデクスDB33に記録された検索用インデクスの一例を示す図である。検索用インデクスは、質問又は回答に係るテキスト毎に、そのテキストに含まれる単語(キーワード)及び重みが規定された情報である。図5において、IDは質問又は回答に係るテキストを識別するための識別情報である。重みは単語の重要度を表す値である。このような重みとしては、例えば、TF(Term Frequency)/IDF(Inverse Document Frequency)値、又は、Okapi BM(Best Matching)等の値を用いることができる。検索用インデクス作成部32の処理の詳細は、図8を参照して後述される。
FAQ検索部34は、検索用の検索クエリが入力され、検索用インデクスDB33を参照して、入力された検索クエリに対して、その検索クエリに対応する質問の回答を出力する。FAQ検索部34は、検索クエリに代えて質問文が入力された場合、その質問文を基に検索用の検索クエリを生成し、その検索クエリに対応する質問の回答を出力する。FAQ検索部34の処理の詳細は、図9を参照して後述される。
図6~図9は、情報処理装置10の動作の一例を示すフローチャートである。図6~図9を参照して説明する情報処理装置10の動作は本実施形態に係る情報処理方法に相当する。図6~図9の各ステップの動作は制御部11の制御に基づき実行される。本実施形態に係る情報処理方法をコンピュータに実行させるためのプログラムは、図6~図9に示す各ステップを含む。
ステップS11において、制御部11は、QAサイト20のQAデータDB21から、FAQ検索に用いるQ及びAのペアを抽出するQAデータ抽出処理を行う。ステップS12において、制御部11は、抽出したQ及びAのペアに基づき検索用インデクスを作成し、検索用インデクスを、Q及びAのペアとともに、検索用インデクスDB33に登録する検索用インデクス作成処理を行う。ステップS13において、制御部11は、検索用インデクスDB33を参照して、入力された検索クエリに対応する質問の回答を検索するFAQ検索処理を行う。なお、ステップS11のQAデータ抽出処理及びステップS12の検索用インデクス作成処理と、ステップS13のFAQ検索処理とは別個の処理であり、それぞれ独立に行うことができる。すなわち、ステップS13のFAQ検索処理は、ステップS11のQAデータ抽出処理及びステップS12の検索用インデクス作成処理の後に行う必要があるわけではない。
図7は、QAデータ抽出処理の一例を示すフローチャートである。ステップS21において、制御部11は、質問に係る少なくとも1つのテキストと、質問に対する回答に係る少なくとも1つのテキストとを含むスレッドを管理するQAデータDB21を参照する。
ステップS22において、制御部11は、スレッドに含まれる質問(Q)のうち、最初に投稿された質問を抽出する。
ステップS23において、制御部11は、スレッドに含まれる質問(A)のうち、予め定められたラベルが付与された回答(A)が存在するか否かを判定する。具体的には、制御部11は、「ベストアンサー」、「解決済み」、又は「いいね!」等のラベルが付与された回答が存在するか否かを判定する。そのようなラベルが付与された回答が存在する場合(ステップS23でYES)はステップS24へ進み、存在しない場合(ステップS23でNO)はステップS25へ進む。
ステップS24において、制御部11は、ラベルが付与された回答(Q)に係るテキストをスレッドから抽出する。付与が可能なラベルが複数種類存在する場合、制御部11は、より質問者の満足度が高いと考えられるラベルが付与された回答(A)を抽出する。また、もっと満足度が高いと考えられるラベルが付与された回答が複数存在する場合は、投稿された日時が遅い回答を優先的に抽出する。このような満足度は予め設定される。そして、制御部11は、QAデータ抽出処理を終了する。
ステップS25において、制御部11は、最後に投稿された回答(A)に係るテキストを抽出する。そして、制御部11は、QAデータ抽出処理を終了する。
図8は、検索用インデクス作成処理の一例を示すフローチャートである。ステップS31において、制御部11は、QAデータ抽出処理により抽出された質問(Q)に係るテキスト及び回答(A)に係るテキストのペアを取得する。
ステップS32において、制御部11は、取得した質問(Q)に係るテキスト及び回答(A)に係るテキストのそれぞれを形態素分解し、単語を抽出する。その際、制御部11は、抽出した単語のステミングを行う。
ステップS33において、制御部11は、抽出した単語の重みを計算する。例えば、制御部11は、TF/IDF値、又は、Okapi BM等の値を計算する。
ステップS34において、制御部11は、ステップS31において取得した質問に係るテキスト及び回答に係るテキストのそれぞれについて、そのテキストの識別情報と、そのテキストに含まれる各単語と、各単語の重みとを関連付けて、検索用インデクスを作成する。
ステップS35において、制御部11は、作成した検索用インデクスを検索用インデクスDB33に記憶させる。そして、制御部11は、検索用インデクス作成処理を終了する。
図9は、FAQ検索処理の一例を示すフローチャートである。ステップS41において、制御部11は、ユーザにより入力された検索クエリを取得する。検索クエリに代えて質問文が入力された場合、制御部11は、その質問文を基に検索用の検索クエリを生成する。
ステップS42において、制御部11は、入力された検索クエリを形態素分解し、単語を抽出する。
ステップS43において、制御部11は、入力された検索クエリの単語と、検索用インデクスDB33に記憶された質問についての検索用インデクスとを比較して、検索用インデクスDB33に記憶された各質問に係るテキストについて、検索スコアを算出する。さらに、制御部11は、入力された検索クエリの単語と、検索用インデクスDB33に記憶された回答についての検索用インデクスとを比較して、検索用インデクスDB33に記憶された各回答に係るテキストについて、検索スコアを算出する。制御部11は、これらの検索スコアに基づき、質問及び回答の各ペアについて、統合された検索スコアを算出する。
ステップS44において、制御部11は、検索結果として、質問及び回答のペアを、検索スコアの高いものから順に出力する。そして、制御部11は、FAQ検索処理を終了する。
以上のように、本実施形態では、制御部11は、QAサイト20に投稿された、質問に係るテキストと、質問に対する回答に係るテキストとを含むスレッドを管理する質問回答用のQAデータDB21を参照し、QAのペアを抽出する。そして、制御部11は、抽出したQAのペアに基づき、FAQ検索に用いる検索用インデクスを作成して、検索用インデクスDB33を更新する。したがって、本実施形態によれば、QAデータDB21のデータを用いて、人手を介さず検索用インデクスDB33を自動的に更新するため、FAQシステムの整備コストを低減することが可能である。
また、QAサイトは、自動的にQAが溜まる仕組みではあるが、QAが溜まりすぎると、逆にユーザが所望のQAを見つけづらくなっていた。また、本当は存在するQAが見つからなかった場合、ユーザは新たに質問を投稿することとなり、結果としてQAが爆発的に増えてしまっていた。本実施形態の構成は、QAサイトとFAQ検索を連携し、QAサイトに投稿された知識をFAQデータとして活用するため、無駄なQAがQAサイトに投稿されることを防ぎ、QAサイトの質を向上させることができる。
<第2の実施形態>
図10は、第2実施形態に係る情報処理装置10の機能構成例を示すブロック図である。本実施形態では、図2のFAQ検索部34に代えてチャットボット40が設けられ、また、質問投稿判断部44が追加されている。図2と同一の機能構成には同一の符号が付され、詳細な説明は省略される。
チャットボット40は、テキスト又は音声を通じて、自動的にユーザと会話する機能構成である。チャットボット40は、検索クエリ生成部41、FAQ検索部42、及び回答テキスト生成部43を備える。
検索クエリ生成部41は、ユーザからの質問文の入力に応じて、質問文に基づき検索クエリを生成する。質問文は自然文として入力される。検索クエリ生成部41は、入力された質問文を自然文のまま検索クエリとして出力してもよいし、キーワードを抽出して、キーワード形式の検索クエリを出力してもよい。
FAQ検索部42は、検索用インデクスDB33を参照して、検索クエリ生成部41が生成した検索クエリに対応する質問の回答を検索する。FAQ検索部42の機能は、図2のFAQ検索部33と同等である。
回答テキスト生成部43は、FAQ検索部42の検索結果から、チャットボット40の出力用に回答テキストを生成して、出力する。回答テキスト生成部43は、FAQ検索部42の検索結果である回答に係るテキストをそのまま出力してもよいし、予め用意された回答テンプレートをもとに回答テキストを生成して出力してもよい。
このように、本実施形態では、チャットボット40をユーザインタフェースとして用いるため、ユーザ体験を向上させることができる。また、従来のチャットボットは、チャットボットで回答するためのシナリオ又はルールを人手で事前に作成しておく必要があり、導入・運用コストが高いという課題があった。これに対し、本実施形態では、チャットボット40における回答に必要なデータであるQAペア及び検索用インデクスをQAサイト20と連携して自動的に作成するため、導入・運用コストを低減することが可能である。
また、質問投稿判断部44は、回答テキスト生成部43が出力した回答テキストについて、質問に対する回答として適切だったか否かのフィードバックを、チャット等のインタフェースを介してユーザから受信する。そして、回答として適切でなかったとのフィードバックを受信した場合、質問投稿判断部44は、ユーザから入力された質問をQAサイト20に投稿する。その投稿に対して、回答者による回答が投稿された場合は、その回答をユーザへ出力する。
このように、本実施形態では、質問投稿判断部44は、質問文を入力したユーザからの回答テキストに対するフィードバックに応じて、QAサイト20に質問文を新たな質問として投稿する。したがって、本実施形態によれば、検索用インデクスDB33に登録されていない質問についても、QAサイト20を利用することで、回答することが可能である。
上述の実施形態は代表的な例として説明したが、本開示の趣旨及び範囲内で、多くの変更及び置換ができることは当業者に明らかである。したがって、本発明は、上述の実施形態によって制限するものと解するべきではなく、請求の範囲から逸脱することなく、種々の変形又は変更が可能である。例えば、実施形態の構成図に記載の複数の構成ブロックを1つに組み合わせたり、あるいは1つの構成ブロックを分割したりすることが可能である。
10 情報処理装置
11 制御部
12 記憶部
13 通信部
14 入力部
15 出力部
16 バス
20 QAサイト
21 QAデータDB
31 QAデータ抽出部
32 検索用インデクス作成部
33 検索用インデクスDB
34 FAQ検索部
40 チャットボット
41 検索クエリ生成部
42 FAQ検索部
43 回答テキスト生成部
44 質問投稿判断部

Claims (7)

  1. 質問及び回答の複数のペアと、前記複数のペアを検索するための検索用インデクスとが記録されたデータベースを参照し、入力された検索クエリに対して、当該検索クエリに対応する質問の回答を出力する情報処理装置の情報処理方法であって、
    前記情報処理装置の制御部が、
    質問者による質問の投稿と、回答者による前記質問に対する回答の投稿とを受け付けるQAサイトに投稿された、前記質問に係る少なくとも1つの第1のテキストと、前記質問に対する回答に係る少なくとも1つの第2のテキストとを含むスレッドを管理する質問回答用のデータベースを参照することと
    前記少なくとも1つの第1のテキストのいずれかである第3のテキストと、前記少なくとも1つの第2のテキストのいずれかである第4のテキストとを抽出することと
    前記第3のテキストと前記第4のテキストとに基づき検索用インデクスを作成することと
    前記第3のテキストと、前記第4のテキストと、前記検索用インデクスとを前記データベースに登録することと
    を含み、
    前記質問回答用のデータベースには、前記質問に対する回答に対して付与された評価結果がさらに記憶され、
    前記制御部は、前記少なくとも1つの第2のテキストのうち、予め定められた評価結果が付与されたテキストを、前記第4のテキストとして抽出する、
    情報処理方法。
  2. 質問及び回答の複数のペアと、前記複数のペアを検索するための検索用インデクスとが記録されたデータベースを参照し、入力された検索クエリに対して、当該検索クエリに対応する質問の回答を出力する情報処理装置の情報処理方法であって、
    前記情報処理装置の制御部が、
    質問者による質問の投稿と、回答者による前記質問に対する回答の投稿とを受け付けるQAサイトに投稿された、前記質問に係る少なくとも1つの第1のテキストと、前記質問に対する回答に係る少なくとも1つの第2のテキストとを含むスレッドを管理する質問回答用のデータベースを参照することと、
    前記少なくとも1つの第1のテキストのいずれかである第3のテキストと、前記少なくとも1つの第2のテキストのいずれかである第4のテキストとを抽出することと、
    前記第3のテキストと前記第4のテキストとに基づき検索用インデクスを作成することと、
    前記第3のテキストと、前記第4のテキストと、前記検索用インデクスとを前記データベースに登録することと、
    を含み、
    前記制御部は、前記少なくとも1つの第2のテキストのうち、最後に投稿されたテキストを、前記第4のテキストとして抽出する、
    情報処理方法。
  3. 前記制御部が、前記少なくとも1つの第1のテキストのうち、最初に投稿されたテキストを、前記第3のテキストとして抽出する、請求項1又は2に記載の情報処理方法。
  4. 前記制御部が、
    ユーザからの質問文の入力に応じて検索クエリを生成し、
    前記データベースを参照して、前記検索クエリに対応する質問の回答を検索し、
    検索した前記回答についての回答テキストを生成し、
    生成した前記回答テキストを出力し、
    前記質問文を入力したユーザからの前記回答テキストに対するフィードバックに応じて、前記QAサイトに前記質問文を新たな質問として投稿する、
    請求項1からのいずれか1項に記載の情報処理方法。
  5. 質問及び回答の複数のペアと、前記複数のペアを検索するための検索用インデクスとが記録されたデータベースを参照し、入力された検索クエリに対して、当該検索クエリに対応する質問の回答を出力する情報処理装置であって、
    質問者による質問の投稿と、回答者による前記質問に対する回答の投稿とを受け付けるQAサイトに投稿された、前記質問に係る少なくとも1つの第1のテキストと、前記質問に対する回答に係る少なくとも1つの第2のテキストとを含むスレッドを管理する質問回答用のデータベースを参照する手順と
    前記少なくとも1つの第1のテキストのいずれかである第3のテキストと、前記少なくとも1つの第2のテキストのいずれかである第4のテキストとを抽出する手順と
    前記第3のテキストと前記第4のテキストとに基づき検索用インデクスを作成する手順と
    前記第3のテキストと、前記第4のテキストと、前記検索用インデクスとを前記データベースに登録する手順と
    を実行する制御部を備え
    前記質問回答用のデータベースには、前記質問に対する回答に対して付与された評価結果がさらに記憶され、
    前記制御部は、前記少なくとも1つの第2のテキストのうち、予め定められた評価結果が付与されたテキストを、前記第4のテキストとして抽出する、
    情報処理装置。
  6. 質問及び回答の複数のペアと、前記複数のペアを検索するための検索用インデクスとが記録されたデータベースを参照し、入力された検索クエリに対して、当該検索クエリに対応する質問の回答を出力する情報処理装置であって、
    質問者による質問の投稿と、回答者による前記質問に対する回答の投稿とを受け付けるQAサイトに投稿された、前記質問に係る少なくとも1つの第1のテキストと、前記質問に対する回答に係る少なくとも1つの第2のテキストとを含むスレッドを管理する質問回答用のデータベースを参照する手順と、
    前記少なくとも1つの第1のテキストのいずれかである第3のテキストと、前記少なくとも1つの第2のテキストのいずれかである第4のテキストとを抽出する手順と、
    前記第3のテキストと前記第4のテキストとに基づき検索用インデクスを作成する手順と、
    前記第3のテキストと、前記第4のテキストと、前記検索用インデクスとを前記データベースに登録する手順と、
    を実行する制御部を備え、
    前記制御部は、前記少なくとも1つの第2のテキストのうち、最後に投稿されたテキストを、前記第4のテキストとして抽出する、
    情報処理装置。
  7. コンピュータを、請求項5又は6に記載の情報処理装置として機能させるためのプログラム。
JP2022543829A 2020-08-17 2020-08-17 情報処理方法、情報処理装置、及びプログラム Active JP7485986B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2020/031035 WO2022038662A1 (ja) 2020-08-17 2020-08-17 情報処理方法、情報処理装置、及びプログラム

Publications (2)

Publication Number Publication Date
JPWO2022038662A1 JPWO2022038662A1 (ja) 2022-02-24
JP7485986B2 true JP7485986B2 (ja) 2024-05-17

Family

ID=80322799

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022543829A Active JP7485986B2 (ja) 2020-08-17 2020-08-17 情報処理方法、情報処理装置、及びプログラム

Country Status (2)

Country Link
JP (1) JP7485986B2 (ja)
WO (1) WO2022038662A1 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007073072A (ja) 1997-09-08 2007-03-22 Fujitsu Ltd 関連文書表示装置
JP2011039835A (ja) 2009-08-12 2011-02-24 Yahoo Japan Corp コンテンツ検索装置
JP2017097534A (ja) 2015-11-20 2017-06-01 株式会社オウケイウェイヴ クライアントシステム及びサーバ

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007073072A (ja) 1997-09-08 2007-03-22 Fujitsu Ltd 関連文書表示装置
JP2011039835A (ja) 2009-08-12 2011-02-24 Yahoo Japan Corp コンテンツ検索装置
JP2017097534A (ja) 2015-11-20 2017-06-01 株式会社オウケイウェイヴ クライアントシステム及びサーバ

Also Published As

Publication number Publication date
WO2022038662A1 (ja) 2022-02-24
JPWO2022038662A1 (ja) 2022-02-24

Similar Documents

Publication Publication Date Title
US10896214B2 (en) Artificial intelligence based-document processing
KR102137809B1 (ko) 자동 답변 제공 방법
US11394799B2 (en) Methods, systems, apparatuses, and devices for facilitating for generation of an interactive story based on non-interactive data
US10102191B2 (en) Propagation of changes in master content to variant content
CN114556328B (zh) 数据处理方法、装置、电子设备和存储介质
JP6759308B2 (ja) 保守装置
KR102271361B1 (ko) 자동 질의응답 장치
TW201314476A (zh) 基於本體之自動自助式使用者支援
US20210374168A1 (en) Semantic cluster formation in deep learning intelligent assistants
US10229187B2 (en) System for determination of automated response follow-up
US20190005122A1 (en) System for determination of automated response follow-up
GB2569858A (en) Constructing content based on multi-sentence compression of source content
KR20200014047A (ko) 시맨틱 트리플 기반의 지식 확장 시스템, 방법 및 컴퓨터 프로그램
CN111078893A (zh) 一种大规模高效获取识别对话意图用语料的方法
CN110209780A (zh) 一种问题模板生成方法、装置、服务器及存储介质
JP7343311B2 (ja) 文書検索装置及び文書検索方法
CN116595138A (zh) 知识问答方法、装置、设备及存储介质
JP7485986B2 (ja) 情報処理方法、情報処理装置、及びプログラム
JP2020161012A (ja) 情報処理装置、制御方法、プログラム
CN115588430A (zh) 基于用户语音的智能查询方法、装置、设备及存储介质
JP7364512B2 (ja) ラベル付与モデル生成装置、及びラベル付与モデル生成方法
JP6626029B2 (ja) 情報処理装置、情報処理方法およびプログラム
JP2020161011A (ja) 情報処理装置、制御方法、プログラム
CN118520096B (zh) 数据处理方法、装置、设备及存储介质
JP7319504B2 (ja) 対話システム、対話方法、プログラム、及び記憶媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221122

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20230629

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240109

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240305

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240402

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240415

R150 Certificate of patent or registration of utility model

Ref document number: 7485986

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150