JP2020521210A - 情報処理方法及び端末、コンピュータ記憶媒体 - Google Patents

情報処理方法及び端末、コンピュータ記憶媒体 Download PDF

Info

Publication number
JP2020521210A
JP2020521210A JP2019561185A JP2019561185A JP2020521210A JP 2020521210 A JP2020521210 A JP 2020521210A JP 2019561185 A JP2019561185 A JP 2019561185A JP 2019561185 A JP2019561185 A JP 2019561185A JP 2020521210 A JP2020521210 A JP 2020521210A
Authority
JP
Japan
Prior art keywords
information
slot
identification
feature
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019561185A
Other languages
English (en)
Other versions
JP6894534B2 (ja
Inventor
俊岑 李
俊岑 李
芬 林
芬 林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Publication of JP2020521210A publication Critical patent/JP2020521210A/ja
Application granted granted Critical
Publication of JP6894534B2 publication Critical patent/JP6894534B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks

Abstract

本発明は情報処理方法及び端末、コンピュータ記憶媒体に関する。前記方法は端末により実行され、前記端末は1つ又は複数のプロセッサ、メモリ及び1つ又は1つ以上のコンピュータプログラムを備え、前記1つ又は複数のプロセッサは前記コンピュータプログラムを実行するように構成され、前記方法は、第1情報を収集すること(101)と、前記第1情報に対し意図識別タスクを実行して、意図識別処理結果を取得し、前記意図識別処理結果に基づいてスロット識別タスクを実行して、スロット識別処理結果を取得すること(102)と、前記スロット識別処理結果に基づいて目標結果を出力すること(103)と、を含む。

Description

本発明はヒューマンコンピュータインタラクションの処理技術に関し、特に情報処理方法及び端末、コンピュータ記憶媒体に関する。
ユーザーは端末とヒューマンコンピュータインタラクションを行うとき、端末がユーザーの提起した問題に対し正確にフィードバックする必要がある。例えば、端末が携帯電話である場合、ユーザーが音声形式で「金曜日に公開される映画は何か?」の問題を提起し、携帯電話は入力された該音声形式の問題を解析して、テキスト形式の問題内容を取得し、次に、ローカルデータベース又はネットワークサーバから該問題に対応する解答をクエリすることができる。
ヒューマンコンピュータインタラクション過程において、端末が携帯電話以外に、スマートスピーカー、スマートテレビ等の電子機器であってもよく、スマートスピーカーを例とすれば、ユーザーが「ジェイ・チョウ(漢字:周傑倫)の歌Aを聞きたい」の問題を提起し、該問題に特定のキーワード「ジェイ・チョウ」「歌A」が含まれる場合、どのように該問題に対応する解答を検索するか。従来技術を用いれば、ローカルデータベース又はネットワークサーバから大量の情報をクエリした後にのみ解答を提供できる。その欠陥は、広範囲でクエリする必要があるため、かなりの時間を費やすことになり、クエリされた解答が必ずユーザーの要件を最も満たす可能性の最も高いフィードバック情報ではない場合もあるので、精度が高くなく、ヒューマンコンピュータインタラクションの全体効果に悪影響を与えてしまう。
ところが、関連技術では上記欠陥に対する有効な解決案がない。
これに鑑みて、本発明の実施例は、少なくとも従来技術の問題を解決するように、情報処理方法及び端末、コンピュータ記憶媒体を提供する。
本発明の実施例に係る情報処理方法であって、前記方法は端末により実行され、前記端末は1つ又は複数のプロセッサ、メモリ及び1つ又は1つ以上のコンピュータプログラムを備え、前記1つ又は複数のプロセッサは前記コンピュータプログラムを実行するように構成され、前記方法は、
第1情報を収集することと、
前記第1情報に対し意図識別タスクを実行して、意図識別処理結果を取得することと、
前記意図識別処理結果に基づいてスロット識別タスクを実行して、スロット識別処理結果を取得することと、
前記スロット識別処理結果に基づいて目標結果を出力することと、を含む。
本発明の実施例に係る情報処理方法であって、前記方法は端末により実行され、前記端末は1つ又は複数のプロセッサ、メモリ及び1つ又は1つ以上のコンピュータプログラムを備え、前記1つ又は複数のプロセッサは前記コンピュータプログラムを実行するように構成され、前記方法は、
第1情報を収集することと、
前記第1情報に対し意図識別タスクを実行して、意図識別処理結果を取得することと、
前記第1情報に対し意図識別タスクを実行して、スロット識別処理結果を取得することと、
前記意図識別処理結果から意図識別パラメータを解析することと、
前記スロット識別処理結果からスロット識別パラメータを解析することと、
前記意図識別パラメータ及び前記スロット識別パラメータに基づいてモデリングして、意図識別及びスロット識別の特徴結合性を特徴づける第1複合モデルを取得することと、
前記第1情報から第1特徴を抽出することと、
前記第1情報から第2特徴を抽出することと、
前記第1特徴及び前記第2特徴に基づき、前記第1複合モデルを訓練し、前記第1複合モデルが指定された目標に達する場合に訓練を停止し、意図識別を特徴づける第1目標パラメータ及びスロット識別を特徴づける第2目標パラメータを取得することと、
前記第1目標パラメータ及び前記第2目標パラメータに基づいて第2複合モデルを構築することと、を含む。
本発明の実施例に係る端末であって、
第1情報を収集するように構成される収集ユニットと、
前記第1情報に対し意図識別タスクを実行して、意図識別処理結果を取得するように構成される第1タスク実行ユニットと、
前記意図識別処理結果に基づいてスロット識別タスクを実行して、スロット識別処理結果を取得するように構成される第2タスク実行ユニットと、
前記スロット識別処理結果に基づいて目標結果を出力するように構成される出力ユニットと、を備える。
本発明の実施例に係る端末であって、
第1情報を収集するように構成される収集ユニットと、
前記第1情報に対し意図識別タスクを実行して、意図識別処理結果を取得するように構成される第1タスク実行ユニットと、
前記第1情報に対し意図識別タスクを実行して、スロット識別処理結果を取得するように構成される第2タスク実行ユニットと、
前記意図識別処理結果から意図識別パラメータを解析するように構成される第1解析ユニットと、
前記スロット識別処理結果からスロット識別パラメータを解析するように構成される第2解析ユニットと、
前記意図識別パラメータ及び前記スロット識別パラメータに基づいてモデリングして、意図識別及びスロット識別の特徴結合性を特徴づける第1複合モデルを取得するように構成される第1モデル確立ユニットと、
前記第1情報から第1特徴を抽出するように構成される第1抽出ユニットと、
前記第1情報から第2特徴を抽出するように構成される第2抽出ユニットと、
前記第1特徴及び前記第2特徴に基づき、前記第1複合モデルを訓練し、前記第1複合モデルが指定された目標に達する場合に訓練を停止し、意図識別を特徴づける第1目標パラメータ及びスロット識別を特徴づける第2目標パラメータを取得するように構成される第3抽出ユニットと、
前記第1目標パラメータ及び前記第2目標パラメータに基づいて第2複合モデルを構築するように構成される第2モデル確立ユニットと、を備える。
本発明の実施例に係る端末であって、
プロセッサにおいて実行できるコンピュータプログラムを記憶するように構成されるメモリと、
前記コンピュータプログラムを実行するとき、上記実施例に記載の方法のステップを実行するように構成されるプロセッサと、を備える。
本発明の実施例に係るコンピュータ可読記憶媒体であって、コンピュータプログラムが記憶され、該コンピュータプログラムがプロセッサにより実行されるとき、上記実施例に記載の方法のステップを実現する。
本発明の実施例によれば、第1情報を収集し、第1情報に対し意図識別タスクを実行して、意図識別処理結果を取得し、再意図識別処理結果に基づいてスロット識別タスクを実行して、スロット識別処理結果を取得し、このようなシリアル処理メカニズムによって、意図識別タスク及びスロット識別タスクの2つのタスク処理結果における特徴属性の結合性を利用して、最終的にスロット識別処理結果に基づいて目標結果を出力することができる。シリアル処理メカニズムを利用して結合性の効果を実現するため、クエリ範囲を縮小し、かなりの時間の浪費を回避することができ、ユーザーにとって処理過程が透明であり、ユーザーが問題を入力すれば、所要の解答を迅速に取得することができ、且つ解答は精度が高くて、ユーザーの要件を最も満たす可能性の最も高いフィードバック情報であるため、ヒューマンコンピュータインタラクションの全体効果を向上させる。
図1は本発明の実施例におけるデータ交換を行う各ハードウェアエンティティの模式図である。 図2は本発明の実施例の方法を情報交換シーンに応用する模式図である。 図3は本発明の実施例の方法の実現プロセスの模式図である。 図4は本発明の実施例におけるQueryに対してデータ収集及びラベリングを行うフローチャートである。 図5は本発明の実施例におけるラベルでラベリングする模式図である。 図6は本発明の実施例におけるQueryに対して補助特徴抽出を行うフローチャートである。 図7は本発明の実施例における深層特徴を抽出するとともに補助特徴をベクトルにマッピングしてモデルに組み込むモデルフレームの模式図である。 図8は本発明の実施例を応用した情報処理システムの模式図である。 図9は本発明の実施例における端末のハードウェア構成の模式図である。
以下、図面を参照しながら技術案の実施を更に詳しく説明する。
以下の詳細な説明では、本発明を徹底的に理解するために、多くの具体的な詳細を説明する。ただし、当業者であれば、無論、これらの具体的な詳細がない場合に本発明を実施することができる。
また、本明細書では用語「第1」「第2」等を複数回用いて様々な素子(又は様々な閾値又は様々な応用又は様々な命令又は様々な操作)等を説明したが、これらの素子(又は閾値又は応用又は命令又は操作)はこれらの用語に制限されていない。これらの用語は一方の素子(又は閾値又は応用又は命令又は操作)及び他方の素子(又は閾値又は応用又は命令又は操作)を区別するためのものである。
本発明の実施例のステップは必ず説明されたステップの順序で処理するわけではなく、必要に応じてステップを選択的に再配列し、又は実施例のステップを削除し、又は実施例のステップを追加してもよく、本発明の実施例のステップについての説明は好適な順序の組み合わせであって、本発明の実施例のすべてのステップの順序の組み合わせではなく、実施例のステップの順序は本発明を制限するためのものであると見なされるべきではない。
本発明の実施例の用語「及び/又は」とは関連する列挙した項目のうちの1つ又は複数の任意及び全部の可能な組み合わせを含むことを意味する。ただし、本明細書に使用されるとき、「包括/包含」は説明された特徴、整数、ステップ、操作、素子及び/又はコンポーネントが存在することを指定したが、1つ又は複数の他の特徴、整数、ステップ、操作、素子及び/又はコンポーネント及び/又はそれらのグループが存在し又は追加されることを排除しない。
本発明の実施例のスマート端末は様々な形式で実施されてもよい。例えば、本発明の実施例に説明されたモバイル端末はスマートスピーカー、スマートテレビ、携帯電話、スマートフォン、ノートパソコン、デジタル放送受信機、パーソナルデジタルアシスタント(PDA:Personal Digital Assistant)、タブレットPC(PAD)、ポータブルメディアプレーヤー(PMP:Portable Media Player)、ナビゲーションデバイス等のモバイル端末を含んでもよい。
図1は本発明の実施例におけるデータ交換を行う各ハードウェアエンティティの模式図であり、図1では、ネットワーク側のサーバ11−1n、端末21−25を備える。端末21−25が無線又は有線方式でネットワーク側のサーバ11−1nと情報交換を行う。図1におけるサーバの個数及び端末の個数は模式的なものに過ぎず、サーバ及び端末の具体的な個数を制限するためのものではない。
図2は本発明の実施例の情報処理方法を情報交換シーンに応用する模式図であり、端末31−34及びサーバ41を備え、該模式図では、具体的な処理ロジックが端末側で実行されてもよく、サーバ側が情報源として使用され、端末はネットワーク側のサーバ側から具体的な処理ロジックを実行するための情報を取得するだけでなく、更にローカルから具体的な処理ロジックを実行するための情報を取得することができる。スマート端末がスマートスピーカーである場合、端末の処理ロジック10は、以下のS1乃至S5を含む。S1において、第1情報を収集する(ローカル及びサーバ側から収集された情報を含み、ここで、情報がリアルタイムに取得されたフィードバックすべき情報ではなく、複合モデルを確立するための分析情報であり、例えば、複合モデルを確立するために、既存の情報A−Cを収集して分析することに用いられ、以降に複合モデルを訓練した後、リアルタイムに取得された情報Fに対しフィードバックする)。S2において、第1情報に対し意図識別タスクを実行して、意図識別処理結果を取得し、意図識別処理結果に基づいてスロット識別タスクを実行して、スロット識別処理結果を取得し、シリアルメカニズム(まず、意図識別タスクを実行して、意図識別処理結果を取得し、次に、意図識別処理結果に基づいてスロット識別タスクを実行して、スロット識別処理結果を取得する)によって、2つのタスクにおける特徴属性結合性を利用する効果を実現することができる。S3において、第1情報から複合モデルが深層学習を行うための第1特徴(例えば、手動で構築した補助特徴)及び第2特徴(例えば、ニューラルネットワークに基づいて取得した深層特徴)を抽出する。S4において、第2特徴に基づき、第1特徴と組み合わせて、複合モデルを訓練し、複合モデルが指定された目標に達する場合に訓練を停止し、定量と見なされる意図識別パラメータ及び定量と見なされるスロット識別パラメータを抽出し、ただし、意図識別パラメータ及びスロット識別パラメータが複合モデルの訓練中に変化し続ける変数であり、指定された目標に達するまで、定量と見なされてもよく、ここで、定量とは、指定された目標に達する意図識別パラメータ及びスロット識別パラメータからなる新しい複合モデルを第2情報に対するフィードバック応答に用いることができることを意味する。S5において、該指定された目標に達する意図識別パラメータ及びスロット識別パラメータからなる新しい複合モデルに基づいて第2情報に対してフィードバック応答を行って、フィードバック情報を取得する。ここで、第2情報は上記第1情報と異なり、第2情報はユーザーがリアルタイムに提起した問題に対するものである。第1情報は多くの問題のデータを含み、モデリングに使用されるものである。
上記図2の例は本発明の実施例を実現する1つのシステムアーキテクチャの実例に過ぎず、本発明の実施例は上記図2に記載のシステム構造に限らず、上記図2に記載のシステムアーキテクチャに基づき、本発明方法の各実施例を提供する。
本発明の実施例の情報処理方法は端末により実行されてもよく、前記端末は1つ又は複数のプロセッサ、メモリ及び1つ又は1つ以上のコンピュータプログラムを備え、前記1つ又は複数のプロセッサは前記コンピュータプログラムを実行するように構成され、図3に示すように、前記方法は以下を含む。(101)において、第1情報を収集し、例えば、ユーザーがヒューマンコンピュータインタラクション時に多くの問題を提起し、該問題がサーバの提供したデータソースから取得できる。ユーザーとヒューマンコンピュータインタラクションを行う端末は様々なカスタマーサービス類、コンサルティング類の対話ロボット、スマートスピーカー、スマートテレビ等の人工知能(AI:Artificial Intelligence)端末であってもよい。AIについては、コンピュータ科学の1つの分岐であり、知能の実質に応じて、新しい人類知能に類似する方式で反応できる知能機械を生産する。AIロボット、言語識別、画像識別、自然言語処理及び専門家システム等に関し、その応用分野も広がっており、本明細書に言及したスマート端末(例えば、スマートスピーカー)に限らない。(102)において、第1情報に対し意図識別タスクを実行して、意図識別処理結果を取得し、意図識別処理結果に基づいてスロット識別タスクを実行して、スロット識別処理結果を取得する。意図識別タスクが分類タスクと称されてもよく、スロット識別タスクがシーケンスラベリングタスクと称されてもよい。意図識別タスク及びスロット識別の具体的な実行過程は2つのタスクを1つの実行モジュールで処理することである。まず、第1情報に対し意図識別タスクを実行して、意図識別処理結果を取得した後、意図識別処理結果に基づいてスロット識別タスクを実行して、2つのタスク処理結果における特徴属性結合性を利用する効果を実現することができ、従って、このようなシリアルメカニズム、つまり、まず、第1情報に対し意図識別タスクを実行して、意図識別処理結果を取得した後、意図識別処理結果に基づいてスロット識別タスクを実行することにより、正確なスロット識別処理結果を取得することができる。そうすると、以降に該スロット識別処理結果に基づいて正確な目標結果を取得して該目標結果を出力することができる。(103)において、スロット識別処理結果に基づいて目標結果を出力する。
一実施例では、意図識別パラメータ及びスロット識別パラメータに基づいて複合モデルを構築することができる。意図識別パラメータ及びスロット識別パラメータは複合モデルの訓練中に変化し続ける変数である。初期状態において、意図識別パラメータ及びスロット識別パラメータに基づいて構築された複合モデルが第1複合モデルと称されてもよい。指定された目標に達するまで、複合モデルを訓練し、この時、意図識別パラメータ及びスロット識別パラメータが定量であると見なされてもよい。ここで、定量とは、指定された目標に達する意図識別パラメータ及びスロット識別パラメータからなる新しい複合モデルに基づくことができることを意味し、新しい複合モデルが第1複合モデルと異なり、第2複合モデルと称されてもよい。
意図識別及びスロット識別の2つのタスクを結合し、意図識別パラメータ及びスロット識別パラメータに基づいて複合モデルを構築するとき、シリアルメカニズムを利用してそれらの結合性効果を得るために確立した関連する複合モデルを取得するために、同じモジュールにおいて機械学習の複合学習を行う。該複合モデルの効果(モデルの精度)はそれぞれ2つの独立したモジュール(例えば、異なるモジュールにおいてそれぞれ意図識別及びスロット識別タスクを実行する)を用いる効果より高い。
本発明の実施例の情報処理方法は更に以下を含む。(104)において、前記第1情報から前記複合モデルが深層学習を行うための第1特徴を抽出する。第1特徴は補助特徴を指し、補助特徴は手動で構築したいくつかの特徴を指す。(105)において、前記第1情報から前記複合モデルが深層学習を行うための第2特徴を抽出する。第2特徴は深層特徴を指し、深層特徴はシーケンスラベリングモデルに基づいて取得した特徴である。音楽タイプのキーワードを検索するスマートスピーカーを例とすれば、該シーケンスラベリングモデルはリカレントニューラルネットワーク(RNN)であってもよく、他の技術分野であれば、非音楽タイプの検索が非RNNの他のモデルであってもよく、該技術分野における最適なキーワードマッチングを実現できればよく、つまり、本実施例はRNNに限らず、機械学習におけるニューラルネットワークモデル、シーケンスをラベリングするためのモデルはいずれも本発明の実施例に適用される。
本発明の実施例の情報処理方法は更に以下を含む。(106)において、第2特徴及び第1特徴に基づき、複合モデルを訓練する。例えば、RNNモデルを利用し、補助特徴と組み合わせて、複合モデルの訓練を行う。(107)において、複合モデルが指定された目標に達する(該指定された目標の目標関数がユーザーの要件を最も満たす可能性の最も高いものである)場合、訓練を停止し、第1目標パラメータ及び第2目標パラメータ、例えば、複合学習によって取得された第1パラメータに対応する目標パラメータ及び第2パラメータに対応する目標パラメータを抽出する。実際に応用するとき、複合モデルにおける第1パラメータ(例えば、意図識別パラメータ)及び第2パラメータ(例えば、スロット識別パラメータ)は最初には変数であり、前記複合モデルに対する機械学習訓練によって、複合モデルに対応する目標関数の値を可能性の最も高いものにする場合、該訓練を停止し、この時の第1パラメータ(例えば、意図識別パラメータ)及び第2パラメータ(例えば、スロット識別パラメータ)が定量であると見なされ、該定量に基づき、ユーザーの提起した問題に対し取得すると期待するユーザーの要件を最も満たす可能性の最も高いフィードバック情報(問題の解答)を取得することができる。第1パラメータ(例えば、意図識別パラメータ)及び第2パラメータ(例えば、スロット識別パラメータ)に達する目標関数はユーザーの要件を最も満たす可能性の最も高いものである場合、訓練を停止し、第1目標パラメータ(複合学習によって取得された第1パラメータに対応する目標パラメータ)及び第2目標パラメータ(複合学習によって取得された第2パラメータに対応する目標パラメータ)を抽出する。(108)において、第2情報を取得する。一例では、第2情報を取得する前の処理はいずれも多くの問題を含むデータである第1情報、例えば、上記RNNモデルによって補助特徴と組み合わせて複合モデルの訓練を行って取得した目標パラメータに基づくものであり、目標パラメータは意図識別に対する目標パラメータ及びスロット識別に対する目標パラメータに分けられる。ここで、第2情報は上記第2情報と異なり、ユーザーがリアルタイムに提起した問題に対するものである。既に取得された該目標パラメータを利用して、該第2情報に対し正確なフィードバック情報を検索することができる。(109)において、第1目標パラメータ及び第2目標パラメータに基づいて第2情報に対してフィードバック応答を行って、フィードバック情報を取得する。
一実施例では、第1情報及び第2情報はユーザーの入力した問題(query)であってもよい。ただし、第2情報がリアルタイムに入力したものである。スロット(slot)については、queryにおけるいくつかの特定属性のある実体語、例えば、queryが「ジェイ・チョウ(漢字:周傑倫)の歌を聞きたい」である場合、スロットが「歌手=周傑倫」である。複合モデルは意図識別及びスロット識別に対して複合学習を行い、ユーザーがqueryを入力する場合、端末により実行される運算ロジックによって、該queryの所期の意図及びスロット情報を取得することであり、運算ロジックが1つのブラックボックスに類似し、ユーザーがqueryを入力すればよい。理解されやすい例としては、queryの意図が必ずスロットのある意図であり、例えば、queryが「ジェイ・チョウ(漢字:周傑倫)の歌を聞きたい」である場合、意図識別及びスロット識別の2つのタスクを同じモジュールで実現し、それらの高結合性を利用して機械訓練を行う。1)として、該query「ジェイ・チョウ(漢字:周傑倫)の歌を聞きたい」に対してスロット識別を行うことにより、スロット「歌手=周傑倫」を解析することができ、そうするとこのqueryの意図が音楽類である確率が高く、2)として、該query「ジェイ・チョウ(漢字:周傑倫)の歌を聞きたい」に対して意図識別を行うことにより、それが音楽類意図であると判断でき、そうするとスロット識別時に音楽類固有のスロットから解析すればよい。その利点は、スロットの候補範囲を効果的に縮小し、精度及び効率を向上させることができることである。
意図及びスロットについては、AIにおける自然言語についての理解が自然言語質問からの話者の意図の識別及び語彙構成の抽出に関し、この2項のタスクは常に意図識別及びスロット充填と称される。意図識別(意図推測とも称される)は語彙表現分類の問題であると理解されてもよく、分類方法は例えばサポートベクターマシン(SVMs:support vector machine)及びディープニューラルネットワークである。スロット充填はシーケンスラベリングタスクであると理解されてもよい。シーケンスで問題をラベリングする方法は最大エントロピマルコフモデル(MEMMs:maximum entropy Markov model)、条件付確率場(CRFs:conditional random field)及びリカレントニューラルネットワーク(RNNs:recurrent neural network)等を含む。
一例では、端末に対する運算ロジックは、基本的に、情報を収集することと、ラベリング(意図ラベリング及びスロットラベリングに分けられる)することと、補助特徴を抽出する(手動で辞書を構築する)ことと、自動的に特徴を抽出する(好ましくは、RNNモデルアルゴリズム)ことと、RNNモデルを利用し、補助特徴と組み合わせて、複合モデルの訓練を行って、複合モデルの目標関数を取得することと、を含む。目標関数は計算可能なものであり、目標関数には指向性のないパラメータ(意図識別を特徴づけるパラメータ、スロット識別を特徴づけるパラメータ)が含まれ、パラメータに対する訓練及びテストによって、可能性の最も高いものに達する場合、この時のパラメータが定量である(定数と称される)と見なされてもよい。そうすると、入力されたquery(例えば、Xと記される)を運算ロジックにおける変数とし、定数1(意図識別を特徴づけるパラメータが例えばパラメータAと記される)及び/又は定数2(スロット識別を特徴づけるパラメータが例えばパラメータBと記される)と組み合わせて、該queryの所期の意図及びスロット情報(例えば、Y)を取得することができ、従って、ユーザーの入力したqueryに基づき、上記処理ロジックに基づき、ユーザーが中間の処理過程を考慮せずに、構築された複合モデル及びその訓練結果に基づいて最終的な出力結果「該queryの所期の意図及びスロット情報」を取得する。従って、構築された情報モデルによってクエリ範囲を縮小し、かなりの時間の浪費を回避することができ、構築された情報モデルがユーザーにとって透明であり、ユーザーが問題を入力すれば、所要の解答を迅速に取得することができ、且つ解答は精度が高くて、ユーザーの要件を最も満たす可能性の最も高いフィードバック情報であり、従って、ヒューマンコンピュータインタラクションの全体効果を向上させる。
一実施例では、第1情報を収集することは、ローカルから、実ヒューマンコンピュータインタラクション環境において取得された対話内容からの前記第1情報を収集すること1)と、ネットワーク側から前記第1情報を収集し、前記第1情報に対して選別処理を行って、実ヒューマンコンピュータインタラクション環境において取得された対話内容に近いものを特徴づけるための目標情報を取得すること2)と、を含む。この2つの方式はその1つを用いてもよいし、すべて用いてもよい。第1情報を収集した後、第1情報及び/又は目標情報からなる第1情報源を作成する。どのように複合モデルを作成するか及びそれを訓練するかは、いずれもこの第1情報源における多くの情報に頼る必要がある。
何のために複合モデルを作成するか。これに対して、以下にスマートスピーカーシステムを例として説明する。
スマートスピーカーシステムがqueryの意図及びスロットを正確に識別できることはquery分析のキーポイントであって、システム全体のキーモジュールでもある。意図及びスロット識別が独立したモジュールであると見なされ、つまり、意図及びスロット識別タスクをそれぞれ2つの異なるモジュールで独立して処理し、意図及びスロット識別における存在する可能性のある結合性を無視する。しかしながら、実際に応用するとき、意図及びスロット識別が高い結合性を有する。意図及びスロット識別の2つのタスクが多くの特徴を共有し、同時に、1つのタスクの結果が他のタスクにとっても1つの強い補助特徴である。スロット識別によってqueryがスロットを有する場合、該queryの意図が必ずスロットのある意図である。例えば「フェイ・ウォン(漢字:王菲)の歌Aを聞きたい」に対してスロット識別を行うことにより、スロット「歌手=王菲」及び「歌曲=A」を解析することができ、そうするとこのqueryの意図が音楽類である確率が高い。同時に、「フェイ・ウォン(漢字:王菲)の歌Aを聞きたい」に対して意図識別を行うことにより、それが音楽類意図であると判断でき、そうするとスロット識別時に音楽類固有のスロットから解析すればよく、スロットの候補範囲を効果的に縮小することができる。従って、意図識別及びスロット識別の高結合性に鑑みて、本実施例では、2つの異なるモジュールに独立せずに、この2つのタスクを同じモジュールに追加してもよい。作成された複合モデルによって意図及びスロット識別の複合学習を実現し、意図及びスロット識別の高結合性を十分に利用するため、スマートスピーカーシステムの意図及びスロット識別精度を向上させ、それによりスピーカーのヒューマンコンピュータインタラクションの全体効果を向上させる。
情報収集の一例では、端末がスマートスピーカーである場合を例とすれば、収集された第1情報が具体的にqueryである。queryができる限りスマートスピーカー製品に出現する可能性のあるqueryに一致すべきである。該queryの情報源は主に2つある。1)として、第1種類のデータがスピーカーログにおけるqueryである。この部分のqueryはいずれも実シーンにおけるユーザーとのスピーカーとの対話queryであり、従って、この部分のqueryはスピーカーの実シーンを最も反映できるqueryである。この部分のqueryはユーザーの要件を最も満たすものであるが、ユーザー量がより少ない場合、ユーザーが実ヒューマンコンピュータインタラクション環境から取得した対話内容もより少なく、この部分のqueryがデータ量の面で意図及びスロット識別モデルの訓練ニーズを満たすことができない。2)ローカルスピーカーログにおけるqueryと異なり、第2種類のデータはネットワーク側から収集されたものであり、ネットワークサーバは第2種類のデータのデータ提供方、例えば、いくつかの公式アカウントのログを利用するqueryとされる。公式アカウントは多くあり、且つ多くの公式アカウントの運営時間もより長く、データ量が大きく、データ量の面で意図及びスロット識別モデルの訓練ニーズを満たすことができる。従って、公式アカウントから多くのqueryを抽出して第1種類のデータに追加することができる。公式アカウントqueryの範囲がより広いため、スマートスピーカーの技術分野では、すべての公式アカウントqueryがスピーカーのqueryとされることに適合するわけではなく、つまり、データ量の面で確保できたが、精度(ユーザーの要件を満たすかどうか)の面で確保できないため、更に公式アカウントのqueryをフィルタリングする必要がある。
公式アカウントのqueryをフィルタリングする一例では、まず、センテンス長(センテンスに含まれる文字の個数)、センテンスに漢字等の情報が含まれるかどうかによってqueryを予めフィルタリングし、センテンス長が3より小さく又はセンテンス長が30より大きなqueryを除去し、且つ漢字のないセンテンスを除去する。次に、既存の分類器を利用してこれらのqueryに対して意図分類を行う。最後に、スピーカー機能カテゴリに合致するquery、例えば音楽類、天気類及び通知類等を選別する。
一実施例では、第1種類のデータ及び第2種類のデータをフィルタリングして取得したデータを取得した後、この2つの部分のデータにおけるqueryを混合すると、以後の実施例における複合モデルを訓練するために用いたqueryデータセット、すなわち上記実施例に言及した「第1情報源」を構成する。
上記シリアル処理メカニズムのタスク実行ポリシーに基づいて前記第1情報に対し意図識別タスク及びスロットタスクを実行し、つまり、タスクのシリアル処理ポリシーに基づき、前記第1情報に対し前記意図識別タスクを実行してから前記スロット識別タスクを実行する以外に、更にタスクのパラレル処理ポリシーに基づき、つまり、前記第1情報に対し前記意図識別を実行するとき、パラレル方式で前記第1情報に対し前記スロット識別タスクを実行してもよい。
本発明の実施例の情報処理方法において、パラレル処理メカニズムで処理する応用シーンにおいて、該情報処理方法は端末により実行され、前記端末は1つ又は複数のプロセッサ、メモリ及び1つ又は1つ以上のコンピュータプログラムを備え、前記1つ又は複数のプロセッサは前記コンピュータプログラムを実行するように構成され、前記方法は、第1情報を収集することと、前記第1情報に対し意図識別タスクを実行して、意図識別処理結果を取得することと、前記第1情報に対し意図識別タスクを実行して、スロット識別処理結果を取得することと、前記意図識別処理結果から意図識別パラメータを解析することと、前記スロット識別処理結果からスロット識別パラメータを解析することと、前記意図識別パラメータ及び前記スロット識別パラメータに基づいてモデリングして、意図識別及びスロット識別の特徴結合性を特徴づける第1複合モデルを取得することと、前記第1情報から第1特徴を抽出することと、前記第1情報から第2特徴を抽出することと、前記第1特徴及び前記第2特徴に基づき、前記第1複合モデルを訓練し、前記第1複合モデルが指定された目標に達する場合に訓練を停止し、意図識別を特徴づける第1目標パラメータ及びスロット識別を特徴づける第2目標パラメータを取得することと、前記第1目標パラメータ及び前記第2目標パラメータに基づいて第2複合モデルを構築することと、を含む。
一実施例では、意図識別タスクを実行するとき、第1情報源から処理対象オブジェクト(例えば、query)を抽出し、処理対象オブジェクトに対し意図を識別するための第1データラベリングを実行することができる。第1データラベリング結果に対してサンプリング検出を行い、検出結果の精度が第1閾値より大きい場合、前記第1ラベリング結果が目標要件を満たすと決定する。具体的に、2つの部分のqueryを混合すると、queryデータセットを構成する。queryデータセットを抽出すると、データラベリング動作を開始する。データラベリング動作は2つのステップに分けて行われ、まず、派遣契約労働者によりqueryの意図をラベリングし、又は端末によりローカルでラベリングする。ラベリングデータを数ロットに分けて送信し、各ロットのデータを返した後にサンプリング検出を行い、その中から200条をランダムに抽出し、ラベリング結果を検出する。この200条のラベリングデータのラベリング精度が95%より小さい場合、このデータが要件を満たすと見なされ、次ロットのデータを提供し、逆に、このデータが要件を満たさず、データの精度が95%を超えるまで、派遣契約労働者によりこのデータを改めてラベリングする。
一実施例では、スロット識別タスクを実行するとき、前記第1情報源から処理対象オブジェクト(例えば、query)を抽出し、処理対象オブジェクトに対し意図を識別するための第1データラベリングを実行することができる。該ラベリングは、サンプリング検出せずに取得されたラベリング結果、及び/又はサンプリング検出によって取得された目標要件を満たすラベリング結果を含む。第1データラベリングに基づいて前記処理対象オブジェクトを分類した後、異なる意図を特徴づける少なくとも1つの分類結果を取得する。少なくとも1つの分類結果に基づいて対応するスロットを識別するための第2データラベリングを実行し、例えば、query意図分類結果に基づき、異なる意図のqueryに対し異なるスロット標準でラベリングする。第2データラベリング結果に対してサンプリング検出を行い、検出結果の精度が第2閾値より大きい場合、前記第2ラベリング結果が目標要件を満たすと決定する。
スロットラベリングの一例では、queryの意図ラベリングを完了した後、queryのスロットラベリングを行う。異なる意図におけるqueryスロットも異なり、例えば、音楽意図のqueryが「歌手名」「歌曲名」等のスロットを有するが、「時間」「地点」等のスロットを有せず、通知意図のqueryが「時間」「地点」等のスロットを有するが、「歌手名」「歌曲名」等のスロットを有しない。従って、スロットに対するラベリングはquery意図分類結果に基づき、異なる意図のqueryに対し異なるスロット標準でラベリングする。スロットラベリングは依然としてロット分け方式で、派遣契約労働者によりqueryのスロットをラベリングし、又は端末によりローカルでラベリングし、各ロットのqueryに対し、同様にサンプリング検出方式でラベリング品質を検出し、合格率が90%であってもよく、要件を満たさないラベリングデータを改めてラベリングする必要がある。
一実施例では、Queryに対してデータ収集及びラベリングを行うフローチャートは図4に示され、
音響logからqueryを抽出するステップ301と、
公式アカウントlogからqueryを抽出するステップ302と、
Queryをフィルタリングするステップ303と、
データを合併するステップ304と、
意図をラベリングするステップ305と、
スロットをラベリングするステップ306と、を含み、
ステップ302、ステップ303及びステップ301の順序が変化してもよい。
本実施例を用いることは、それらの特徴属性結合性に基づいて取得した複合モデルを取得するために、意図及びスロット識別を同じモジュールで処理し、それらに対して複合学習及び訓練を行うことである。この複合学習及び訓練過程において、該解決手段はqueryを分析し、特にqueryの意図識別及びスロット識別に顕著な促進作用を果たすことができ、意図及びスロット識別精度を向上させる。該解決手段は操作しやすく、1つのブラックボックスとして見なされてもよく、1つのqueryを入力すれば、該方法でこのqueryの意図及びスロット情報を提供することができる。
一実施例では、意図識別過程は1つの分類タスクとして見なされてもよく、スロット識別タスクは1つのシーケンスラベリングタスクとして見なされてもよい。深層学習技術でこの2つのタスクを結合し、複合学習を行う。意図及びスロットモジュールのタスクが異なるため、目標関数も異なり、このため、この2つのモジュールが直接接合できず、本実施例では、2つのモジュールを効果的に結合することができ、複合モデルの効果(モデルの精度)が2つの独立したモジュールの効果より高い。意図及びスロット識別を独立したモジュールとしてそれぞれ処理すれば、意図識別がquery分類問題として見なされてもよい。現在、スロット解析技術はシーケンスでラベリングする方式を用いる場合が多い。該方式はセンテンスにおける各単語に1つのラベルを付け、ラベルで該単語がslotにあるかどうかを示し、次に単語のラベルによってqueryにおけるslotを検索することができ、ラベル方式の模式図は図5(ここで、queryは、「ジェイ・チョウのヌンチャクの歌を聞きたい(漢字:我想聴周傑倫的双截棍)」である)に示され、以上によれば、意図及びスロット識別を独立したモジュールとしてそれぞれ処理することに比べて、本実施例は意図識別及びスロット識別の結合性を十分に利用し、最終的に意図識別及びスロット識別の精度が大幅に向上するという目的を実現する。
一実施例では、第1情報から複合モデルが深層学習を行うための第1特徴を抽出することは、前記第1情報源から処理対象オブジェクト(例えば、query)を抽出し、前記処理対象オブジェクトにスロット特徴語データベース(例えば、スロット特徴語テーブル)を構築することと、処理対象オブジェクトにおける指定されたオブジェクト(例えば、特定のquery、歌手名、歌曲名等)に対し辞書マッチング方式でスロット特徴語データベースと照合して、指定されたオブジェクトに含まれる、前記第1特徴を特徴づけるためのすべての可能なスロット情報を検索することと、を含む。更に、第1情報から前記複合モデルが深層学習を行うための第2特徴を抽出することは、検索されたスロット情報をスロットベクトルの形式で示すことと、スロットベクトルを変種のリカレントニューラルネットワーク(LSTM)にマッピングし、LSTMと融合した後、前記処理対象オブジェクトに対して深層特徴抽出を行って、第2特徴を取得することを含む。
特徴抽出の一例では、Queryの補助特徴を抽出する。補助特徴は手動で構築された特徴を指す。queryの意図識別及びスロット識別方法は、深層学習技術でqueryの深層特徴を自動的に抽出し、次に意図及びスロット識別を行うことであってもよい。しかしながら、手動で抽出された補助特徴は実はqueryの意図及びスロット識別に対し重要な作用を果たすことができる。補助特徴の抽出は3つのステップに分けられる。まず、スロットの特徴語テーブルを構築する。ここで、スロットの特徴語テーブルはあるスロットに対応する単語の集合を指し、例えば「歌曲名」スロットの特徴語テーブルがすべての歌曲名のリストである。この単語テーブルの構築方式は2つあり、その1つとして、ローカルの内部リソースを利用して構築し、例えば、内部の音楽類応用データベースから歌曲名、歌手名、歌曲タイプ等のスロットの単語テーブルを取得し、その2つとして、ネットワークデータを利用して構築し、例えば、ネットワークから地名、機関名等の構築に対応するスロット特徴語テーブルをクロールする。次に、特定のqueryに対し、辞書マッチング方式でqueryに含まれるすべての可能なスロット情報を検索する。最後に、スロット情報で示す。スロット情報の表示については、スロット情報がベクトルで示されてもよく、具体的にスロットベクトルの形式を用いる。各文字がいずれもそのスロットベクトルを有する。ベクトルの長さがスロット数の総合であり、queryにおける1つの文字があるスロット特徴語テーブルにおけるある単語の文字である場合、該文字のスロットベクトルにおける該スロットの値が1であり、そうでない場合に、0である。例えば、スロット「歌手名」及び「歌曲名」が2つあると仮定し、歌手名及び歌曲名の特徴語テーブルが表1に示される。

Figure 2020521210
query「ジェイ・チョウのわらの香りの歌を聞きたい(漢字:我想聴周傑倫的稲香)」は、各文字のスロットベクトルが表2に示される。

Figure 2020521210
Queryに対して補助特徴抽出を行うフローチャートは図6に示され、
スロット特徴語テーブルを構築するステップ401と、
辞書にマッチングするステップ402と、
スロット特徴を示すステップ403と、を含む。
RNNモデルを利用し、補助特徴と組み合わせて、複合モデルの訓練を行う。複合モデルの目標関数は、

Figure 2020521210
に示され、
Lが可能性の最も高い運算を説明するための目標関数を示し、xが入力されたqueryを示し、yがqueryの意図を示し、lがqueryのスロットシーケンスを示し、αが意図識別の重要係数を示す。αは大きければ大きいほど意図識別がシステムで重要になることを示し、逆に、スロット識別がシステムで重要になることを示す。queryの深層特徴抽出部にLSTMを応用してもよい。深層特徴を抽出するとともに、補助特徴をベクトルにマッピングしてモデルにも組み込む。具体的なモデルフレームは図7に示される。図7に示すように、まず、queryにおける各単語を単語ベクトル(Embeding)にマッピングする。次に、双方向変種のリカレントニューラルネットワーク(Bi−LSTM)を利用してセンテンスの深層特徴(Hidden Vector)を抽出する。その後、補助特徴(Auxiliary Feature)及び深層特徴を結合する。次に、複合特徴を利用して分類できる。その1として、スロット識別に対し、シーケンスでラベリングする方式を利用し、つまり、各単語に1つのカテゴリラベルを付けてもよい。その2として、意図識別に対し、分類方式を用い、つまり、センテンス全体に1つの分類ラベルを付けてもよく、ここで、センテンス全体にラベルを付けるとき、単語の複合特徴ベクトルを加重調和平均方式でセンテンスの複合特徴ベクトルに構成し、次に該複合特徴ベクトルを利用して分類する。その後、ラベリングされたデータを利用して該モデルを訓練でき、訓練過程は主に勾配降下方式でモデルパラメータを更新し、上記目標関数を最大化させることであり、それにより意図及びスロット識別の精度を向上させ、処理効率を向上させる。
特徴抽出を行い、特徴抽出によって複合モデルの訓練を行った後、訓練後のモデルパラメータを取得し、モデルパラメータを訓練した後、該モデルを利用してqueryに対して意図及びスロット識別を行うことができる。まず、構築されたスロット特徴語テーブルを利用してqueryに対して補助特徴抽出を行う必要があり、次に補助特徴及びqueryを予め訓練したモデルに入力すると、センテンス意図の確率分布及び各単語のスロットラベルの確率分布を取得することができ、その中から確率の最も高いものを選択すると、センテンスの意図及びスロット情報を取得する。
本実施例を用いて、意図及びスロットに対して複合学習を行うことにより、意図及びスロットが存在すると判断する精度が高く、実際に応用するとき、意図及びスロットの精度がいずれも85%以上に達する。本実施例をスマートスピーカーのシステムに融合することができ、スマートスピーカー返信の全体効果を効果的に向上させる。本実施例は更にシステムの実行時間を効果的に短縮することができ、スマートスピーカーがより短い時間内に反応することを可能にし、ヒューマンコンピュータインタラクション全体の処理効率を向上させる。
本実施例をスマート端末がスマートスピーカーであるシーンに応用する以外に、更にヒューマンコンピュータインタラクションの他のAI分野に応用してもよい。スマートスピーカーについては、RNNの方式のみでセンテンス及び単語の深層特徴抽出を行い、他のAI分野では更に他の方式を用いてもよく、例えば、畳み込みニューラルネットワーク(CNN)等の他のディープニューラルネットワークを利用してセンテンス及び単語の特徴に対して深層特徴抽出を行ってもよい。
本発明を実施するとき、他のAI分野では更に他の目標関数、例えば公式(2)を用いてモデル訓練を行ってもよく、該方式は意図を予測してからスロットを予測すると見なされてもよいが、スロットを予測する際に意図の予測構造を行い、このように意図及びスロットの結合性を利用してもよく、具体的な目標関数は、

Figure 2020521210
であり、
Lが可能性の最も高い運算を説明するための目標関数を示し、xが入力されたqueryを示し、yがqueryの意図を示し、lがqueryのスロットシーケンスを示す。
本発明の実施例の情報処理システムは図8に示され、端末51及びサーバ52を備え、サーバ52が端末に情報を提供する情報源とされる。処理ロジックが端末51により実行され、端末は、第1情報を収集するように構成される収集ユニット511と、前記第1情報に対し意図識別タスクを実行して、意図識別処理結果を取得するように構成される第1タスク実行ユニット512と、前記意図識別処理結果に基づいてスロット識別タスクを実行して、スロット識別処理結果を取得するように構成される第2タスク実行ユニット513と、前記スロット識別処理結果に基づいて目標結果を出力するように構成される出力ユニット514と、を備える。
一実施方式では、端末は、更に、前記意図識別処理結果から意図識別パラメータを解析するように構成される第1解析ユニットと、前記スロット識別処理結果からスロット識別パラメータを解析するように構成される第2解析ユニットと、前記意図識別パラメータ及び前記スロット識別パラメータに基づいてモデリングして、意図識別及びスロット識別の特徴結合性を特徴づける第1複合モデルを取得するように構成される第1モデル確立ユニットと、前記第1情報から第1特徴(例えば、補助特徴)を抽出するように構成される第1抽出ユニットと、前記第1情報から第2特徴(例えば、RNNを利用して取得した深層特徴)を抽出するように構成される第2抽出ユニットと、前記第1特徴及び前記第2特徴に基づき、前記第1複合モデルを訓練し、前記第1複合モデルが指定された目標に達する場合に訓練を停止し、意図識別を特徴づける第1目標パラメータ及びスロット識別を特徴づける第2目標パラメータを取得し、この時、複合学習によって取得された第1パラメータに対応する該第1目標パラメータ及び第2パラメータに対応する第2目標パラメータが定量であると見なされてもよいように構成される第3抽出ユニットと、前記第1目標パラメータ及び前記第2目標パラメータに基づいて第2複合モデルを構築するように構成される第2モデル確立ユニットと、を備える。
一実施方式では、端末は、更に、第2情報を取得するように構成される取得ユニットと、前記第2複合モデルに基づいて前記第2情報に対してフィードバック応答を行って、フィードバック情報を取得するように構成されるフィードバックユニットと、を備える。第2情報は上記第1情報と異なり、第2情報はユーザーのリアルタイムに提起した問題に対するものである。第1情報は多くの問題のデータを含み、モデリングに使用されるものである。
一実施方式では、前記収集ユニットは、更に、ローカルから、実ヒューマンコンピュータインタラクション環境において取得された対話内容からの前記第1情報を収集し、及び/又は、ネットワーク側から前記第1情報を収集し、前記第1情報に対して選別処理を行って、実ヒューマンコンピュータインタラクション環境において取得された対話内容に近いものを特徴づけるための目標情報を取得するように構成される。
一実施方式では、端末は、更に、第1情報を収集した後、前記第1情報及び/又は前記目標情報からなる第1情報源を作成するように構成される作成ユニットを備える。
一実施方式では、前記第1タスク実行ユニットは、更に、前記第1情報源から処理対象オブジェクトを抽出し、前記処理対象オブジェクトに対し意図を識別するための第1データラベリングを実行し、第1データラベリング結果に対してサンプリング検出を行い、検出結果の精度が第1閾値より大きい場合、前記第1ラベリング結果が目標要件を満たすと決定し、前記第1ラベリング結果に基づいて前記処理対象オブジェクトを分類して、異なる意図を特徴づける少なくとも1つの分類結果を取得して、前記意図識別処理結果として決定するように構成される。
一実施方式では、前記第2タスク実行ユニットは、更に、前記少なくとも1つの分類結果に基づいて対応するスロットを識別するための第2データラベリングを実行し、第2データラベリング結果に対してサンプリング検出を行い、検出結果の精度が第2閾値より大きい場合、前記第2ラベリング結果が目標要件を満たすと決定し、前記第2ラベリング結果を前記スロット識別処理結果として決定するように構成される。
一実施方式では、前記第1抽出ユニットは、更に、前記第1情報源から処理対象オブジェクトを抽出し、前記処理対象オブジェクトにスロット特徴語データベースを構築し、前記処理対象オブジェクトのうちの指定されたオブジェクトに対し、辞書マッチング方式で前記スロット特徴語データベースと照合して、前記第1特徴を特徴づけるための、前記指定オブジェクトに含まれるすべての可能なスロット情報を検索するように構成される。
一実施方式では、前記第2抽出ユニットは、更に、検索された前記スロット情報をスロットベクトルの形式で示し、スロットベクトルをLSTMにマッピングし、前記LSTMと融合した後、前記処理対象オブジェクトに対して深層特徴抽出を行って、前記第2特徴を取得するように構成される。
本発明の実施例の情報処理システムにおいて、システムにおける端末は、第1情報を収集するように構成される収集ユニットと、前記第1情報に対し意図識別タスクを実行して、意図識別処理結果を取得するように構成される第1タスク実行ユニットと、前記第1情報に対し意図識別タスクを実行して、スロット識別処理結果を取得するように構成される第2タスク実行ユニットと、前記意図識別処理結果から意図識別パラメータを解析するように構成される第1解析ユニットと、前記スロット識別処理結果からスロット識別パラメータを解析するように構成される第2解析ユニットと、前記意図識別パラメータ及び前記スロット識別パラメータに基づいてモデリングして、意図識別及びスロット識別の特徴結合性を特徴づける第1複合モデルを取得するように構成される第1モデル確立ユニットと、前記第1情報から第1特徴を抽出するように構成される第1抽出ユニットと、前記第1情報から第2特徴を抽出するように構成される第2抽出ユニットと、前記第1特徴及び前記第2特徴に基づき、前記第1複合モデルを訓練し、前記第1複合モデルが指定された目標に達する場合に訓練を停止し、意図識別を特徴づける第1目標パラメータ及びスロット識別を特徴づける第2目標パラメータを取得するように構成される第3抽出ユニットと、前記第1目標パラメータ及び前記第2目標パラメータに基づいて第2複合モデルを構築するように構成される第2モデル確立ユニットと、を備える。
本発明の実施例の端末において、前記端末は、プロセッサにおいて実行できるコンピュータプログラムを記憶するように構成されるメモリと、前記コンピュータプログラムを実行するとき、
第1情報を収集し、
前記第1情報に対し意図識別タスクを実行して、意図識別処理結果を取得し、
前記意図識別処理結果に基づいてスロット識別タスクを実行して、スロット識別処理結果を取得し、
前記スロット識別処理結果に基づいて目標結果を出力するように構成されるプロセッサと、を備える。
一実施例では、前記プロセッサは、前記コンピュータプログラムを実行するとき、更に、
前記意図識別処理結果から意図識別パラメータを解析し、
前記スロット識別処理結果からスロット識別パラメータを解析し、
前記意図識別パラメータ及び前記スロット識別パラメータに基づいてモデリングして、意図識別及びスロット識別の特徴結合性を特徴づける第1複合モデルを取得し、
前記第1情報から第1特徴を抽出し、
前記第1情報から第2特徴を抽出し、
前記第1特徴及び前記第2特徴に基づき、前記第1複合モデルを訓練し、前記第1複合モデルが指定された目標に達する場合に訓練を停止し、意図識別を特徴づける第1目標パラメータ及びスロット識別を特徴づける第2目標パラメータを取得し、
前記第1目標パラメータ及び前記第2目標パラメータに基づいて第2複合モデルを構築することに用いられる。
一実施例では、前記プロセッサは、前記コンピュータプログラムを実行するとき、更に、
第2情報を取得し、
前記第2複合モデルに基づいて前記第2情報に対してフィードバック応答を行って、フィードバック情報を取得することに用いられる。
一実施例では、前記プロセッサは、前記コンピュータプログラムを実行するとき、更に、
ローカルから、実ヒューマンコンピュータインタラクション環境において取得された対話内容からの前記第1情報を収集し、
及び/又は、ネットワーク側から前記第1情報を収集し、前記第1情報に対して選別処理を行って、実ヒューマンコンピュータインタラクション環境において取得された対話内容に近いものを特徴づけるための目標情報を取得することに用いられる。
一実施例では、前記プロセッサは、前記コンピュータプログラムを実行するとき、更に、
第1情報を収集した後、前記第1情報及び/又は前記目標情報からなる第1情報源を作成することに用いられる。
一実施例では、前記プロセッサは、前記コンピュータプログラムを実行するとき、更に、
前記第1情報源から処理対象オブジェクトを抽出し、
前記処理対象オブジェクトに対し意図を識別するための第1データラベリングを実行し、
第1データラベリング結果に対してサンプリング検出を行い、検出結果の精度が第1閾値より大きい場合、前記第1ラベリング結果が目標要件を満たすと決定し、
前記第1ラベリング結果に基づいて前記処理対象オブジェクトを分類して、異なる意図を特徴づける少なくとも1つの分類結果を取得して、前記意図識別処理結果として決定することに用いられる。
一実施例では、前記プロセッサは、前記コンピュータプログラムを実行するとき、更に、
前記少なくとも1つの分類結果に基づいて対応するスロットを識別するための第2データラベリングを実行し、
第2データラベリング結果に対してサンプリング検出を行い、検出結果の精度が第2閾値より大きい場合、前記第2ラベリング結果が目標要件を満たすと決定し、
前記第2ラベリング結果を前記スロット識別処理結果として決定することに用いられる。
一実施例では、前記プロセッサは、前記コンピュータプログラムを実行するとき、更に、
前記第1情報源から処理対象オブジェクトを抽出し、前記処理対象オブジェクトにスロット特徴語データベースを構築し、
前記処理対象オブジェクトのうちの指定されたオブジェクトに対し、辞書マッチング方式で前記スロット特徴語データベースと照合して、前記第1特徴を特徴づけるための、前記指定オブジェクトに含まれるすべての可能なスロット情報を検索することに用いられる。
一実施例では、前記プロセッサは、前記コンピュータプログラムを実行するとき、更に、
検索された前記スロット情報をスロットベクトルの形式で示し、
将スロットベクトルをLSTMにマッピングし、前記LSTMと融合した後、前記処理対象オブジェクトに対して深層特徴抽出を行って、前記第2特徴を取得することに用いられる。
本発明の実施例の端末において、前記端末は、プロセッサにおいて実行できるコンピュータプログラムを記憶するように構成されるメモリと、前記コンピュータプログラムを実行するとき、
第1情報を収集し、
前記第1情報に対し意図識別タスクを実行して、意図識別処理結果を取得し、
前記第1情報に対し意図識別タスクを実行して、スロット識別処理結果を取得し、
前記意図識別処理結果から意図識別パラメータを解析し、
前記スロット識別処理結果からスロット識別パラメータを解析し、
前記意図識別パラメータ及び前記スロット識別パラメータに基づいてモデリングして、意図識別及びスロット識別の特徴結合性を特徴づける第1複合モデルを取得し、
前記第1情報から第1特徴を抽出し、
前記第1情報から第2特徴を抽出し、
前記第1特徴及び前記第2特徴に基づき、前記第1複合モデルを訓練し、前記第1複合モデルが指定された目標に達する場合に訓練を停止し、意図識別を特徴づける第1目標パラメータ及びスロット識別を特徴づける第2目標パラメータを取得し、
前記第1目標パラメータ及び前記第2目標パラメータに基づいて第2複合モデルを構築するように構成されるプロセッサと、を備える。
本発明の実施例の端末は図9に示され、前記端末は、プロセッサにおいて実行できるコンピュータプログラムを記憶するように構成されるメモリ61と、前記コンピュータプログラムを実行するとき、上記実施例における情報処理方法のステップを実行するように構成されるプロセッサ62と、を備える。前記端末は更に外部通信インターフェース63を備えてもよく、前記外部通信インターフェース63は、端末等の外部機器がサーバと情報交換を行い、具体的に、端末がサーバから第1情報を収集し、端末がタスク実行ポリシー(シリアル処理又はパラレル処理)に基づいて前記第1情報に対し第1タスク(例えば、意図識別タスク)及び第2タスク(例えば、スロット識別タスク)を実行し、第1パラメータ(例えば、意図識別パラメータ)及び第2パラメータ(例えば、スロット識別パラメータ)によって第1複合モデルを構築し、前記第1情報から前記複合モデルが深層学習を行うための第1特徴(例えば、補助特徴)を抽出し、前記第1情報から前記複合モデルが深層学習を行うための第2特徴(例えば、深層特徴)を抽出し、前記第2特徴及び前記第1特徴に基づき、前記第1複合モデルを訓練し、前記第1複合モデルが指定された目標に達する場合に訓練を停止し、第1目標パラメータ及び第2目標パラメータからなる第2複合モデルと称される新しい複合モデルを抽出し、第2情報を取得し、前記第1目標パラメータ及び前記第2目標パラメータに基づいて前記第2情報に対してフィードバック応答を行って、フィードバック情報を取得することに用いられる。前記端末は更に内部通信インターフェース64を備えてもよく、前記内部通信インターフェース64は具体的にPCIバス等のバスインターフェースであってもよい。
ただし、以上に関わる端末及びサーバについての説明は上記方法についての説明と同様であり、同じ方法の有益な効果についての説明は省略する。本発明の端末及びサーバ実施例における未説明の技術的な詳細は、本発明の方法プロセスを説明する実施例に説明される内容を参照してもよい。
本発明の実施例のコンピュータ可読記憶媒体において、前記コンピュータ記憶媒体にコンピュータプログラムが記憶され、該コンピュータプログラムは、プロセッサにより実行されるとき、
第1情報を収集し、
前記第1情報に対し意図識別タスクを実行して、意図識別処理結果を取得し、
前記意図識別処理結果に基づいてスロット識別タスクを実行して、スロット識別処理結果を取得し、
前記スロット識別処理結果に基づいて目標結果を出力するように構成される。
一実施例では、該コンピュータプログラムは、プロセッサにより実行されるとき、
前記意図識別処理結果から意図識別パラメータを解析し、
前記スロット識別処理結果からスロット識別パラメータを解析し、
前記意図識別パラメータ及び前記スロット識別パラメータに基づいてモデリングして、意図識別及びスロット識別の特徴結合性を特徴づける第1複合モデルを取得し、
前記第1情報から第1特徴を抽出し、
前記第1情報から第2特徴を抽出し、
前記第1特徴及び前記第2特徴に基づき、前記第1複合モデルを訓練し、前記第1複合モデルが指定された目標に達する場合に訓練を停止し、意図識別を特徴づける第1目標パラメータ及びスロット識別を特徴づける第2目標パラメータを取得し、
前記第1目標パラメータ及び前記第2目標パラメータに基づいて第2複合モデルを構築するように構成される。
一実施例では、該コンピュータプログラムは、プロセッサにより実行されるとき、
第2情報を取得し、
前記第2複合モデルに基づいて前記第2情報に対してフィードバック応答を行って、フィードバック情報を取得するように構成される。
一実施例では、該コンピュータプログラムは、プロセッサにより実行されるとき、
ローカルから、実ヒューマンコンピュータインタラクション環境において取得された対話内容からの前記第1情報を収集し、
及び/又は、ネットワーク側から前記第1情報を収集し、前記第1情報に対して選別処理を行って、実ヒューマンコンピュータインタラクション環境において取得された対話内容に近いものを特徴づけるための目標情報を取得するように構成される。
一実施例では、該コンピュータプログラムは、プロセッサにより実行されるとき、
第1情報を収集した後、前記第1情報及び/又は前記目標情報からなる第1情報源を作成するように構成される。
一実施例では、該コンピュータプログラムは、プロセッサにより実行されるとき、
前記第1情報源から処理対象オブジェクトを抽出し、
前記処理対象オブジェクトに対し意図を識別するための第1データラベリングを実行し、
第1データラベリング結果に対してサンプリング検出を行い、検出結果の精度が第1閾値より大きい場合、前記第1ラベリング結果が目標要件を満たすと決定し、
前記第1ラベリング結果に基づいて前記処理対象オブジェクトを分類して、異なる意図を特徴づける少なくとも1つの分類結果を取得して、前記意図識別処理結果として決定するように構成される。
一実施例では、該コンピュータプログラムは、プロセッサにより実行されるとき、
前記少なくとも1つの分類結果に基づいて対応するスロットを識別するための第2データラベリングを実行し、
第2データラベリング結果に対してサンプリング検出を行い、検出結果の精度が第2閾値より大きい場合、前記第2ラベリング結果が目標要件を満たすと決定し、
前記第2ラベリング結果を前記スロット識別処理結果として決定するように構成される。
一実施例では、該コンピュータプログラムは、プロセッサにより実行されるとき、
前記第1情報源から処理対象オブジェクトを抽出し、前記処理対象オブジェクトにスロット特徴語データベースを構築し、
前記処理対象オブジェクトのうちの指定されたオブジェクトに対し、辞書マッチング方式で前記スロット特徴語データベースと照合して、前記第1特徴を特徴づけるための、前記指定オブジェクトに含まれるすべての可能なスロット情報を検索するように構成される。
一実施例では、該コンピュータプログラムは、プロセッサにより実行されるとき、
検索された前記スロット情報をスロットベクトルの形式で示し、
スロットベクトルをLSTMにマッピングし、前記LSTMと融合した後、前記処理対象オブジェクトに対して深層特徴抽出を行って、前記第2特徴を取得するように構成される。
本発明の実施例のコンピュータ可読記憶媒体において、前記コンピュータ記憶媒体にコンピュータプログラムが記憶され、該コンピュータプログラムは、プロセッサにより実行されるとき、
第1情報を収集し、
前記第1情報に対し意図識別タスクを実行して、意図識別処理結果を取得し、
前記第1情報に対し意図識別タスクを実行して、スロット識別処理結果を取得し、
前記意図識別処理結果から意図識別パラメータを解析し、
前記スロット識別処理結果からスロット識別パラメータを解析し、
前記意図識別パラメータ及び前記スロット識別パラメータに基づいてモデリングして、意図識別及びスロット識別の特徴結合性を特徴づける第1複合モデルを取得し、
前記第1情報から第1特徴を抽出し、
前記第1情報から第2特徴を抽出し、
前記第1特徴及び前記第2特徴に基づき、前記第1複合モデルを訓練し、前記第1複合モデルが指定された目標に達する場合に訓練を停止し、意図識別を特徴づける第1目標パラメータ及びスロット識別を特徴づける第2目標パラメータを取得し、
前記第1目標パラメータ及び前記第2目標パラメータに基づいて第2複合モデルを構築するように構成される。
本願に係るいくつかの実施例では、開示される装置及び方法は他の方式で実現されてもよいと理解すべきである。以上に説明される装置実施例は模式的なものに過ぎず、例えば、前記ユニットの区別は論理機能上の区別に過ぎず、実際に実現するとき、他の区別方式を用いてもよく、例えば複数のユニット又はコンポーネントは他のシステムに結合又は統合されてもよく、又はいくつかの特徴は省略してもよく、又は実行しなくてもよい。また、表示又は検討される各構成部分間の結合又は直接結合又は通信接続はいくつかのインターフェース、装置又はユニットによる間接結合又は通信接続であってもよく、電気、機械又は他の形式であってもよい。
分離部材として説明される上記ユニットは物理的に分離してもよいし、物理的に分離しなくてもよく、ユニットとして表示される部材は物理ユニットであってもよいし、物理ユニットでなくてもよく、つまり、一箇所に位置してもよいし、複数のネットワークユニットに配置されてもよく、実際の必要に応じて、その一部又は全部のユニットを選択して本実施例案の目的を実現してもよい。
また、本発明の各実施例では、各機能ユニットは1つの処理ユニットに統合されてもよく、各ユニットはそれぞれ独立して1つのユニットとされてもよく、2つ又は2つ以上のユニットは1つのユニットに統合されてもよく、上記統合されたユニットはハードウェアの形式で実現されてもよいし、ハードウェアプラスソフトウェア機能ユニットの形式で実現されてもよい。
当業者であれば、上記方法実施例を実現する全部又は一部のステップはプログラム命令に関連するハードウェアで完了してもよく、上記プログラムがコンピュータ可読記憶媒体に記憶されてもよく、該プログラムは実行時、上記方法実施例のステップを実行するが、上記記憶媒体は携帯型記憶装置、ROM、RAM、磁気ディスク又は光ディスク等のプログラムコードを記憶できる様々な媒体を含むと理解される。
又は、本発明の上記統合されたユニットはソフトウェア機能ユニットの形式で実現され、且つ独立した製品として販売又は使用されるとき、1つのコンピュータ可読記憶媒体に記憶されてもよい。このような理解に基づき、本発明の実施例の技術案の本質又は従来技術に貢献する部分はソフトウェア製品の形式で具現されてもよく、該コンピュータソフトウェア製品は、1台のコンピュータ装置(パーソナルコンピュータ、サーバ又はネットワーク機器等であってもよい)に本発明の各実施例に記載の方法の全部又は一部を実行させるための複数の命令を含む1つの記憶媒体に記憶される。そして、上記記憶媒体は携帯型記憶装置、ROM、RAM、磁気ディスク又は光ディスク等のプログラムコードを記憶できる様々な媒体を含む。
以上の説明は本発明の具体的な実施形態であって、本発明の保護範囲を制限するためのものではなく、当業者が本発明に開示される技術的範囲内に容易に想到し得る変更や置換は、いずれも本発明の保護範囲内に含まれるべきである。従って、本発明の保護範囲は特許請求の範囲に準じるべきである。
本発明の実施例によれば、第1情報を収集し、第1情報に対し意図識別タスクを実行して、意図識別処理結果を取得し、更に意図識別処理結果に基づいてスロット識別タスクを実行して、スロット識別処理結果を取得し、このようなシリアル処理メカニズムによって、意図識別タスク及びスロット識別タスクの2つのタスク処理結果における特徴属性の結合性を利用し、最終的にスロット識別処理結果に基づいて目標結果を出力することができる。シリアル処理メカニズムを利用して結合性の効果を実現できるため、クエリ範囲を縮小し、かなりの時間の浪費を回避することができ、ユーザーにとって処理過程が透明であり、ユーザーが問題を入力すれば、所要の解答を迅速に取得することができ、且つ解答は精度が高くて、ユーザーの要件を最も満たす可能性の最も高いフィードバック情報であり、従って、ヒューマンコンピュータインタラクションの全体効果を向上させる。
31 端末
32 端末
33 端末
34 端末
61 メモリ
62 プロセッサ
63 外部通信インターフェース
64 内部通信インターフェース
511 収集ユニット
512 第1タスク実行ユニット
513 第2タスク実行ユニット
514 出力ユニット

Claims (22)

  1. 情報処理方法であって、
    前記方法は端末により実行され、前記端末は1つ又は複数のプロセッサ、メモリ及び1つ又は1つ以上のコンピュータプログラムを備え、前記1つ又は複数のプロセッサは前記コンピュータプログラムを実行するように構成され、前記方法は、
    第1情報を収集することと、
    前記第1情報に対し意図識別タスクを実行して、意図識別処理結果を取得することと、
    前記意図識別処理結果に基づいてスロット識別タスクを実行して、スロット識別処理結果を取得することと、
    前記スロット識別処理結果に基づいて目標結果を出力することと、を含む、前記情報処理方法。
  2. 前記方法は、更に、
    前記意図識別処理結果から意図識別パラメータを解析することと、
    前記スロット識別処理結果からスロット識別パラメータを解析することと、
    前記意図識別パラメータ及び前記スロット識別パラメータに基づいてモデリングして、意図識別及びスロット識別の特徴結合性を特徴づける第1複合モデルを取得することと、
    前記第1情報から第1特徴を抽出することと、
    前記第1情報から第2特徴を抽出することと、
    前記第1特徴及び前記第2特徴に基づき、前記第1複合モデルを訓練し、前記第1複合モデルが指定された目標に達する場合に訓練を停止し、意図識別を特徴づける第1目標パラメータ及びスロット識別を特徴づける第2目標パラメータを取得することと、
    前記第1目標パラメータ及び前記第2目標パラメータに基づいて第2複合モデルを構築することと、を含む
    請求項1に記載の方法。
  3. 前記方法は、更に、
    第2情報を取得することと、
    前記第2複合モデルに基づいて前記第2情報に対してフィードバック応答を行って、フィードバック情報を取得することと、を含む
    請求項2に記載の方法。
  4. 第1情報を収集することは、
    ローカルから、実ヒューマンコンピュータインタラクション環境において取得された対話内容からの前記第1情報を収集し、
    及び/又は、ネットワーク側から前記第1情報を収集し、前記第1情報に対して選別処理を行って、実ヒューマンコンピュータインタラクション環境において取得された対話内容に近いものを特徴づけるための目標情報を取得することを含む
    請求項2又は3に記載の方法。
  5. 前記方法は、更に、
    第1情報を収集した後、前記第1情報及び/又は前記目標情報からなる第1情報源を作成することを含む
    請求項4に記載の方法。
  6. 前記第1情報に対し意図識別タスクを実行して、意図識別処理結果を取得することは、
    前記第1情報源から処理対象オブジェクトを抽出することと、
    前記処理対象オブジェクトに対し意図を識別するための第1データラベリングを実行することと、
    第1データラベリング結果に対してサンプリング検出を行い、検出結果の精度が第1閾値より大きい場合、前記第1ラベリング結果が目標要件を満たすと決定することと、
    前記第1ラベリング結果に基づいて前記処理対象オブジェクトを分類して、異なる意図を特徴づける少なくとも1つの分類結果を取得して、前記意図識別処理結果として決定することと、を含む
    請求項5に記載の方法。
  7. 前記意図識別処理結果に基づいてスロット識別タスクを実行して、スロット識別処理結果を取得することは、
    前記少なくとも1つの分類結果に基づいて対応するスロットを識別するための第2データラベリングを実行することと、
    第2データラベリング結果に対してサンプリング検出を行い、検出結果の精度が第2閾値より大きい場合、前記第2ラベリング結果が目標要件を満たすと決定することと、
    前記第2ラベリング結果を前記スロット識別処理結果として決定することと、を含む
    請求項6に記載の方法。
  8. 前記第1情報から第1特徴を抽出することは、
    前記第1情報源から処理対象オブジェクトを抽出し、前記処理対象オブジェクトにスロット特徴語データベースを構築することと、
    前記処理対象オブジェクトのうちの指定されたオブジェクトに対し、辞書マッチング方式で前記スロット特徴語データベースと照合して、前記第1特徴を特徴づけるための、前記指定オブジェクトに含まれるすべての可能なスロット情報を検索することと、を含む
    請求項5に記載の方法。
  9. 前記第1情報から第2特徴を抽出することは、
    検索された前記スロット情報をスロットベクトルの形式で示すことと、
    スロットベクトルを変種のリカレントニューラルネットワークにマッピングし、前記変種のリカレントニューラルネットワークと融合した後、前記処理対象オブジェクトに対して深層特徴抽出を行って、前記第2特徴を取得することと、を含む
    請求項8に記載の方法。
  10. 情報処理方法であって、
    前記方法は端末により実行され、前記端末は1つ又は複数のプロセッサ、メモリ及び1つ又は1つ以上のコンピュータプログラムを備え、前記1つ又は複数のプロセッサは前記コンピュータプログラムを実行するように構成され、前記方法は、
    第1情報を収集することと、
    前記第1情報に対し意図識別タスクを実行して、意図識別処理結果を取得することと、
    前記第1情報に対し意図識別タスクを実行して、スロット識別処理結果を取得することと、
    前記意図識別処理結果から意図識別パラメータを解析することと、
    前記スロット識別処理結果からスロット識別パラメータを解析することと、
    前記意図識別パラメータ及び前記スロット識別パラメータに基づいてモデリングして、意図識別及びスロット識別の特徴結合性を特徴づける第1複合モデルを取得することと、
    前記第1情報から第1特徴を抽出することと、
    前記第1情報から第2特徴を抽出することと、
    前記第1特徴及び前記第2特徴に基づき、前記第1複合モデルを訓練し、前記第1複合モデルが指定された目標に達する場合に訓練を停止し、意図識別を特徴づける第1目標パラメータ及びスロット識別を特徴づける第2目標パラメータを取得することと、
    前記第1目標パラメータ及び前記第2目標パラメータに基づいて第2複合モデルを構築することと、を含む、前記情報処理方法。
  11. 端末であって、
    第1情報を収集するように構成される収集ユニットと、
    前記第1情報に対し意図識別タスクを実行して、意図識別処理結果を取得するように構成される第1タスク実行ユニットと、
    前記意図識別処理結果に基づいてスロット識別タスクを実行して、スロット識別処理結果を取得するように構成される第2タスク実行ユニットと、
    前記スロット識別処理結果に基づいて目標結果を出力するように構成される出力ユニットと、を備える、前記端末。
  12. 前記端末は、更に、
    前記意図識別処理結果から意図識別パラメータを解析するように構成される第1解析ユニットと、
    前記スロット識別処理結果からスロット識別パラメータを解析するように構成される第2解析ユニットと、
    前記意図識別パラメータ及び前記スロット識別パラメータに基づいてモデリングして、意図識別及びスロット識別の特徴結合性を特徴づける第1複合モデルを取得するように構成される第1モデル確立ユニットと、
    前記第1情報から第1特徴を抽出するように構成される第1抽出ユニットと、
    前記第1情報から第2特徴を抽出するように構成される第2抽出ユニットと、
    前記第1特徴及び前記第2特徴に基づき、前記第1複合モデルを訓練し、前記第1複合モデルが指定された目標に達する場合に訓練を停止し、意図識別を特徴づける第1目標パラメータ及びスロット識別を特徴づける第2目標パラメータを取得するように構成される第3抽出ユニットと、
    前記第1目標パラメータ及び前記第2目標パラメータに基づいて第2複合モデルを構築するように構成される第2モデル確立ユニットと、を備える
    請求項11に記載の端末。
  13. 前記端末は、更に、
    取得ユニットが第2情報を取得するように構成され、
    フィードバックユニットが前記第2複合モデルに基づいて前記第2情報に対してフィードバック応答を行って、フィードバック情報を取得するように構成されることを含む
    請求項12に記載の端末。
  14. 前記収集ユニットは、更に、
    ローカルから、実ヒューマンコンピュータインタラクション環境において取得された対話内容からの前記第1情報を収集し、
    及び/又は、ネットワーク側から前記第1情報を収集し、前記第1情報に対して選別処理を行って、実ヒューマンコンピュータインタラクション環境において取得された対話内容に近いものを特徴づけるための目標情報を取得するように構成される
    請求項12又は13に記載の端末。
  15. 前記端末は、更に、
    第1情報を収集した後、前記第1情報及び/又は前記目標情報からなる第1情報源を作成するように構成される作成ユニットを備える
    請求項14に記載の端末。
  16. 前記第1タスク実行ユニットは、更に、
    前記第1情報源から処理対象オブジェクトを抽出し、
    前記処理対象オブジェクトに対し意図を識別するための第1データラベリングを実行し、
    第1データラベリング結果に対してサンプリング検出を行い、検出結果の精度が第1閾値より大きい場合、前記第1ラベリング結果が目標要件を満たすと決定し、
    前記第1ラベリング結果に基づいて前記処理対象オブジェクトを分類して、異なる意図を特徴づける少なくとも1つの分類結果を取得して、前記意図識別処理結果として決定するように構成される
    請求項15に記載の端末。
  17. 前記第2タスク実行ユニットは、更に、
    前記少なくとも1つの分類結果に基づいて対応するスロットを識別するための第2データラベリングを実行し、
    第2データラベリング結果に対してサンプリング検出を行い、検出結果の精度が第2閾値より大きい場合、前記第2ラベリング結果が目標要件を満たすと決定し、
    前記第2ラベリング結果を前記スロット識別処理結果として決定するように構成される
    請求項16に記載の端末。
  18. 前記第1抽出ユニットは、更に、
    前記第1情報源から処理対象オブジェクトを抽出し、前記処理対象オブジェクトにスロット特徴語データベースを構築し、
    前記処理対象オブジェクトのうちの指定されたオブジェクトに対し、辞書マッチング方式で前記スロット特徴語データベースと照合して、前記第1特徴を特徴づけるための、前記指定オブジェクトに含まれるすべての可能なスロット情報を検索するように構成される
    請求項15に記載の端末。
  19. 前記第2抽出ユニットは、更に、
    検索された前記スロット情報をスロットベクトルの形式で示し、
    スロットベクトルを変種のリカレントニューラルネットワークにマッピングし、前記変種のリカレントニューラルネットワークと融合した後、前記処理対象オブジェクトに対して深層特徴抽出を行って、前記第2特徴を取得するように構成される
    請求項18に記載の端末。
  20. 端末であって、
    第1情報を収集するように構成される収集ユニットと、
    前記第1情報に対し意図識別タスクを実行して、意図識別処理結果を取得するように構成される第1タスク実行ユニットと、
    前記第1情報に対し意図識別タスクを実行して、スロット識別処理結果を取得するように構成される第2タスク実行ユニットと、
    前記意図識別処理結果から意図識別パラメータを解析するように構成される第1解析ユニットと、
    前記スロット識別処理結果からスロット識別パラメータを解析するように構成される第2解析ユニットと、
    前記意図識別パラメータ及び前記スロット識別パラメータに基づいてモデリングして、意図識別及びスロット識別の特徴結合性を特徴づける第1複合モデルを取得するように構成される第1モデル確立ユニットと、
    前記第1情報から第1特徴を抽出するように構成される第1抽出ユニットと、
    前記第1情報から第2特徴を抽出するように構成される第2抽出ユニットと、
    前記第1特徴及び前記第2特徴に基づき、前記第1複合モデルを訓練し、前記第1複合モデルが指定された目標に達する場合に訓練を停止し、意図識別を特徴づける第1目標パラメータ及びスロット識別を特徴づける第2目標パラメータを取得するように構成される第3抽出ユニットと、
    前記第1目標パラメータ及び前記第2目標パラメータに基づいて第2複合モデルを構築するように構成される第2モデル確立ユニットと、を備える、前記端末。
  21. 端末であって、
    プロセッサにおいて実行できるコンピュータプログラムを記憶するように構成されるメモリと、
    前記コンピュータプログラムを実行するとき、請求項1〜9のいずれか1項又は請求項10に記載の方法のステップを実行するように構成されるプロセッサと、を備える、前記端末。
  22. コンピュータ可読記憶媒体であって、
    プロセッサにより実行されるとき、請求項1〜9のいずれか1項又は請求項10に記載の方法のステップを実現するコンピュータプログラムが記憶される、前記コンピュータ可読記憶媒体。
JP2019561185A 2017-10-31 2017-10-31 情報処理方法及び端末、コンピュータ記憶媒体 Active JP6894534B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2017/108720 WO2019084810A1 (zh) 2017-10-31 2017-10-31 一种信息处理方法及终端、计算机存储介质

Publications (2)

Publication Number Publication Date
JP2020521210A true JP2020521210A (ja) 2020-07-16
JP6894534B2 JP6894534B2 (ja) 2021-06-30

Family

ID=66331206

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019561185A Active JP6894534B2 (ja) 2017-10-31 2017-10-31 情報処理方法及び端末、コンピュータ記憶媒体

Country Status (5)

Country Link
US (2) US11645517B2 (ja)
JP (1) JP6894534B2 (ja)
KR (1) KR102288249B1 (ja)
CN (1) CN110168535B (ja)
WO (1) WO2019084810A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022003537A (ja) * 2020-12-09 2022-01-11 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド 対話意図の認識方法及び装置、電子機器並びに記憶媒体
JP2023007373A (ja) * 2021-06-30 2023-01-18 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド 意図識別モデルの訓練及び意図識別の方法及び装置
KR20230013921A (ko) * 2021-07-20 2023-01-27 현대모비스 주식회사 머신 러닝 기반 품질데이터 자동 분석 시스템

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102608469B1 (ko) * 2017-12-22 2023-12-01 삼성전자주식회사 자연어 생성 방법 및 장치
CN110347789A (zh) * 2019-06-14 2019-10-18 平安科技(深圳)有限公司 文本意图智能分类方法、装置及计算机可读存储介质
CN110413756B (zh) * 2019-07-29 2022-02-15 北京小米智能科技有限公司 自然语言处理的方法、装置及设备
CN110532355B (zh) * 2019-08-27 2022-07-01 华侨大学 一种基于多任务学习的意图与槽位联合识别方法
CN110928995B (zh) * 2019-11-28 2022-12-09 中国建设银行股份有限公司 一种交互信息处理方法、装置、设备及存储介质
CN110929014B (zh) * 2019-12-09 2023-05-23 联想(北京)有限公司 信息处理方法、装置、电子设备及存储介质
US10841251B1 (en) * 2020-02-11 2020-11-17 Moveworks, Inc. Multi-domain chatbot
CN111651988B (zh) * 2020-06-03 2023-05-19 北京百度网讯科技有限公司 用于训练模型的方法、装置、设备以及存储介质
CN113779975B (zh) * 2020-06-10 2024-03-01 北京猎户星空科技有限公司 一种语义识别方法、装置、设备及介质
US11302327B2 (en) * 2020-06-22 2022-04-12 Bank Of America Corporation Priori knowledge, canonical data forms, and preliminary entrentropy reduction for IVR
KR20220046103A (ko) * 2020-10-07 2022-04-14 삼성전자주식회사 전자 장치 및 자연어 이해를 위한 파라미터의 획득 방법
CN112632987B (zh) * 2020-12-25 2023-08-11 北京百度网讯科技有限公司 词槽的识别方法、装置及电子设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015148910A (ja) * 2014-02-05 2015-08-20 株式会社東芝 発話文収集装置、方法、及びプログラム
JP2015527683A (ja) * 2012-09-19 2015-09-17 アップル インコーポレイテッド 音声ベースのメディア検索

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4176228B2 (ja) * 1999-03-15 2008-11-05 株式会社東芝 自然言語対話装置及び自然言語対話方法
IS5369A (is) * 2000-02-08 2001-08-09 Net-Album.Net Net-albúm-Verklag og vinnuferlar við meðhöndlun og geymslu stafrænna skráa í upplýsingakerfum
JP4543294B2 (ja) * 2000-03-14 2010-09-15 ソニー株式会社 音声認識装置および音声認識方法、並びに記録媒体
US7890526B1 (en) * 2003-12-30 2011-02-15 Microsoft Corporation Incremental query refinement
US7461059B2 (en) * 2005-02-23 2008-12-02 Microsoft Corporation Dynamically updated search results based upon continuously-evolving search query that is based at least in part upon phrase suggestion, search engine uses previous result sets performing additional search tasks
US20110125764A1 (en) * 2009-11-26 2011-05-26 International Business Machines Corporation Method and system for improved query expansion in faceted search
CN104054075A (zh) * 2011-12-06 2014-09-17 派赛普申合伙公司 文本挖掘、分析和输出系统
US9201859B2 (en) * 2011-12-15 2015-12-01 Microsoft Technology Licensing, Llc Suggesting intent frame(s) for user request(s)
CN104424298B (zh) * 2013-09-02 2018-07-06 联想(北京)有限公司 一种信息推送方法和电子设备
US9886950B2 (en) * 2013-09-08 2018-02-06 Intel Corporation Automatic generation of domain models for virtual personal assistants
US10037758B2 (en) 2014-03-31 2018-07-31 Mitsubishi Electric Corporation Device and method for understanding user intent
US9372851B2 (en) * 2014-04-01 2016-06-21 Microsoft Technology Licensing, Llc Creating a calendar event using context
US20150081277A1 (en) * 2014-08-28 2015-03-19 Kambiz Behi System and Method for Automatically Classifying Text using Discourse Analysis
JP2016061954A (ja) 2014-09-18 2016-04-25 株式会社東芝 対話装置、方法およびプログラム
CN105893345A (zh) * 2016-03-28 2016-08-24 联想(北京)有限公司 一种信息处理方法和电子设备
CN106239506B (zh) * 2016-08-11 2018-08-21 北京光年无限科技有限公司 智能机器人的多模态输入数据处理方法及机器人操作系统
CN106407178B (zh) * 2016-08-25 2019-08-13 中国科学院计算技术研究所 一种会话摘要生成方法、装置、服务器设备以及终端设备
CN106383872A (zh) * 2016-09-06 2017-02-08 北京百度网讯科技有限公司 基于人工智能的信息处理方法及装置
CN106383875B (zh) * 2016-09-09 2019-10-15 北京百度网讯科技有限公司 基于人工智能的人机交互方法和装置
CN106557461B (zh) * 2016-10-31 2019-03-12 百度在线网络技术(北京)有限公司 基于人工智能的语义解析处理方法和装置
KR20180077689A (ko) * 2016-12-29 2018-07-09 주식회사 엔씨소프트 자연어 생성 장치 및 방법
GB2559618B (en) * 2017-02-13 2020-07-08 Toshiba Kk A dialogue system, a dialogue method and a method of adapting a dialogue system
US20180330718A1 (en) * 2017-05-11 2018-11-15 Mitsubishi Electric Research Laboratories, Inc. System and Method for End-to-End speech recognition
US20180329884A1 (en) * 2017-05-12 2018-11-15 Rsvp Technologies Inc. Neural contextual conversation learning
CN107203265B (zh) * 2017-05-17 2021-01-22 广东美的制冷设备有限公司 信息交互方法和装置
US10817650B2 (en) * 2017-05-19 2020-10-27 Salesforce.Com, Inc. Natural language processing using context specific word vectors
CN107133345B (zh) * 2017-05-22 2020-11-06 北京百度网讯科技有限公司 基于人工智能的交互方法和装置
CN107220235B (zh) * 2017-05-23 2021-01-22 北京百度网讯科技有限公司 基于人工智能的语音识别纠错方法、装置及存储介质
CN107291828B (zh) * 2017-05-27 2021-06-11 北京百度网讯科技有限公司 基于人工智能的口语查询解析方法、装置及存储介质
CN107301227A (zh) * 2017-06-21 2017-10-27 北京百度网讯科技有限公司 基于人工智能的搜索信息解析方法及装置
US20190034542A1 (en) * 2017-07-26 2019-01-31 Scripps Networks Interactive, Inc. Intelligent agent system and method of accessing and delivering digital files
KR102608469B1 (ko) * 2017-12-22 2023-12-01 삼성전자주식회사 자연어 생성 방법 및 장치

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015527683A (ja) * 2012-09-19 2015-09-17 アップル インコーポレイテッド 音声ベースのメディア検索
JP2015148910A (ja) * 2014-02-05 2015-08-20 株式会社東芝 発話文収集装置、方法、及びプログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022003537A (ja) * 2020-12-09 2022-01-11 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド 対話意図の認識方法及び装置、電子機器並びに記憶媒体
JP7309798B2 (ja) 2020-12-09 2023-07-18 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド 対話意図の認識方法及び装置、電子機器並びに記憶媒体
JP2023007373A (ja) * 2021-06-30 2023-01-18 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド 意図識別モデルの訓練及び意図識別の方法及び装置
KR20230013921A (ko) * 2021-07-20 2023-01-27 현대모비스 주식회사 머신 러닝 기반 품질데이터 자동 분석 시스템
KR102507650B1 (ko) * 2021-07-20 2023-03-07 현대모비스 주식회사 머신 러닝 기반 품질데이터 자동 분석 시스템

Also Published As

Publication number Publication date
KR20200007969A (ko) 2020-01-22
US20200050940A1 (en) 2020-02-13
JP6894534B2 (ja) 2021-06-30
US11645517B2 (en) 2023-05-09
CN110168535B (zh) 2021-07-09
US20230237328A1 (en) 2023-07-27
CN110168535A (zh) 2019-08-23
WO2019084810A1 (zh) 2019-05-09
KR102288249B1 (ko) 2021-08-09

Similar Documents

Publication Publication Date Title
JP2020521210A (ja) 情報処理方法及び端末、コンピュータ記憶媒体
CN111177569B (zh) 基于人工智能的推荐处理方法、装置及设备
JP6440732B2 (ja) 機械学習に基づく自動タスク分類
US10649990B2 (en) Linking ontologies to expand supported language
US11899681B2 (en) Knowledge graph building method, electronic apparatus and non-transitory computer readable storage medium
CN109635117A (zh) 一种基于知识图谱识别用户意图方法及装置
US20140207776A1 (en) Method and system for linking data sources for processing composite concepts
WO2023065211A1 (zh) 一种信息获取方法以及装置
CN112799747A (zh) 智能助理评价、推荐方法、系统、终端及可读存储介质
CN109710739B (zh) 一种信息处理方法及装置、存储介质
CN112749266B (zh) 一种工业问答方法、装置、系统、设备及存储介质
CN112507139B (zh) 基于知识图谱的问答方法、系统、设备及存储介质
CN114357117A (zh) 事务信息查询方法、装置、计算机设备及存储介质
CN111159987A (zh) 数据图表绘制方法、装置、设备和计算机可读存储介质
CN109408658A (zh) 表情图片提示方法、装置、计算机设备及存储介质
CN110059172B (zh) 基于自然语言理解的推荐答案的方法和装置
CN109829033A (zh) 数据展示方法和终端设备
US20220327147A1 (en) Method for updating information of point of interest, electronic device and storage medium
US11314793B2 (en) Query processing
JP2023554210A (ja) インテリジェント推奨用のソートモデルトレーニング方法及び装置、インテリジェント推奨方法及び装置、電子機器、記憶媒体、並びにコンピュータプログラム
CN114817478A (zh) 基于文本的问答方法、装置、计算机设备及存储介质
CN114253990A (zh) 数据库查询方法、装置、计算机设备和存储介质
CN112286916A (zh) 一种数据处理方法、装置、设备及存储介质
CN111046151A (zh) 一种消息处理方法及装置
CN117421398A (zh) 人机交互方法、装置、设备以及存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191106

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20201113

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201124

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210210

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210510

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210603

R150 Certificate of patent or registration of utility model

Ref document number: 6894534

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150