JP2021197153A - ワードスロットを識別するための方法及び装置、電子機器、記憶媒体並びにコンピュータプログラム - Google Patents

ワードスロットを識別するための方法及び装置、電子機器、記憶媒体並びにコンピュータプログラム Download PDF

Info

Publication number
JP2021197153A
JP2021197153A JP2021032216A JP2021032216A JP2021197153A JP 2021197153 A JP2021197153 A JP 2021197153A JP 2021032216 A JP2021032216 A JP 2021032216A JP 2021032216 A JP2021032216 A JP 2021032216A JP 2021197153 A JP2021197153 A JP 2021197153A
Authority
JP
Japan
Prior art keywords
word slot
identification result
slot identification
entity
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2021032216A
Other languages
English (en)
Other versions
JP7200277B2 (ja
Inventor
シンチェ ディン,
Xinzhe Ding
フイフェン スン,
Huifeng Sun
スーチー スン,
Shuqi Sun
ケ スン,
Ke Sun
ティンティン リ,
Tingting Li
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Publication of JP2021197153A publication Critical patent/JP2021197153A/ja
Application granted granted Critical
Publication of JP7200277B2 publication Critical patent/JP7200277B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2148Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting

Abstract

【課題】ワードスロットを識別するための方法及び装置、電子機器、記憶媒体並びにコンピュータプログラムを提供する。【解決手段】ワードスロットを識別するための方法は、ターゲットセンテンスを受信するステップ201と、ターゲットセンテンス及び事前に設置された実体集合に基づいてターゲットセンテンスの第1ワードスロット識別結果を確定するステップ202と、ターゲットセンテンス及び事前にトレーニングされたセンテンスとワードスロット識別結果の対応関係を表すためのワードスロット識別モデルによって、ターゲットセンテンスの第2ワードスロット識別結果を確定するステップ203と、第1ワードスロット識別結果及び第2ワードスロット識別結果に基づいてターゲットワードスロット識別結果を確定するステップ204と、を含む。【選択図】図2

Description

本出願はコンピュータの技術分野に関し、具体的に自然言語処理、深層学習技術分野に関し、特にワードスロットを識別するための方法及び装置、電子機器、記憶媒体並びにコンピュータプログラムに関する。
インテリジェントな会話技術の発展に伴い、クエリ理解(QU,Query Understanding,Query理解とも呼ばれる)がますます注目を集めている。クエリ理解とは、ユーザーの検索文字列を解析し、ユーザーの意図を理解するプロセスであり、標準的な自然言語処理タスクである。クエリ理解は、通常に意図識別とワードスロット解析の二つの主なタスクに分けられる。その中で、意図識別は、クエリがユーザーのどの意図を表すかを判断するための分類タスクと見なすことができる。ワードスロット解析は、意図識別の基礎として使用され、意図識別を補助する役割を果たす。スロット解析は、クエリ内の特定のスロット情報をマークするための、シーケンスのラベル付けタスクと見なすことができる。例えば、「YY街経由でXXビルまでの渋滞なしのルートをナビゲートして下さい」というクエリの場合、その意図は「Navigate(ナビゲート)」であり、「YY街:user_passby(経由地)」、「xxビル:user_destination(目的地)」、「渋滞なし:user_route_type(ルートタイプ)」の三つのスロットが含まれていると判断できる。
クエリ理解のコアの一つはスロット解析であり、スロットデータは毎日爆発的に増加し、しかもユーザーのカスタマイズされたスロット情報が益々増えている。機械学習モデルを使用してユーザースロット情報を識別することに加え、ユーザーの個人情報、例えばユーザーが自宅のスマートデバイスに命名する場合、それぞれ独自の特徴があり、モデル識別だけでは満足できない。さらに、モデル識別は、大量のデータに基づいて、継続的にトレーニングとチューニングを行った後に使用可能となり、その過程は非常に長い時間が必要とする。
本出願は、ワードスロットを識別するための方法及び装置、電子機器、記憶媒体並びにコンピュータプログラムを提供する。
第1態様において、ターゲットセンテンスを受信することと、ターゲットセンテンス及び事前に設置された実体集合に基づいてターゲットセンテンスの第1ワードスロット識別結果を確定することと、ターゲットセンテンス及び事前にトレーニングされた、センテンスとワードスロット識別結果の対応関係を表すためのワードスロット識別モデルによって、ターゲットセンテンスの第2ワードスロット識別結果を確定することと、第1ワードスロット識別結果及び第2ワードスロット識別結果に基づいてターゲットワードスロット識別結果を確定することと、を含むワードスロットを識別するための方法を提供する。
第2態様において、ターゲットセンテンスを受信するように構成されるターゲットセンテンス受信ユニットと、ターゲットセンテンス及び事前に設置された実体集合に基づいてターゲットセンテンスの第1ワードスロット識別結果を確定するように構成される第1ワードスロット識別ユニットと、ターゲットセンテンス及び事前にトレーニングされた、センテンスとワードスロット識別結果の対応関係を表すためのワードスロット識別モデルによって、ターゲットセンテンスの第2ワードスロット識別結果を確定するように構成される第2ワードスロット識別ユニットと、第1ワードスロット識別結果及び第2ワードスロット識別結果に基づいてターゲットワードスロット識別結果を確定するように構成される識別結果確定ユニットと、を含むワードスロットを識別するための装置を提供する。
第3態様において、少なくとも一つのプロセッサと、少なくとも一つのプロセッサと通信可能に接続されたメモリと、を備えるワードスロットを識別するための電子機器であって、メモリには、少なくとも一つのプロセッサによって実行可能な命令が格納され、命令は少なくとも一つのプロセッサによって実行されると、少なくとも一つのプロセッサに第1態様に記載の方法を実行させる、電子機器を提供する。
第4態様において、コンピュータ命令が格納されている非一時的なコンピュータ可読記憶媒体であって、コンピュータ命令はコンピュータに第1態様に記載の方法を実行させるために使用される、非一時的なコンピュータ可読記憶媒体を提供する。
第5態様において、コンピュータプログラムであって、コンピュータプログラムがプロセッサにより実行されると、第1態様に記載の方法を実現する、コンピュータプログラムを提供する。
本出願に係る技術によれば、ユーザーの設置した新たな実体ワードをリアルタイムに識別することが可能となり、大量のデータの収集、モデルのトレーニング、モデル効果の最適化等がしなくても、ユーザーのカスタマイズされた新たなワードをリアルタイムに識別することができ、即時性、正確性、利便性を持つ。
本出願に記載された内容は、本出願の実施形態の重要な特徴を特定することを意図するものではなく、また本出願の範囲を限定するためのものでもない。本出願の他の特徴は、以下の説明によって容易に理解されるであろう。
図面は本出願の解決手段をよりよく理解するために用いられ、本出願を限定するものではない。
図1は本出願の実施形態を適用することができる例示的なシステムアーキテクチャを示す図である。 図2は本出願によるワードスロットを識別するための方法の実施形態のフローチャートである。 図3は本出願によるワードスロットを識別するための方法の適用シナリオの概略図である。 図4は本出願によるワードスロットを識別するための方法の別の実施形態のフローチャートである。 図5は本出願によるワードスロットを識別するための装置の実施形態の概略構造図である。 図6は本出願の実施形態においてワードスロットを識別するための方法を実施するための電子機器のブロック図である。
以下は図面を参照して本出願の例示的な実施形態を説明し、ここでは理解しやすくするため、本出願の実施形態の様々な詳細が記載されるが、これらは単なる例示的なものに過ぎない。従って、本出願の要旨を逸脱しない範囲で当業者が本明細書の実施形態に対して様々な変更や修正を行うことができることは自明である。なお、以下の説明では、明確化及び簡略化のため、公知の機能及び構成に関する説明を省略する。
なお、本出願の実施例及び実施例における特徴は、矛盾を生じない限り、相互に組み合わせることができる。以下、添付図面及び実施例を参照しながら、本出願を詳細に説明する。
図1は、本出願のワードスロットを識別するための方法またはワードスロットを識別するための装置の実施形態を適用することができる例示的なシステムアーキテクチャ100を示している。
図1に示すように、システムアーキテクチャ100は、端末装置101、102、103、ネットワーク104、及びサーバ105を含む。ネットワーク104は、端末装置101、102、103とサーバ105との間の通信リンクのための媒体の役割を果たす。ネットワーク104は、有線、無線通信リンク、または光ファイバケーブルなどの接続タイプを含む。
ユーザーは、端末装置101、102、103を利用し、ネットワーク104を介してサーバ105と対話し、メッセージなどを送受信することができる。端末装置101、102、103には、音声識別アプリケーションなどの様々な通信クライアントアプリケーションをインストールすることができる。端末装置101、102、103は、マイクロホンアレイ等を備えることもできる。
端末装置101、102、103は、ハードウェアもしくはソフトウェアのいずれによっても実現可能である。端末装置101、102、103がハードウェアである場合、それらは、スマートフォン、タブレットコンピュータ、電子書籍リーダー、車載コンピュータ、ラップトップコンピュータ、デスクトップコンピュータ等を含むがこれらに限定されない様々な電子機器である。端末装置101、102、103がソフトウェアである場合、前記の電子機器に設置することができる。複数のソフトウェアまたはソフトウェアモジュールとして(例えば、分散型サービスを提供する)、または単一のソフトウェア、ソフトウェアモジュールとして実施できる。ここでは特に限定しない。
サーバ105は、様々なサービスを提供するサーバであり、例えば端末装置101、102、103によって送信されたターゲットセンテンスを処理するバックグラウンドサーバである。バックグラウンドサーバは、ワードスロット識別モデルまたは新しいワード集合を利用して、ターゲットセンテンスにおけるユーザーによって設定されたカスタマイズされたワードを確定し、カスタマイズされたワードに基づいて端末装置101、102、103にフィードバックすることができる。
なお、サーバ105は、ハードウェアもしくはソフトウェアのいずれによっても実現可能である。サーバ105がハードウェアである場合、複数のサーバから構成された分散型サーバクラスターとして、または単一のサーバとして実施することができる。サーバ105がソフトウェアである場合、複数のソフトウェアまたはソフトウェアモジュールとして(例えば、分散型サービスを提供するためのもの)、または単一のソフトウェア、ソフトウェアモジュールとして実施することもできる。ここでは特に限定しない。
なお、本出願の実施形態で提供されるワードスロットを識別するための方法は、通常はサーバ105によって実行される。そのため、ワードスロットを識別するための装置は、通常はサーバ105の中に設置される。
図1の端末装置、ネットワーク、及びサーバの数は、単なる例示であり、実装ニーズに応じて、端末装置、ネットワーク、及びサーバはいくつでも存在可能である。
図2は、本出願によるワードスロットを識別するための方法の実施形態のフロー200を示す。この実施形態におけるワードスロットを識別するための方法は、ステップ201〜204を含む。
ステップ201:ターゲットセンテンスを受信する。
本実施形態では、ワードスロットを識別するための方法の実行主体(例えば、図1に示されるサーバ105)が、有線または無線接続方法を通して、ターゲットセンテンスを受信することができる。前記ターゲットセンテンスは、ユーザーが端末を介して送信したものでも、実行主体が音声、ビデオ、または画像を処理して取得したものでもよい。例えば、ユーザーが端末を介して実行主体に音声を送信し、実行主体が前記音声に対して音声識別を行ってターゲットセンテンスを得ることができる。
ステップ202:ターゲットセンテンス及び事前に設置した実体集合に従って、ターゲットセンテンスの第1ワードスロット識別結果を確定する。
本実施形態では、ターゲットセンテンスを事前設定された実体集合と比較を行い、ターゲットセンテンスに実体集合内の実体が含まれるかどうかを判定する。含まれている場合、ターゲットセンテンスに含まれている実体集合内の実体に従って第1ワードスロット識別結果を生成することができる。含まれていない場合は、第1ワードスロット識別結果が空であると判断できる。前記実体集合には複数の実体が含まれる場合があり、これらの実体は、ユーザーのカスタム実体、または前記カスタム実体に基づいて生成された関連実体でもある。例えば、カスタム実体は「リビングルームにあるかわいいライト」であり、関連実体は「リビングルームのライト」または「かわいいライト」であり得る。
ステップ203:ターゲットセンテンス及び事前にトレーニングされたワードスロット識別モデルによって、ターゲットセンテンスの第2ワードスロット識別結果を確定する。
本実施形態では、ターゲットセンテンスを事前にトレーニングされたワードスロット識別モデルに入力することもできる。前記ワードスロット識別モデルはセンテンスとワードスロット識別結果の対応関係を表すために使用され得る。前記ワードスロット識別モデルは、大量の注釈データからトレーニングされたニューラルネットワークであり得る。ワードスロット識別モデルは、ターゲットセンテンスのワードスロット識別結果を出力することができる。ここで、そのワードスロット識別結果を第2ワードスロット識別結果とする。
ステップ204:第1ワードスロット識別結果及び第2ワードスロット識別結果に基づいてターゲットワードスロット識別結果を確定する。
本実施形態において、ターゲットワードスロット識別結果は、第1ワードスロット識別結果及び第2ワードスロット識別結果に基づいて確定されることができる。ターゲット識別結果は、第1ワードスロット識別結果、第2ワードスロット識別結果、またはそれらの組み合わせであり得る。
図3は、本出願によるワードスロットを識別するための方法の適用シナリオの概略図を示す。図3に示されるシナリオにおいて、ユーザは、スマート電灯301と対話することによってスマート電灯301を制御することができる。前記制御は、オン、オフ、ライト色の調整、明暗の調整などを含むことができる。ユーザーは、カスタム設定により、スマート電灯301の実体を「リビングルームにあるかわいいライト」として設定する。ユーザーがスマート電灯301に「リビングルームにあるかわいいライトをオンにしてください」という音声を発すると、スマート電灯301はその音声をサーバ302にアップロードでき、サーバ302はその音声に対して音声識別を実行し、次に取得されたターゲットセンテンスに対してワードスロット識別を実行して、「リビングルームにあるかわいいライト」であるワードスロット識別結果を得る。
本出願の前記実施形態によって提供されるワードスロットを識別するための方法は、ユーザーの設置した新たな実体ワードをリアルタイムに識別することが可能となり、大量のデータの収集、モデルのトレーニング、モデル効果の最適化等をしなくても、ユーザーのカスタマイズされた新たなワードをリアルタイムに識別することができ、即時性、正確性、利便性を持つ。
図4は、本出願によるワードスロットを識別するための方法の別の実施形態のフロー400を示す。図4に示されるように、本実施形態におけるワードスロットを識別するための方法は、ステップ401〜410を含む。
ステップ401:実体更新リクエストを受信する。
本実施形態では、実行主体が実体更新リクエストを受信することができる。前記実体更新リクエストは、ユーザーにより端末を介して送信したものであり得る。前記実体更新リクエストには、更新実体が含まれ得る。ここで、更新実体とは、ユーザーによって新たに追加された実体ワードを指す。
ステップ402:更新実体を実体集合にリアルタイムに同期させる。
実行主体は、実体更新リクエストを受信した後、それに含まれる更新実体を、データ即時同期サービスにより実体集合にリアルタイムに同期させることができる。データ即時同期サービスは、実体更新リクエストが受信された直後に、更新実体を実体集合に記憶できる。その処理速度は秒レベルに達するため、ユーザーが設定した新しい実体をリアルタイムに更新可能となる。データ即時同期サービスは、ユーザーの更新記録を保存することもできる。
ここで、実体集合は実行主体のメモリに保存され得る。実際に応用する際、データのセキュリティを確保するために、実行主体は実体集合のデータを定期的にハードディスクに書き込むことができる。こうすると、停電が発生した場合でも、データ即時同期サービスによりハードディスクから復元可能となる。
ステップ403:ターゲットセンテンスを受信する。
ステップ404:ターゲットセンテンスにおける実体言及(entity mention)を確定する。
本実施形態において、実行主体は、ターゲットセンテンスにおける実体言及を確定することができる。具体的には、実行主体がターゲットセンテンスに対して単語分割処理を行い、得られた各単語のうちの名詞を実体言及とすることができる。ターゲットセンテンスには一つの実体言及または複数の実体言及が含まれ得る。
ステップ405:実体集合には実体言及が含まれると判定されたことに応答して、実体言及を第1ワードスロット識別結果とする。
本実施形態では、実行主体は、実体集合から前記実体言及を検索することができ、実体集合には実体言及が含まれる場合、実体言及を第1ワードスロット識別結果とし、実体集合に実体言及が含まれていない場合、第1ワードスロット識別結果を空にしてもよい。
本実施形態のいくつかの選択可能な実施方法において、前記実体集合は、複数の実体部分集合を含み得、各実体部分集合は、1つのユーザー識別子に対応する。各実体部分集合には、少なくとも一つの実体が含まれる。実行主体は、ターゲットセンテンスに対応するターゲットユーザー識別子を確定することと、ターゲットユーザー識別子に対応する実体部分集合に実体言及が含まれていると判定されたことに応答して、実体言及を第1ワードスロット識別結果とすることとの手順によって第1ワードスロット識別結果を確定することができる。
本実施形態において、実行主体は、まずターゲットセンテンスに対応するターゲットユーザー識別子を確定することができる。具体的には、実行主体は、ターゲットセンテンスを送信する電子機器からターゲットユーザー識別子を取得することができる。次に、実行主体は、ターゲットユーザー識別子に対応する実体部分集合を確定することができる。そして、前記実体言及が該実体部分集合に含まれているかどうかを判断する。含まれている場合、実体言及を第1ワードスロット識別結果とし、含まれていない場合、第1ワードスロット識別結果が空であると判定できる。
本実施形態のいくつかの選択可能な実施方法において、実行主体は実体集合内の実体に対するユーザーの変更リクエストを受信することができる。前記変更リクエストには、変更前の実体と変更後の実体が含まれることができる。前記リクエストが受信された後、実行主体は実体集合内の実体を変更できる。
本実施形態のいくつかの選択可能な実施方法において、実行主体はまたユーザーのリクエストに応答して、そのユーザー識別子に対応する実体のリストをユーザーに送信することができる。
ステップ406:ターゲットセンテンス及び事前にトレーニングされたワードスロット識別モデルによって、ターゲットセンテンスの第2ワードスロット識別結果を確定する。
ステップ407:第1ワードスロット識別結果と第2ワードスロット識別結果が重ならないと判定されたことに応答して、第1ワードスロット識別結果をターゲットワードスロット識別結果とする。
本実施形態において、実行主体は、まず第1ワードスロット識別結果と第2ワードスロット識別結果が重なるかどうかを判定することができる。重なるとは、第1ワードスロット識別結果の少なくとも一つのワードと、第2ワードスロット識別結果の少なくとも一つのワードが少なくとも一つの文字を共通することを意味する。例えば、第1ワードスロット識別結果にはワードAとBが含まれ、第2ワードスロット識別結果にはワードCとDが含まれる。AとC、AとD、BとC、BとDの間にはいずれも同一の文字がない場合、第1ワードスロット識別結果と第2ワードスロット識別結果は重ならない。
ステップ408:第1ワードスロット識別結果が第2ワードスロット識別結果と重なると判定されたことに応答して、重なり部分に対応する二つのワードを確定する。
AとC、AとD、BとC、BとDのいずれかには共通文字が含まれる場合、第1ワードスロット識別結果は、第2ワードスロット識別結果と重なると見なされる。この場合、重なり部分に対応する二つのワードを確定することができる。
ステップ409:二つのワードのうちの文字数が多い方をターゲットワードとする。
実行主体は、前記二つのワードのうち、文字数が多い方をターゲットワードとすることができる。このようにして、複数のターゲットワードを取得できる。
ステップ410:得られた少なくとも一つのターゲットワードに基づいて、ターゲットワードスロット識別結果を確定する。
実行主体は、得られた各ターゲットワードをターゲットワードスロット識別結果とすることができる。
本出願の前記の実施形態によって提供されるワードスロットを識別するための方法は、ユーザーの提供した新たな実体ワードを即時(秒レベル)に記憶識別することが可能となり、大量のデータの収集、モデルのトレーニング、モデル効果の最適化等をしなくても、ユーザーのカスタマイズされたワードをリアルタイムに識別することができ、即時性、正確性、利便性を持つ。
さらに、図5は、前記の図に示される方法の実施として、ワードスロットを識別するための装置の実施形態を提供する。該装置の実施形態は、図2に示される方法の実施形態に対応する。具体的には、該装置はさまざまな電子機器に適用できる。
図5に示すように、本実施形態のワードスロット識別装置500は、ターゲットセンテンス受信ユニット501、第1ワードスロット識別ユニット502、第2ワードスロット識別ユニット503、及び識別結果確定ユニット504を含む。
ターゲットセンテンス受信ユニット501は、ターゲットセンテンスを受信するように構成される。
第1ワードスロット識別ユニット502は、ターゲットセンテンス及び事前に設置した実体集合に基づいて、ターゲットセンテンスの第1ワードスロット識別結果を確定するように構成される。
第2ワードスロット識別ユニット503は、ターゲットセンテンス及び事前にトレーニングされたワードスロット識別モデルによって、ターゲットセンテンスの第2ワードスロット識別結果を確定するように構成される。ワードスロット識別モデルは、センテンスとワードスロット識別結果の対応関係を表すために使用される。
識別結果確定ユニット504は、第1ワードスロット識別結果、第2ワードスロット識別結果に基づいてターゲットワードスロット識別結果を確定するように構成される。
本実施例のいくつかの選択可能な実施形態において、第1ワードスロット識別ユニット502は、図5に示されていない、実体言及確定モジュール及び第1ワードスロット識別モジュールを含み得る。
実体言及確定モジュールは、ターゲットセンテンス内の実体言及を確定するように構成される。
第1ワードスロット識別モジュールは、実体集合には実体言及が含まれると判定されたことに応答して、実体言及を第1ワードスロット識別結果とするように構成される。
本実施形態のいくつかの選択可能な実現形態において、実体集合は複数の実体部分集合を含み、単一の実体部分集合内の実体は同じユーザー識別子に対応する。第1ワードスロット識別モジュールはさらに、ターゲットセンテンスに対応するターゲットユーザー識別子を確定することと、ターゲットユーザー識別子に対応する実体部分集合には実体言及が含まれると確定されたことに応答して、実体言及を第1ワードスロット識別結果とすることとを行うように構成される。
本実施形態のいくつかの選択可能な実現形態において、識別結果確定ユニット504はさらに、第1ワードスロット識別結果と第2ワードスロット識別結果とが重ならないと判定されたことに応答して、第1ワードスロット識別結果をターゲットワードスロット識別結果とするように構成される。
本実施形態のいくつかの選択可能な実現形態において、第1ワードスロット識別結果には少なくとも一つのワードが含まれ、第2ワードスロット識別結果には少なくとも一つのワードが含まれる。識別結果確定ユニット504はさらに、第1ワードスロット識別結果が第2ワードスロット識別結果と重なると判定されたことに応答して、重なり部分に対応する二つのワードを確定し、二つのワードのうちの文字数が多い方をターゲットワードとし、得られた少なくとも一つのターゲットワードに基づいてターゲットワードスロット識別結果を確定するように構成される。
本実施形態のいくつかの選択可能な実現形態において、装置500は、実体更新リクエストを受信して更新実体を実体集合に即時に同期するように構成される即時同期ユニット(図示せず)をさらに含み得、ここで、実体更新リクエストには、更新実体が含まれる。
ワードスロットを識別するための装置500におけるユニット501から504は、図2に説明された方法の各ステップに対応することを理解されたい。従って、本明細書のワードスロットを識別するための方法についての前記操作及び特徴は、装置500及びそこに含まれるユニットにも適用可能であり、ここではその説明が繰り返さない。
本出願の実施形態により、電子機器及び読み取り可能な記憶媒体はさらに提供される。
図6に示したのは、本出願の実施形態に係るワードスロットを識別するための方法を実行する電子機器のブロック図である。電子機器は、ラップトップコンピューター、デスクトップコンピューター、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、メインフレームコンピューター、その他の適切なコンピューターなど、さまざまな形式のデジタルコンピューターを表す。電子機器は、パーソナルデジタル処理、携帯電話、スマートフォン、ウェアラブルデバイス、及びその他の同様のコンピューティングデバイスなど、様々な形式のモバイルデバイスを表すこともできる。ここに示されている構成要素、それらの接続と関係、及びそれらの機能は単なる例示であり、ここで説明及び/または必要とされるアプリケーションの実装を制限することを意図したものではない。
図6に示すように、電子機器は、一つまたは複数のプロセッサ601、メモリ602、各構成要素を接続するためのインターフェース(高速インターフェース、低速インターフェースを含む)によって構成される。各構成要素は、異なるバスを使用して相互に接続されており、共通マザーボードに設置されるか、もしくは必要に応じて他の方法で設置され得る。プロセッサは、電子機器で実行された命令を処理し、メモリに格納されている命令を処理して、GUIのグラフィック情報を外部入/出力装置(インターフェイスに結合された表示デバイスなど)に表示する。他の実施形態では、複数のプロセッサ及び/または複数のバスを、必要に応じて、複数のメモリとともに使用することができる。同様に、複数の電子機器と接続でき、各電子機器は必要な操作の一部を提供する(例えば、サーバアレイ、ブレードサーバのグループ、またはマルチプロセッサシステムとして)。図6では、一つのプロセッサ601を例とする。
メモリ602は、本出願によって提供される非一時的なコンピュータ可読記憶媒体である。前記メモリには少なくとも一つのプロセッサによって実行可能な命令が格納されるため、少なくとも一つのプロセッサに本出願で提供されるワードスロットを識別するための方法を実行させる。本出願の非一時的なコンピュータ可読記憶媒体は、コンピュータ命令を格納し、コンピュータ命令は本出願で提供されるワードスロットを識別するための方法をコンピュータに実行させるように使用される。
メモリ602は、非一時的なコンピュータ可読記憶媒体として、非一時的ソフトウェアプログラム、非一時的コンピュータ実行可能プログラムおよびモジュール、例えば本出願の実施形態におけるワードスロットを識別するための方法の実行に対応するプログラム命令/モジュールなどのモジュール(例えば、図5に示されるターゲットセンテンス受信ユニット501、第1ワードスロット識別ユニット502、第2ワードスロット識別ユニット503、および識別結果確定ユニット504)を格納するために使用される。プロセッサ601は、メモリ602に格納された非一時的ソフトウェアプログラム、命令、およびモジュールを実行することによって、サーバの様々な機能的アプリケーションおよびデータ処理を実行し、すなわち、前記の方法実施形態のワードスロットを識別するための方法を実施する。
メモリ602は、プログラム記憶領域およびデータ記憶領域を含み得る。プログラム記憶領域にはオペレーティングシステム、少なくとも一つの機能に必要なアプリケーションプログラムが保存され得る。データ記憶領域には、ワードスロットを識別するための電子機器の使用に従って作成されたデータなどを格納することができる。さらに、メモリ602は、高速ランダムアクセスメモリを含み得、また少なくとも一つの磁気ディスクメモリ、フラッシュメモリ、または他の非一時的ソリッドステートメモリなどの非一時的メモリを含み得る。いくつかの実施形態では、メモリ602は、任意選択で、プロセッサ601に遠隔的に設定されたメモリを含み得、これらの遠隔メモリは、ネットワークを介してワードスロットを識別するための方法を実行する電子機器に接続され得る。前記ネットワークの例には、インターネット、企業イントラネット、ローカルエリアネットワーク、モバイル通信ネットワーク、およびそれらの組み合わせが含まれるが、これらに限定されない。
ワードスロットを識別するための方法を実行する電子機器は、入力装置603および出力装置604をさらに含み得る。プロセッサ601、メモリ602、入力装置603、出力装置604は、バスまたは他の方法で接続することができる。図6では、バスによる接続を例とする。
入力装置603は、入力された数字または文字情報を受信し、ワードスロットを識別するための電子機器のユーザ設定および機能制御に関連するキー信号入力を生成することができる。例えば、タッチスクリーン、キーパッド、マウス、トラックパッド、タッチパッド、ポインティングスティック、一つまたは複数のマウスボタン、トラックボール、ジョイスティック、その他の入力装置を含む。出力装置604は、表示装置、補助照明装置(例えば、LED)、触覚フィードバック装置(例えば振動モーター)などを含む。該表示装置は、液晶ディスプレイ(LCD)、発光ダイオード(LED)ディスプレイ、およびプラズマディスプレイを含むがこれらに限定されない。いくつかの実施形態では、表示装置はタッチスクリーンであってもよい。
本出願のシステムおよび技術の実施形態は、デジタル電子回路システム、集積回路システム、特定用途向け集積回路(Application Specific Integrated Circuit,ASIC)、コンピュータハードウェア、ファームウェア、ソフトウェア、および/またはそれらの組み合わせで実施することができる。これらの各実施形態は、以下を含む。一つ以上のコンピュータプログラムに実施され、一つ以上のコンピュータプログラムは、少なくとも一つのプログラマブルプロセッサ、プログラム可能なプロセッサを含むプログラム可能なシステム上で実行および/または解釈される。プログラマブルプロセッサは、専用または汎用のプログラマブルプロセッサであり、ストレージシステム、少なくとも一つの入力装置、および少なくとも一つの出力装置からデータと命令を受信し、データと命令を記憶システム、少なくとも一つの入力装置、および少なくとも一つの出力装置に伝送することを含み得る。
これらのコンピュータプログラムは、プログラム、ソフトウェア、ソフトウェアアプリケーション又はコードとも呼ばれ、プログラマブルプロセッサの機械命令を含み、且つ高度プロセス及び/又はオブジェクト指向のプログラミング言語、及び/又はアセンブリ言語/機械語を利用して実現することができる。ここで、「機械可読媒体」及び「コンピュータ可読媒体」という用語は、機械指令及び/又はデータをプログラマブルプロセッサに供給するための任意のコンピュータプログラム製品、装置、及び/又はデバイス(たとえば、磁気ディスク、光ディスク、メモリ、プログラマブルロジックデバイス(PLD))を意味し、機械可読信号である機械指令を受信する機械可読媒体を含む。「機械可読信号」という用語は、機械指令および/またはデータをプログラマブルプロセッサに供給するための任意の信号を意味する。
ユーザとのインタラクションを提供するために、ここで説明するシステムと技術は、ユーザに情報を表示するための表示装置(例えば、陰極線管(Cathode Ray Tube,CRT)またはLCD(液晶ディスプレイ)モニタ)と、キーボード及びポインティングデバイス(例えば、マウスまたはトラックボール)とを備えるコンピュータ上で実現することができ、ユーザが該キーボード及び該ポインティングデバイスを介してコンピュータに入力を提供できる。他の種類の装置は、さらにユーザとのインタラクションを提供することに用いることができる。例えば、ユーザに提供されるフィードバックは、例えば、視覚フィードバック、聴覚フィードバック、又は触覚フィードバックであるいかなる形態のセンシングフィードバックであってもよく、且つ音入力、音声入力又は、触覚入力を含むいかなる形態でユーザからの入力を受信してもよい。
ここで説明したシステム及び技術は、バックグラウンドコンポーネントを含むコンピューティングシステム(例えば、データサーバ)に実施されてもよく、又はミドルウェアコンポーネントを含むコンピューティングシステム(例えば、アプリケーションサーバ)に実施されてもよく、又はフロントエンドコンポーネントを含むコンピューティングシステム(例えば、グラフィカルユーザインタフェース又はウェブブラウザを有するユーザコンピュータ)に実施されてもよく、ユーザーは該グラフィカルユーザインタフェース又はウェブブラウザを介してここで説明したシステム及び技術の実施形態とインタラクションしてもよく、又はこのようなバックグラウンドコンポーネント、ミドルウェアコンポーネント又はフロントエンドコンポーネントのいずれかの組み合わせを含むコンピューティングシステムに実施されてもよい。また、システムの各構成要素間は、通信ネットワーク等の任意の形態または媒体を介してデジタルデータ通信により接続されていてもよい。通信ネットワークとしては、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)、インターネット、ブロックチェーンネットワーク等が挙げられる。
コンピュータシステムは、クライアントとサーバとを含んでもよい。クライアントとサーバは、通常、互いに離れており、通信ネットワークを介してインタラクションを行う。クライアントとサーバとの関係は、互いにクライアント−サーバの関係を有するコンピュータプログラムをそれぞれのコンピュータ上で動作することによって生成される。
本出願の実施形態により、ユーザーの設置した新たな実体ワードを識別することが可能となり、大量のデータの収集、モデルのトレーニング、モデル効果の最適化等をしなくても、ユーザーのカスタマイズされた新たなワードを識別することができ、即時性、正確性、利便性を持つ。
なお、上述した様々な形態のフローを用いて、ステップを改めて並び替え、追加または削除を行うことができる。例えば、本出願に記載された各ステップは、本出願に開示された技術案の所望の結果が達成できる限り、並行して実行されてもよいし、順番に実行されてもよいし、異なる順序で実行されてもよい。本明細書はここで制限しない。
上記具体的な実施形態は、本出願の保護範囲を限定するものではない。設計要件および他の要因に従って、様々な修正、組み合わせ、再組合、および置換を行うことができることを当業者は理解すべきである。本出願の精神および原理内で行われたあらゆる補正、同等置換および改善などは、いずれも本出願の保護範囲内に含まれるべきである。

Claims (15)

  1. ターゲットセンテンスを受信することと、
    前記ターゲットセンテンス及び事前に設置された実体集合に基づいて前記ターゲットセンテンスの第1ワードスロット識別結果を確定することと、
    前記ターゲットセンテンス及び事前にトレーニングされた、センテンスとワードスロット識別結果の対応関係を表すためのワードスロット識別モデルによって、前記ターゲットセンテンスの第2ワードスロット識別結果を確定することと、
    前記第1ワードスロット識別結果及び前記第2ワードスロット識別結果に基づいてターゲットワードスロット識別結果を確定することと、
    を含むワードスロットを識別するための方法。
  2. 前記ターゲットセンテンス及び事前に設置された実体集合に基づいて前記ターゲットセンテンスの第1ワードスロット識別結果を確定することは、
    前記ターゲットセンテンスにおける実体言及を確定することと、
    前記実体集合に前記実体言及が含まれていると判定されたことに応答して、前記実体言及を前記第1ワードスロット識別結果とすることと、を含む請求項1に記載の方法。
  3. 前記実体集合には複数の実体部分集合が含まれ、単一の実体部分集合内の実体は同じユーザー識別子に対応しており、
    前記実体集合に前記実体言及が含まれていると判定されたことに応答して、前記実体言及を前記第1ワードスロット識別結果とすることは、
    前記ターゲットセンテンスに対応するターゲットユーザー識別子を確定することと、
    前記ターゲットユーザー識別子に対応する実体部分集合に前記実体言及が含まれていると判定されたことに応答して、前記実体言及を前記第1ワードスロット識別結果とすることと、を含む、請求項2に記載の方法。
  4. 前記第1ワードスロット識別結果及び前記第2ワードスロット識別結果に基づいてターゲットワードスロット識別結果を確定することは、
    前記第1ワードスロット識別結果と前記第2ワードスロット識別結果とが重ならないと判定されたことに応答して、前記第1ワードスロット識別結果を前記ターゲットワードスロット識別結果とすることを含む、請求項1に記載の方法。
  5. 前記第1ワードスロット識別結果は少なくとも一つのワードを含み、前記第2ワードスロット識別結果は少なくとも一つのワードを含み、
    前記第1ワードスロット識別結果及び前記第2ワードスロット識別結果に基づいてターゲットワードスロット識別結果を確定することは、
    前記第1ワードスロット識別結果と前記第2ワードスロット識別結果とが重なっていると判定されたことに応答して、重なり部分に対応する二つのワードを確定することと、
    前記二つのワードのうちの、文字数が多い方をターゲットワードとすることと、
    得られた少なくとも一つのターゲットワードに基づいてターゲットワードスロット識別結果を確定することと、を含む、請求項1に記載の方法。
  6. 前記方法は、
    更新実体を含む実体更新リクエストを受信することと、
    前記更新実体を前記実体集合に即時同期することと、を更に含む、請求項1〜5のいずれか一項に記載の方法。
  7. ターゲットセンテンスを受信するように構成されるターゲットセンテンス受信ユニットと、
    前記ターゲットセンテンス及び事前に設置された実体集合に基づいて前記ターゲットセンテンスの第1ワードスロット識別結果を確定するように構成される第1ワードスロット識別ユニットと、
    前記ターゲットセンテンス及び事前にトレーニングされた、センテンスとワードスロット識別結果の対応関係を表すためのワードスロット識別モデルによって、前記ターゲットセンテンスの第2ワードスロット識別結果を確定するように構成される第2ワードスロット識別ユニットと、
    前記第1ワードスロット識別結果及び前記第2ワードスロット識別結果に基づいてターゲットワードスロット識別結果を確定するように構成される識別結果確定ユニットと、を含むワードスロットを識別するための装置。
  8. 前記第1ワードスロット識別ユニットは、
    前記ターゲットセンテンスにおける実体言及を確定するように構成される実体言及確定モジュールと、
    前記実体集合には前記実体言及が含まれると判定されたことに応答して、前記実体言及を前記第1ワードスロット識別結果とするように構成される第1センテンススロット識別モジュールと、を含む請求項7に記載の装置。
  9. 前記実体集合には複数の実体部分集合が含まれ、単一の実体部分集合内の実体は同じユーザー識別子に対応しており、
    前記第1ワードスロット識別モジュールはさらに、
    前記ターゲットセンテンスに対応するターゲットユーザー識別子を確定し、
    前記ターゲットユーザー識別子に対応する実体部分集合に前記実体言及が含まれていると判定されたことに応答して、前記実体言及を前記第1ワードスロット識別結果とするように構成される、請求項8に記載の装置。
  10. 前記識別結果確定ユニットはさらに、
    前記第1ワードスロット識別結果と前記第2ワードスロット識別結果とが重ならないと判定されたことに応答して、前記第1ワードスロット識別結果を前記ターゲットワードスロット識別結果とするように構成される、請求項7に記載の装置。
  11. 前記第1ワードスロット識別結果は少なくとも一つのワードを含み、前記第2ワードスロット識別結果は少なくとも一つのワードを含み、
    前記識別結果確定ユニットは、さらに
    前記第1ワードスロット識別結果と前記第2ワードスロット識別結果とが重なっていると判定されたことに応答して、重なり部分に対応する二つのワードを確定し、
    前記二つのワードのうちの、文字数が多い方をターゲットワードとし、
    得られた少なくとも一つのターゲットワードに基づいてターゲットワードスロット識別結果を確定する、ように構成される請求項7に記載の装置。
  12. 更新実体を含む実体更新リクエストを受信し、
    前記更新実体を前記実体集合に即時同期する、ように構成される即時同期ユニットをさらに含む、請求項7〜11のいずれか一項に記載の装置。
  13. 少なくとも一つのプロセッサと、
    前記少なくとも一つのプロセッサと通信可能に接続されたメモリと、を備えるワードスロットを識別するための電子機器であって、
    前記メモリには、前記少なくとも一つのプロセッサによって実行可能な命令が格納され、前記命令は前記少なくとも一つのプロセッサによって実行されると、前記少なくとも一つのプロセッサに請求項1〜6のいずれか一項に記載の方法を実行させる、電子機器。
  14. コンピュータ命令が格納されている非一時的なコンピュータ可読記憶媒体であって、
    前記コンピュータ命令はコンピュータに請求項1〜6のいずれか一項に記載の方法を実行させるために使用される、非一時的なコンピュータ可読記憶媒体。
  15. コンピュータプログラムであって、
    前記コンピュータプログラムがプロセッサにより実行されると、請求項1〜6のいずれか一項に記載の方法を実現する、コンピュータプログラム。
JP2021032216A 2020-06-10 2021-03-02 ワードスロットを識別するための方法及び装置、電子機器、記憶媒体並びにコンピュータプログラム Active JP7200277B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202010523633.6 2020-06-10
CN202010523633.6A CN111681647B (zh) 2020-06-10 2020-06-10 用于识别词槽的方法、装置、设备以及存储介质

Publications (2)

Publication Number Publication Date
JP2021197153A true JP2021197153A (ja) 2021-12-27
JP7200277B2 JP7200277B2 (ja) 2023-01-06

Family

ID=72435431

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021032216A Active JP7200277B2 (ja) 2020-06-10 2021-03-02 ワードスロットを識別するための方法及び装置、電子機器、記憶媒体並びにコンピュータプログラム

Country Status (5)

Country Link
US (1) US20210390254A1 (ja)
EP (1) EP3822812A1 (ja)
JP (1) JP7200277B2 (ja)
KR (1) KR20210035784A (ja)
CN (1) CN111681647B (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112507712B (zh) * 2020-12-11 2024-01-26 北京百度网讯科技有限公司 建立槽位识别模型与槽位识别的方法、装置
CN113657110A (zh) * 2021-08-10 2021-11-16 阿波罗智联(北京)科技有限公司 信息处理方法、装置和电子设备
CN113869046B (zh) * 2021-09-29 2022-10-04 阿波罗智联(北京)科技有限公司 一种自然语言文本的处理方法、装置、设备及存储介质
CN117275471A (zh) * 2022-06-13 2023-12-22 华为技术有限公司 处理语音数据的方法及终端设备
CN115965018B (zh) * 2023-01-04 2024-04-26 北京百度网讯科技有限公司 信息生成模型的训练方法、信息生成方法和装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014102280A (ja) * 2012-11-16 2014-06-05 Ntt Docomo Inc 機能実行指示システム、機能実行指示方法及び機能実行指示プログラム
US20160154792A1 (en) * 2014-12-01 2016-06-02 Microsoft Technology Licensing, Llc Contextual language understanding for multi-turn language tasks

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02165388A (ja) * 1988-12-20 1990-06-26 Toshiba Corp パターン認識方式
US5685000A (en) * 1995-01-04 1997-11-04 U S West Technologies, Inc. Method for providing a linguistically competent dialogue with a computerized service representative
EP1135768B1 (en) * 1999-09-29 2008-01-23 Koninklijke Philips Electronics N.V. Spell mode in a speech recognizer
US7299180B2 (en) * 2002-12-10 2007-11-20 International Business Machines Corporation Name entity extraction using language models
US8364481B2 (en) * 2008-07-02 2013-01-29 Google Inc. Speech recognition with parallel recognition tasks
US7933777B2 (en) * 2008-08-29 2011-04-26 Multimodal Technologies, Inc. Hybrid speech recognition
KR20140080089A (ko) * 2012-12-20 2014-06-30 삼성전자주식회사 음성인식장치 및 음성인식방법, 음성인식장치용 데이터 베이스 및 음성인식장치용 데이터 베이스의 구축방법
CN103077714B (zh) * 2013-01-29 2015-07-08 华为终端有限公司 信息的识别方法和装置
US10224030B1 (en) * 2013-03-14 2019-03-05 Amazon Technologies, Inc. Dynamic gazetteers for personalized entity recognition
JP2015049254A (ja) * 2013-08-29 2015-03-16 株式会社日立製作所 音声データ認識システム及び音声データ認識方法
US10180937B2 (en) * 2017-02-16 2019-01-15 International Business Machines Corporation Cognitive entity reference recognition
KR102289917B1 (ko) * 2017-06-30 2021-08-12 삼성에스디에스 주식회사 화행 정보를 이용한 대화 처리 방법 및 그 장치
CN108257593B (zh) * 2017-12-29 2020-11-13 深圳和而泰数据资源与云技术有限公司 一种语音识别方法、装置、电子设备及存储介质
JP2019179116A (ja) * 2018-03-30 2019-10-17 富士通株式会社 音声理解プログラム、音声理解装置および音声理解方法
US11094317B2 (en) * 2018-07-31 2021-08-17 Samsung Electronics Co., Ltd. System and method for personalized natural language understanding
US11132509B1 (en) * 2018-12-03 2021-09-28 Amazon Technologies, Inc. Utilization of natural language understanding (NLU) models
CN110020429B (zh) * 2019-02-27 2023-05-23 阿波罗智联(北京)科技有限公司 语义识别方法及设备
US11789945B2 (en) * 2019-04-18 2023-10-17 Sap Se Clause-wise text-to-SQL generation
CN110111787B (zh) * 2019-04-30 2021-07-09 华为技术有限公司 一种语义解析方法及服务器
CN110413756B (zh) * 2019-07-29 2022-02-15 北京小米智能科技有限公司 自然语言处理的方法、装置及设备
KR20190098928A (ko) * 2019-08-05 2019-08-23 엘지전자 주식회사 음성 인식 방법 및 장치
US11183194B2 (en) * 2019-09-13 2021-11-23 International Business Machines Corporation Detecting and recovering out-of-vocabulary words in voice-to-text transcription systems
CN110704592B (zh) * 2019-09-27 2021-06-04 北京百度网讯科技有限公司 语句分析处理方法、装置、计算机设备和存储介质
KR20190118995A (ko) * 2019-10-01 2019-10-21 엘지전자 주식회사 음성 처리 방법 및 음성 처리 장치
CN111178077B (zh) * 2019-12-26 2024-02-02 深圳市优必选科技股份有限公司 一种语料生成方法、语料生成装置及智能设备
CN111222323B (zh) * 2019-12-30 2024-05-03 深圳市优必选科技股份有限公司 一种词槽抽取方法、词槽抽取装置及电子设备
CN111241826B (zh) * 2020-01-09 2023-07-25 深圳前海微众银行股份有限公司 实体名称识别方法、装置、设备及存储介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014102280A (ja) * 2012-11-16 2014-06-05 Ntt Docomo Inc 機能実行指示システム、機能実行指示方法及び機能実行指示プログラム
US20160154792A1 (en) * 2014-12-01 2016-06-02 Microsoft Technology Licensing, Llc Contextual language understanding for multi-turn language tasks

Also Published As

Publication number Publication date
CN111681647A (zh) 2020-09-18
KR20210035784A (ko) 2021-04-01
CN111681647B (zh) 2023-09-05
JP7200277B2 (ja) 2023-01-06
EP3822812A1 (en) 2021-05-19
US20210390254A1 (en) 2021-12-16

Similar Documents

Publication Publication Date Title
JP7200277B2 (ja) ワードスロットを識別するための方法及び装置、電子機器、記憶媒体並びにコンピュータプログラム
JP2021197137A (ja) モデルを訓練するための方法、装置、電子機器、記憶媒体およびコンピュータプログラム
JP6922538B2 (ja) Api学習
WO2020186904A1 (zh) 文本适配显示方法、装置、电子设备、服务器及存储介质
KR102565360B1 (ko) 지도 서비스 테스트 방법 및 장치
US10255265B2 (en) Process flow diagramming based on natural language processing
JP2021197133A (ja) 意味マッチング方法、装置、電子機器、記憶媒体及びコンピュータプログラム
US10706085B2 (en) Method and system for exposing virtual assistant services across multiple platforms
CN110321544B (zh) 用于生成信息的方法和装置
CN110795910B (zh) 一种文本信息处理方法、装置、服务器及存储介质
CN110134702A (zh) 数据流拼接方法、装置、设备和存储介质
JP2022031625A (ja) 情報をプッシュするための方法および装置、電子機器、記憶媒体並びにコンピュータプログラム
US20230289514A1 (en) Speech recognition text processing method and apparatus, device, storage medium, and program product
CN114117190A (zh) 数据处理方法、装置、存储介质及电子设备
JP2022518645A (ja) 映像配信時効の決定方法及び装置
CN113190517B (zh) 数据集成方法、装置、电子设备和计算机可读介质
JP2022006166A (ja) 地図上の目的地の決定方法、機器、及び記憶媒体
JP2022091686A (ja) データ注釈方法、装置、電子機器および記憶媒体
KR102440635B1 (ko) 음성 패킷 녹취 기능의 안내 방법, 장치, 기기 및 컴퓨터 저장 매체
CN111625250B (zh) 应用更新方法、装置、存储介质及电子设备
JP6986590B2 (ja) 音声スキル作成方法、音声スキル作成装置、電子機器及び記憶媒体
KR20090000199A (ko) 웹 서버 어플리케이션 프레임워크와 상기 프레임워크를이용한 웹 어플리케이션 처리 방법 및 이를 구현할 수 있는컴퓨터로 읽을 수 있는 기록 매체
WO2023169193A1 (zh) 用于生成智能合约的方法和装置
JP2021120899A (ja) ユーザ識別方法、装置、記憶媒体及び電子機器
EP3896614A2 (en) Method and apparatus for labeling data

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210302

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220418

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220531

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220829

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221220

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221221

R150 Certificate of patent or registration of utility model

Ref document number: 7200277

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150