JP7308910B2

JP7308910B2 - 単語スロットの認識方法、装置及び電子機器

Info

Publication number: JP7308910B2
Application number: JP2021197897A
Authority: JP
Inventors: チン，ライ; ソン，フゥフェン; ソン，シュキ; ディン，シンゼ
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2020-12-25
Filing date: 2021-12-06
Publication date: 2023-07-14
Anticipated expiration: 2041-12-06
Also published as: CN112632987A; JP2022031863A; CN112632987B; US20220005461A1

Description

本願は、コンピュータ技術の分野に関し、具体的には、自然言語処理、深層学習等の人工知能技術の分野に関し、特に、単語スロットの認識方法、装置、電子機器及び記憶媒体に関する。

人工知能技術及び理念の出現に伴い、多くの製品はいずれも対話式のヒューマンマシンインタラクション形態を採用し、製品の体験を向上させることを期待している。１つのヒューマンマシン対話システムを構成するために、まず対話意図と単語スロットを定義する必要がある。対話意図は、対話システムが理解する必要のあるユーザニーズであり、単語スロットは、ユーザの対話意図を満たす時のキー情報又は限定条件であり、ユーザに提供する必要のあるスクリーニング条件であると理解することができる。ここで、様々な単語スロットに対する一般化認識技術は、現在研究のキーである。

本願は、単語スロットの認識方法、装置及び電子機器を提供する。

本願の第１態様によれば、単語スロットの認識方法を提供し、取得された入力文に応答して、前記入力文に含まれる各第１単語及び各第１単語に対応する品詞を決定するステップと、前記各第１単語に対応する品詞に基づいて、前記入力文における各第１単語を組み合わせて、前記入力文に含まれる候補単語スロットセグメントを取得するステップと、予め設定された単語スロットライブラリをクエリして、前記候補単語スロットセグメントにおける第１単語と前記単語スロットライブラリの各参照単語スロットにおける第２単語との間のマッチング度を決定するステップと、各前記候補単語スロットセグメントにおける第１単語と各前記参照単語スロットにおける第２単語との間のマッチング度に基づいて、前記候補単語スロットセグメントに含まれるターゲット単語スロット及び前記ターゲット単語スロットの単語スロット名を決定するステップと、を含む。

本願の第２態様によれば、単語スロットの認識装置を提供し、取得された入力文に応答して、前記入力文に含まれる各第１単語及び各第１単語に対応する品詞を決定するための第１決定モジュールと、前記各第１単語に対応する品詞に基づいて、前記入力文における各第１単語を組み合わせて、前記入力文に含まれる候補単語スロットセグメントを取得するための第１取得モジュールと、予め設定された単語スロットライブラリをクエリして、前記候補単語スロットセグメントにおける第１単語と前記単語スロットライブラリの各参照単語スロットにおける第２単語との間のマッチング度を決定するための第２決定モジュールと、各前記候補単語スロットセグメントにおける第１単語と各前記参照単語スロットにおける第２単語との間のマッチング度に基づいて、前記候補単語スロットセグメントに含まれるターゲット単語スロット及び前記ターゲット単語スロットの単語スロット名を決定するための第３決定モジュールと、を含む。

本願の第３態様によれば、電子機器を提供し、少なくとも１つのプロセッサと、前記少なくとも１つのプロセッサと通信可能に接続されたメモリと、を含み、前記メモリには、前記少なくとも１つのプロセッサによって実行可能な命令が記憶され、前記命令は、前記少なくとも１つのプロセッサが前述した一態様の実施例に記載の単語スロットの認識方法を実行できるように、前記少なくとも１つのプロセッサによって実行される。

本願の第４態様によれば、コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体を提供し、前記コンピュータ命令は、コンピュータに前述した一態様の実施例に記載の単語スロットの認識方法を実行させる。

本願の第５態様によれば、コンピュータプログラムを提供し、前記コンピュータプログラムがプロセッサに実行される場合、上述した一態様の実施例に記載の単語スロットの認識方法を実現する。

本文に説明された内容は、本願の実施例における肝心な又は重要な特徴を示すためのものではなく、本願の範囲を制限するためのものでもないと理解すべきである。本願の他の特徴は、以下の明細書からわかりやすくなる。

図面は、本技術的解決手段をよりよく理解するために用いられ、本願を限定するものではない。
本願の実施例により提供される単語スロットの認識方法の概略フローチャートである。本願の実施例により提供される予め設定された単語スロットライブラリを構築する概略フローチャートである。本願の実施例により提供されるターゲット単語スロット及びターゲット単語スロットの単語スロット名を決定する概略フローチャートである。本願の実施例により提供される予め設定された単語スロットライブラリを充実させる概略フローチャートである。本願の実施例により提供される同義語モデルを訓練する概略フローチャートである。本願の実施例により提供される単語スロットの認識装置の概略構造図である。本願の実施例に係る単語スロットの認識方法を実現するための電子機器のブロック図である。

以下、図面と組み合わせて本願の例示的な実施例を説明し、理解を容易にするために、その中には本願の実施例の様々な詳細事項が含まれており、それらは単なる例示的なものと見なされるべきである。したがって、当業者は、本願の範囲及び精神から逸脱することなく、ここで説明される実施例に対して様々な変更と修正を行うことができる。同様に、わかりやすく且つ簡潔にするために、以下の説明では、周知の機能及び構造の説明を省略する。

ＡＩ（ＡｒｔｉｆｉｃｉａｌＩｎｔｅｌｌｉｇｅｎｃｅ、人工知能）は、コンピュータに人間のある思考過程と知能行動（例えば、学習、推理、思考、計画など）をシミュレートさせることを研究する学科であり、ハードウェアレベルの技術とソフトウェアレベルの技術の両方がある。人工知能のハードウェア技術は、一般的には、センサ、専用人工知能チップ、クラウドコンピューティング、分散型ストレージ、ビッグデータ処理などの技術を含む。人工知能のソフトウェア技術は、主に、コンピュータビジョン技術、音声認識技術、自然言語処理技術及び機械学習／深層学習、ビッグデータ処理技術、知識マップ技術等のいくつかの主要な方向を含む。

深層学習は、機械学習分野における新たな研究方向であり、それは機械学習に導入されてそれを最初の目標－人工知能に近づかせ、人工知能技術の発展に伴い、ＮＬＰ（ＮａｔｕｒａｌＬａｎｇｕａｇｅＰｒｏｃｅｓｓｉｎｇ、自然言語処理）技術、深層学習技術を使用してテキストの誤りを訂正する方式が益々広くなり、ＮＬＰはコンピュータ科学分野及び人工知能分野における１つの重要な方向であり、それは人間とコンピュータとの間で自然言語を使用して効率的な通信を行うことを実現できる様々な理論と方法を研究している。深層学習は、サンプルデータの固有法則と表現レベルを学習することであり、これらの学習プロセスで取得された情報は、文字、画像及び音声などのデータの解釈に大きく寄与し、その最終的な目標は、マシンが人間のように分析と学習の能力を有し、文字、画像及び音声などのデータを認識できるようにすることである。

ＡＩ技術及び理念の出現に伴い、多くの製品はいずれも対話式のヒューマンマシンインタラクション形態を採用し、製品の体験を向上させることを期待している。１つのヒューマンマシン対話システムを構成するために、まず対話意図と単語スロットを定義する必要がある。対話意図は、対話システムが理解する必要のあるユーザニーズであり、単語スロットは、ユーザの対話意図を満たす時のキー情報又は限定条件であり、ユーザに提供する必要のあるスクリーニング条件であると理解することができる。天気を調べることを例として、ユーザが「北京の天気」を聞くと、対話意図は「天気を調べる」ことであり、対話の単語スロットは「北京」であり、ユーザに「北京」の天気を提供する必要がある。ユーザが「明日の気温」を聞くと、その意図が「気温を調べる」ことであり、対話の単語スロットは「明日」であり、「明日」の気温を提供する必要がある。ここで、様々な単語スロットに対する一般化認識は、現在研究のキーである。

関連技術において、開発者が単語スロットを定義した後、大量の単語スロット名を構成する必要がある。対話の単語スロットの認識は、開発者によって構成された単語スロット名に依存し、単語スロット名を構成する主な方法は、人工的な充実によって単語スロットライブラリを継続的に更新することである。天気を調べることを例として、開発者は、全ての地名及び時間並びにそれらの様々な言い方又は表現を収集する必要がある。「北京市海淀区」及びその同義の言い方を同じ地名として認識しようとする場合、開発者は「北京市海淀」、「北京海淀区」、「北京海淀」等の同義語を挙げてはじめて、正確に認識することができる。このステップは開発者にとって作業負荷が大きく、且つある言い方又は表現を漏れやすく、対話能力の低下を引き起こす。

従って、本願の実施例は、単語スロットの認識方法、装置及び電子機器を提供する。本願の実施例は、入力文における各単語に対応する品詞に基づいて、入力文における各単語を組み合わせて、入力文に含まれる候補単語スロットセグメントを取得し、さらに候補単語スロットセグメントにおける第１単語と、単語スロットライブラリにおける各参照単語スロットにおける第２単語との間のマッチング度を決定し、該マッチング度に基づいて候補単語スロットセグメントに含まれるターゲット単語スロット及びターゲット単語スロットの単語スロット名を決定し、各単語スロットの認識の精度を確保するだけでなく、大量の単語スロットを構成する必要がなく、単語スロットを構成するコストを効果的に低減させ、開発者の作業負荷を軽減させることができる。

以下、図面を参照しながら本願の実施例に係る単語スロットの認識方法、装置及び電子機器について説明する。

図１は、本願の実施例により提供される単語スロットの認識方法の概略フローチャートである。

なお、本願の実施例に係る単語スロットの認識方法の実行本体は、電子機器であってもよく、具体的には、電子機器はサーバ、端末であってもよいが、これらに限定されず、端末はパソコン、スマートフォン、ＩＰＡＤ等であってもよいが、これらに限定されない。

図１に示すように、該単語スロットの認識方法は、ステップＳ１０１～Ｓ１０４を含む。

Ｓ１０１において、取得された入力文に応答して、入力文に含まれる各第１単語及び各第１単語に対応する品詞を決定する。

本願の実施例において、入力文は、ユーザによって入力されたテキスト情報であってもよいし、ユーザによって入力された音声情報を変換して得られたテキスト情報であってもよく、該入力文は、段落であってもよく、入力文の長さ、タイプは限定されない。ここで、入力文における各単語を第１単語として定義する。

具体的には、ユーザの入力文が取得された後、単語分割、品詞タグ付け等の前処理により、その中の各第１単語及び各単語に対応する品詞を決定することができる。なお、品詞には内容語（名詞、動詞、形容詞、数量詞、代名詞など）及び機能語（前置詞、接続詞、助詞、感動詞、擬声語など）が含まれる。

例えば、入力文「北京海淀の気温をクエリしてください」の中に、第１単語は「北京」、「海淀」、「気温」及び「クエリ」を含み、「クエリ」の品詞は動詞であり、「北京」、及び「海淀」の品詞は名詞であり、「気温」の品詞も名詞である。

Ｓ１０２において、各第１単語に対応する品詞に基づいて、入力文における各第１単語を組み合わせて、入力文に含まれる候補単語スロットセグメントを取得する。

具体的には、入力文に含まれる各第１単語及び各第１単語に対応する品詞が決定された後、入力文における単語スロットの認識を容易にするために、各第１単語に対応する品詞に基づいて、入力文における各第１単語を組み合わせて、候補単語スロットセグメントを取得する。

例えば、名詞の品詞に基づいて第１単語「北京」及び「海淀」を組み合わせて、得られた候補単語スロットセグメントが「北京海淀」である。なお、名詞「気温」を組み合わせない理由は、「気温」が対話の単語スロットではなく、ユーザの意図を表すためである。

本願の実施例において、候補単語スロットセグメントの決定手段は複数種類あり、異なる決定手段は異なる候補単語スロットセグメントに対応する可能性があり、すなわち候補単語スロットセグメントは１つである可能性もあり、複数である可能性もある。

候補単語スロットセグメントが１つである場合、該候補単語スロットセグメントはターゲット単語スロットであり、該候補単語スロットセグメントの単語スロット名は単語スロット名である。候補単語スロットセグメントが複数である場合、以下のステップＳ１０３及びＳ１０４に基づいて複数の候補単語スロットセグメントから１つのターゲット単語スロット及びそれに対応する単語スロット名を決定する必要がある。

Ｓ１０３において、予め設定された単語スロットライブラリをクエリして、候補単語スロットセグメントにおける第１単語と単語スロットライブラリの各参照単語スロットにおける第２単語との間のマッチング度を決定する。

本願の実施例において、図２に示すように、開発者は少数の単語スロットを予め構成し、サーバが開発者で構成された単語スロットを取得した後、各単語スロットをに対して単語分割、品詞タグ付けなどの前処理を行ってから、単語スロットライブラリにインポートすることにより、単語スロットライブラリの構築を実現し、後続の単語スロットの認識の基礎とする。

ここで、参照単語スロットとは、予め設定された単語スロットライブラリにおける単語スロットを指し、第２単語とは、該単語スロットに含まれる単語を指す。予め設定された単語スロットライブラリは複数の参照単語スロットを含み、各参照単語スロットは少なくとも１つの第２単語及び各第２単語の品詞を含む。

具体的には、第１単語で構成された候補単語スロットセグメントが決定された後、候補単語スロットセグメントに対する意味理解に基づいて、予め設定された単語スロットライブラリをクエリして、ヒューリスティックルールを利用して、候補単語スロットセグメントにおける第１単語と単語スロットライブラリにおける各参照単語スロットにおける第２単語との間のマッチング度を決定する。すなわち、単語スロットライブラリにｎ個の参照単語スロットがあると仮定すると、各第１単語と１個目の参照単語スロットにおける各第２単語との間のマッチング度を決定し、各第１単語と２個目の参照単語スロットにおける各第２単語との間のマッチング度を決定し、……、各第１単語とｎ個目の参照単語スロットにおける各第２単語との間のマッチング度を決定する。

なお、マッチング度が高いほど、第１単語と第２単語との間の類似度が高いことを示す。マッチング度が０であることは、第１単語と第２単語とが完全に類似せず、両者がマッチングしないことを示す。マッチング度が１であることは、第１単語と第２単語とがマッチングすることを示す。

例えば、第１単語「北京」と第２単語「北京市」との間の類似度が比較的高いため、両者がマッチングする。第１単語「北京」と第２単語「上海」とはマッチングしない。

Ｓ１０４において、各候補単語スロットセグメントにおける第１単語と各参照単語スロットにおける第２単語との間のマッチング度に基づいて、候補単語スロットセグメントに含まれるターゲット単語スロット及びターゲット単語スロットの単語スロット名を決定する。

ここで、ターゲット単語スロットとは、認識する必要のある入力文における単語スロットを指し、単語スロット名は、単語スロットがある分野、単語スロットの目的地又は単語スロットのタイプ等を示す名称を表してもよい。例えば、ターゲット単語スロットが「北京海淀」である場合、ターゲット単語スロットの単語スロット名は場所である。ターゲット単語スロットが「明日」である場合、ターゲット単語スロットの単語スロット名は時間である。ターゲット単語スロットが「張三」である場合、ターゲット単語スロットの単語スロット名は人名である。

具体的には、各候補単語スロットセグメントにおける第１単語と各参照単語スロットにおける第２単語との間のマッチング度が決定された後、該マッチング度に基づいて、第１単語とマッチングする第２単語及び第２単語が位置する参照単語スロットを取得し、該候補単語スロットセグメントはターゲット単語スロットである。

本願の実施例において、予め設定された単語スロットライブラリには各参照単語スロットの単語スロット名が含まれる可能性があり、この場合、参照単語スロットの単語スロット名に基づいてターゲット単語スロットの単語スロット名を決定することができる。予め設定された単語スロットライブラリには各参照単語スロットの単語スロット名が含まれない可能性もあり、この場合、決定されたターゲット単語スロットを分析することによってターゲット単語スロットの単語スロット名を決定することができる。

例えば、ユーザが「北京海淀の天気をクエリする」という文を入力した場合、「北京」、及び「海淀」の名詞品詞に基づいて、それらを候補単語スロットセグメント「北京海淀」として組み合わせ、そして候補単語スロットセグメントに基づいて予め設定された単語スロットライブラリをクエリして、「北京海淀」とのマッチング度が最も高い「北京市海淀区」という参照単語スロットを取得し、さらにターゲット単語スロットが「北京海淀」であると決定し、該ターゲット単語スロットの単語スロット名は地名である。

上記ステップを実行することにより、開発者が単語スロット「北京市海淀区」のみを構成した場合、「北京海淀」、「海淀」等という「海淀区」の様々な単語スロットの言い方を認識し、ある単語スロットの漏れを回避し、それによって認識能力を向上させる。

本願の実施例に係る単語スロットの認識方法は、入力文における候補単語スロットセグメントの単語と、単語スロットライブラリにおける単語との間のマッチング度に基づいて、候補単語スロットセグメントにおける単語スロットの認識を行い、単語スロットの認識精度を確保するだけでなく、大量の単語スロットを構成する必要がなく、単語スロットを構成するコストを効果的に低減させ、開発者の作業負荷を軽減させ、開発者が単語スロットの認識能力を向上させるために協力し、さらに対話システムの体験を向上させる。

上記ステップＳ１０２において、各第１単語に対応する品詞に基づいて候補単語スロットセグメントを決定する場合、品詞が名詞である第１単語を組み合わせてもよく、または品詞が名詞である各単語の重要性に基づいて組み合わせ、すなわち重要度が高く、且つ品詞が名詞である第１単語を組み合わせてもよく、又は、接続詞で接続された２つの第１単語を組み合わせてもよく、それによって組み合わせられた候補単語スロットセグメントを取得する。

すなわち、本願の一実施例において、上記ステップＳ１０２は、入力文における品詞が名詞である少なくとも２つの隣接する第１単語を組み合わせて、入力文における１つの候補単語スロットセグメントを生成すること、又は、入力文における品詞が接続詞である第１単語に隣接する２つの第１単語を組み合わせて、入力文における１つの候補単語スロットセグメントを生成することを含むことができる。

具体的には、入力文に含まれる各第１単語及び各第１単語に対応する品詞が決定された後、品詞が名詞である全ての第１単語を取得し、そのうちの少なくとも２つの隣接する第１単語を取得し、該少なくとも２つの隣接する第１単語を組み合わせて、１つの候補単語スロットセグメントを生成することができる。

例えば、ユーザが「北京市海淀区の天気をクエリする」という文を入力した場合、その中の「北京」、及び「海淀」という２つの名詞を取得し、該２つの名詞が隣接しているため、それらを１つの候補単語スロットセグメント「北京海淀」として組み合わせる。

又は、入力文に含まれる各第１単語及び各第１単語に対応する品詞が決定された後、品詞が名詞である第１単語Ｂを取得し、接続詞Ｂに隣接する２つの第１単語Ａ、Ｃを取得し、２つの第１単語Ａ、Ｃを組み合わせて、１つの候補単語スロットセグメントを生成する。

例えば、ユーザが「北京市と上海市の天気をクエリする」という文を入力した場合、その中の接続詞「と」を取得し、該接続詞に隣接する２つの第１単語「北京」、及び「上海」を取得し、それらを１つの候補単語スロットセグメント「北京上海」として組み合わせる。

なお、本願の実施例では、候補単語スロットセグメントを決定する時、いずれかの方式で決定してもよく、確実な候補単語スロットを決定することができればよく、本願の実施例における上記決定方式であってもよいが、これらに限定されない。

これにより、各第１単語に対応する品詞に基づいて候補単語スロットセグメントを決定し、候補単語スロットセグメントを取得する信頼性を確保し、単語スロットの認識効率を向上させることができる。

候補単語スロットセグメントが決定された後、各候補単語スロットセグメントにおける第１単語と単語スロットライブラリの各参照単語スロットにおける第２単語との間のマッチング度を決定し、該マッチング度に基づいて候補単語スロットセグメントに含まれるターゲット単語スロット及びターゲット単語スロットの単語スロット名を決定する。

以下、３つの実施例を通じて、如何にマッチング度に基づいてターゲット単語スロット及びターゲット単語スロットの単語スロット名を決定するかについて説明する。

本願の一実施例において、上記ステップＳ１０４は、いずれかの候補単語スロットセグメントにおける各第１単語が、それぞれいずれかの参照単語スロットにおける第２単語とマッチングする場合、いずれかの候補単語スロットセグメントがターゲット単語スロットであると決定し、対応する単語スロット名がいずれかの参照単語スロットの単語スロット名であると決定することを含むことができる。

本願の実施例において、「いずれか」は、「そのうちの１つ」の意味を表し、「各」を意味するものではない。

具体的には、各候補単語スロットセグメントにおける各第１単語と各参照単語スロットにおける各第２単語との間のマッチング度が決定された後、そのうちの１つの候補単語スロットセグメントにおける各第１単語が、それぞれ単語スロットライブラリの中の１つの参照単語スロットにおける第２単語とマッチングすると判断される場合、該候補単語スロットセグメントがターゲット単語スロットであると決定し、対応する単語スロット名が該参照単語スロットの単語スロット名であると決定する。

例えば、候補単語スロットセグメントＭ「北京海淀」における各第１単語が、それぞれ単語スロットライブラリにおける参照単語スロットＮ「北京市海淀区」における第２単語とマッチングする（北京が北京市とマッチングし、海淀が海淀区とマッチングする）と判断される場合、候補単語スロットセグメントＭがターゲット単語スロットであると決定し、対応する単語スロット名が地名であると決定する。

これにより、マッチング度に基づいて候補単語スロットセグメントに含まれるターゲット単語スロット及びターゲット単語スロットの単語スロット名を決定することで、開発者が少数の単語スロットを構成するだけで、ユーザの各種類の話し言葉のような言い方を認識することができ、対話システムの体験を向上させる。

本願の他の実施例において、上記ステップＳ１０４は、各第２単語の対応する参照単語スロットにおける重み値を取得することと、いずれかの参照単語スロットにいずれかの候補単語スロットセグメントにおける各第１単語が含まれ、いずれかの参照単語スロットにあるが、いずれかの候補単語スロットにない第２単語の重み値が第１閾値より小さい場合、いずれかの候補単語スロットセグメントがターゲット単語スロットであると決定し、対応する単語スロット名がいずれかの参照単語スロットの単語スロット名であると決定することと、を含むことができる。

ここで、第２単語の対応する参照単語スロットにおける重み値は該第２単語の対応する参照単語スロットにおける重要度（すなわち果たす役割の大きさ）を表し、開発者によって実際の状況に応じて設定されたものであってもよく、実行本体によって参照単語スロットにおける全ての単語を分析処理して得られたものであってもよい。なお、参照単語スロットにおける各第２単語の重み値の合計は１である。

なお、重み値が第１閾値より小さい場合、該重み値に対応する第２単語の参照単語スロットにおける重要度が低く、無視してもよいことを示す。重み値が第１閾値以上である場合、該重み値に対応する第２単語の参照単語スロットにおける重要度が高く、無視しないことを示す。

具体的には、各候補単語スロットセグメントにおける各第１単語と各参照単語スロットにおける各第２単語との間のマッチング度が決定された後、各第２単語の対応する参照単語スロットにおける重み値を取得して、各第２単語の対応する参照単語スロットにおける重要度を取得し、そのうちの１つの参照単語スロットＥにいずれかの候補単語スロットセグメントＦにおける各第１単語が含まれると判断される場合、そのうちの１つの参照単語スロットＥにあるが、いずれかの候補単語スロットセグメントＦにない第２単語を取得し、該第２単語の重み値が第１閾値より小さい場合、該候補単語スロットセグメントＦがターゲット単語スロットであると決定し、対応する単語スロット名が該参照単語スロットＥの単語スロット名であると決定する。

例えば、参照単語スロットＥが「北京市海淀区中心路」であり、候補単語スロットセグメントＦが「北京海淀」であり、すなわち参照単語スロットＥには候補単語スロットセグメントＦにおける各第１単語「北京」及び「海淀」が含まれ、そこで参照単語スロットＥにあるが、候補単語スロットセグメントＦにない第２単語「中心路」を取得し、該「中心路」の参照単語スロットＥにおける重み値を取得し、該重み値が第１閾値（０．２）より小さい場合、候補単語スロットセグメントＦがターゲット単語スロットであると決定し、対応する単語スロット名が地名であると決定する。

これにより、ターゲット単語スロットの認識を行う場合、参照単語スロットにおける第２単語の重み値を考慮し、参照単語スロットに候補単語スロットにおける全ての単語が含まれる場合、単語スロットのマッチングを行うことができず、さらに単語スロットを正確に認識できないという現象を回避し、単語スロットの認識の精度を向上させる。

本願の別の実施例において、図３に示すように、上記ステップＳ１０４は、ステップＳ３０１～Ｓ３０３を含むことができる。

Ｓ３０１において、各候補単語スロットセグメントにおける第１単語と各参照単語スロットにおける第２単語との間のマッチング度に基づいて、候補単語スロットセグメントに対応する少なくとも１つの関連参照単語スロットを決定する。

具体的には、いずれかの第１単語がいずれかの第２単語とマッチングする場合、いずれかの第２単語が位置する参照単語スロットが候補単語スロットセグメントの１つの関連参照単語スロットであると決定し、該関連参照単語スロットと候補単語スロットセグメントとのマッチング度が０より大きく、且つ１以下である。なお、マッチング度が１に等しい場合、関連参照単語スロットと候補単語スロットセグメントとがマッチングする（その中の単語及びその品詞もマッチングする）。

なお、参照単語スロットが複数であり、各参照単語スロットに複数の第２単語が含まれるため、候補単語スロットセグメントの少なくとも１つの関連参照単語スロットを決定することができる。

Ｓ３０２において、候補単語スロットセグメントと各関連参照単語スロットとの間でマッチングしない第１単語又は第２単語の候補単語スロットセグメント及び関連参照単語スロットにおける重み値をそれぞれ決定する。

具体的には、候補単語スロットセグメントにおける、関連参照単語スロットにおける第２単語とマッチングしない第１単語を決定し、該第１単語の候補単語スロットセグメントにおける重み値を決定する。又は、関連参照単語スロットにおける、候補単語スロットセグメントにおける第１単語とマッチングしない第２単語を決定し、該第２単語の関連参照単語スロットにおける重み値を決定する。

Ｓ３０３において、各関連参照単語スロットに対応する重み値に基づいて、候補単語スロットセグメント及び関連参照単語スロットに対してフィルタリングを行って、候補単語スロットセグメントに含まれるターゲット単語スロット及びターゲット単語スロットの単語スロット名を決定する。

具体的には、重み値の低い関連参照単語スロットを除去して、候補単語スロットセグメントに含まれるターゲット単語スロット及びターゲット単語スロットの単語スロット名を決定する。

例えば、候補単語スロットセグメントにおける第１単語は、「北京海淀」及び「海淀」を含み、「北京海淀」に基づいて検索された関連参照単語スロットには「北京市海淀区」及び「北京市」が含まれ、「海淀」に基づいて、検索された関連参照単語スロットは「北京市海淀区」であり、「北京」という単語の重み値が高いため、候補単語スロットセグメントにおける「海淀」が除去され、「海淀」という単語の重み値も高いため、関連参照単語スロットにおける「北京市」も除去され、それによって候補単語スロットセグメントに含まれるターゲット単語スロットが「北京市海淀区」であることを取得する。

これにより、重み値に基づいて候補単語スロットセグメント及び関連参照単語スロットに対してフィルタリングを行って、ターゲット単語スロットを取得し、単語スロットの認識の精度をさらに向上させる。

以上のように、予め設定された単語スロットライブラリを基礎としてユーザの入力文における単語スロットを如何に認識することを説明し、該部分の方法は実行本体によってオンラインで実現されることができ、単語スロットライブラリの精度を確保するために、単語スロットライブラリに対する充実と拡張を、オフラインで行うことができ、従って、マニュアルで行うことができ、それによってリソースを節約するだけでなく、さらに精度も確保する。次に、単語スロットライブラリの構築又は拡張を如何に行うかについて説明する。

図４に示すように、本願の一実施例において、単語スロットの認識方法は、ステップＳ４０１～Ｓ４０４をさらに含む。

Ｓ４０１において、予め設定された単語スロットライブラリにおける第１参照単語スロット、第１参照単語スロットに含まれる各第３単語及び各第３単語の品詞を取得する。

本願の実施例において、予め設定された単語スロットライブラリにおける全ての参照単語スロットを第１参照単語スロットとして定義し、第１単語スロットライブラリにおける全ての単語を第３単語として定義する。予め設定された単語スロットライブラリには少数（少なくとも１つ）の第１参照単語スロットが含まれている。

具体的には、単語スロットを認識する必要がある場合、予め設定された単語スロットライブラリにおける第１参照単語スロット、第１参照単語スロットに含まれる各第３単語及び各第３単語の品詞を取得し、後に使用するために備える。

Ｓ４０２において、第１参照単語スロットを同義語モデルに入力して、第２参照単語スロット及び第２参照単語スロットにおける各第４単語の品詞を生成する。

本願の実施例において、同義語モデルは開発者によって事前に訓練されたものであり、図５に示すように、その訓練方式は、まず、履歴累積同義語データをクリーニングして、コーパス内の非中国語コーパスを除去し、データを整列させ、同義語ペアにおいて入力された単語の長さが予測された単語の長さ以上であることを確保する。次に、クリーニングされたコーパスを長短期記憶ネットワーク及び注意力メカニズムアルゴリズムによって訓練する。モデルが収束した後、同義語モデルを取得する。同義語モデルは、単語スロットを入力とし、単語スロットの略語同義語を出力とする。

具体的には、訓練された同義語モデルが取得され、単語スロットライブラリにおける第１参照単語スロット、第１参照単語スロットに含まれる各第３単語及び各第３単語の品詞が取得された後、全ての第１参照単語スロットをモデルの入力として、同義語モデルに入力し、さらに同義語モデルによって第１参照単語スロットと同義である第２参照単語スロットを出力し、第２参照単語スロット及び第２参照単語スロットにおける各第４単語の品詞を取得する。

なお、第１参照単語スロットが少なくとも１つであるため、それと同義である第２参照単語スロットも少なくとも１つである。少なくとも１つの第２参照単語スロットが第１参照単語スロットの同義語候補である。

Ｓ４０３において、各第３単語と各第４単語との間のマッチング度、及び各第３単語の品詞と対応する各第４単語の品詞との間のマッチング度に基づいて、第２参照単語スロットの信頼度を決定する。

具体的には、第１参照単語スロットに含まれる各第３単語及び各第３単語の品詞と、第２参照単語スロットにおける各第４単語の品詞とが取得された後、各第３単語と各第４単語との間のマッチング度を決定するとともに、各第３単語の品詞と対応する各第４単語の品詞との間のマッチング度を決定する。マッチング度に基づいて、第２参照単語スロットの信頼度を決定する。

ここで、信頼度とは信頼できる程度であり、信用度とも呼ばれることができる。マッチング度が高いほど、信頼度が高くなり、マッチング度が１である（即ちマッチングする）場合、信頼度は１である。

Ｓ４０４において、第２参照単語スロットの信頼度が第２閾値より大きい場合、第２参照単語スロット、第４単語及び各第４単語の品詞を予め設定された単語スロットライブラリに追加する。

具体的には、第２参照単語スロットの信頼度が取得された後、信頼度の大きさを判断し、信頼度が第２閾値より大きい場合、モデルから出力された第２参照単語スロットが信頼できることを示し、そこで第２参照単語スロット、第４単語及び各単語の品詞を予め設定された単語スロットライブラリに追加し、単語スロットライブラリの充実を実現する。

なお、第２参照単語スロットの信頼度が第２閾値以下である場合、入力された第１参照単語スロットの重要な部分が出力結果に失われ、すなわち第２参照単語スロットを信頼できないことを示し、そこで該第２参照単語スロットをフィルタリングする。

すなわち、開発者によって少数の単語スロットが構成された後、これらの単語スロットをモデルの入力として、同義語モデルに入力し、モデルの出力を取得し、モデルの出力結果が同義語候補であり、また候補を除去し、開発者によって構成された単語スロットの同義語を取得し、さらに該同義語を予め設定された単語スロットライブラリに追加して、単語スロットライブラリの充実を実現する。

例えば、開発者が「北京市海淀区」を構成し、それを同義語モデルに入力し、同義語モデルは「北京海淀」、「北京海淀区」を出力する可能性があり、また「北京市中関村」を出力する可能性もあり、開発者は必要に応じて必要な単語スロットを選択して単語スロットライブラリに追加し、充実のコストを削減することができる。

これにより、モデル推薦により、開発者が参照単語スロットを充実させるコストを効果的に節約し、対話システムの認識能力を向上させ、モデルの精度をさらに向上させ、充実のコストを削減することができる。

本願の実施例は、単語スロットの認識装置をさらに提供し、図６は本願の実施例により提供される単語スロットの認識装置の概略構造図である。

図６に示すように、該単語スロットの認識装置６００は、第１決定モジュール６１０、第１取得モジュール６２０、第２決定モジュール６３０及び第３決定モジュール６４０を含む。

ここで、第１決定モジュール６１０は、取得された入力文に応答して、前記入力文に含まれる各第１単語及び各第１単語に対応する品詞を決定する。第１取得モジュール６２０は、前記各第１単語に対応する品詞に基づいて、前記入力文における各第１単語を組み合わせて、前記入力文に含まれる候補単語スロットセグメントを取得する。第２決定モジュール６３０は、予め設定された単語スロットライブラリをクエリして、前記候補単語スロットセグメントにおける第１単語と前記単語スロットライブラリの各参照単語スロットにおける第２単語との間のマッチング度を決定する。第３決定モジュール６４０は、各前記候補単語スロットセグメントにおける第１単語と各前記参照単語スロットにおける第２単語との間のマッチング度に基づいて、前記候補単語スロットセグメントに含まれるターゲット単語スロット及び前記ターゲット単語スロットの単語スロット名を決定する。

本願の一実施例において、前記第１取得モジュール６２０は、前記入力文における品詞が名詞である少なくとも２つの隣接する第１単語を組み合わせて、前記入力文における１つの候補単語スロットセグメントを生成するための第１組み合わせユニット、又は、前記入力文における品詞が接続詞である第１単語に隣接する２つの第１単語を組み合わせて、前記入力文における１つの候補単語スロットセグメントを生成するための第２組み合わせユニット、を含む。

本願の一実施例において、前記第３決定モジュール６４０は、いずれかの候補単語スロットセグメントにおける各第１単語が、それぞれいずれかの参照単語スロットにおける第２単語とマッチングする場合、前記いずれかの候補単語スロットセグメントがターゲット単語スロットであると決定し、対応する単語スロット名が前記いずれかの参照単語スロットの単語スロット名であると決定するための第１決定ユニットを含むことができる。

本願の一実施例において、前記第３決定モジュール６４０は、各第２単語の対応する参照単語スロットにおける重み値を取得するための第１取得ユニットと、いずれかの参照単語スロットにいずれかの候補単語スロットセグメントにおける各第１単語が含まれ、前記いずれかの参照単語スロットにあるが、前記いずれかの候補単語スロットセグメントにない第２単語の重み値が第１閾値より小さい場合、前記いずれかの候補単語スロットセグメントがターゲット単語スロットであると決定し、対応する単語スロット名が前記いずれかの参照単語スロットの単語スロット名であると決定するための第２決定ユニットと、を含むことができる。

本願の一実施例において、前記第３決定モジュール６４０は、各前記候補単語スロットセグメントにおける第１単語と各前記参照単語スロットにおける第２単語との間のマッチング度に基づいて、前記候補単語スロットセグメントに対応する少なくとも１つの関連参照単語スロットを決定するための第３決定ユニットと、前記候補単語スロットセグメントと各前記関連参照単語スロットとの間でマッチングしない第１単語又は第２単語の前記候補単語スロットセグメント及び前記関連参照単語スロットにおける重み値をそれぞれ決定するための第４決定ユニットと、各前記関連参照単語スロットに対応する前記重み値に基づいて、前記候補単語スロットセグメント及び前記関連参照単語スロットに対してフィルタリングを行って、前記候補単語スロットセグメントに含まれるターゲット単語スロット及び前記ターゲット単語スロットの単語スロット名を決定するための第５決定ユニットと、を含むことができる。

本願の一実施例において、単語スロットの認識装置は、前記予め設定された単語スロットライブラリにおける第１参照単語スロット、前記第１参照単語スロットに含まれる各第３単語及び各第３単語の品詞を取得するための第２取得モジュールと、前記第１参照単語スロットを同義語モデルに入力して、第２参照単語スロット及び前記第２参照単語スロットにおける各第４単語の品詞を生成するための第１生成モジュールと、
各前記第３単語と各前記第４単語との間のマッチング度、及び前記各第３単語の品詞と対応する前記各第４単語の品詞との間のマッチング度に基づいて、前記第２参照単語スロットの信頼度を決定するための第４決定モジュールと、前記第２参照単語スロットの信頼度が第２閾値より大きい場合、前記第２参照単語スロット、前記第４単語及び各前記第４単語の品詞を前記予め設定された単語スロットライブラリに追加するための第１追加モジュールと、をさらに含むことができる。

なお、本願の実施例に係る単語スロットの認識装置の他の具体的な実施形態は前述した単語スロットの認識方法の具体的な実施形態を参照することができ、重複を避けるため、ここでは説明を省略する。

本願の実施例に係る単語スロットの認識装置は、入力文における候補単語スロットセグメントの単語と、単語スロットライブラリにおける単語との間のマッチング度に基づいて、候補単語スロットセグメントにおける単語スロットの認識を行い、単語スロットの認識の精度を確保するだけでなく、さらに大量の単語スロットを構成する必要がなく、単語スロットを構成するコストを効果的に低減させ、開発者の作業負荷を軽減させることができる。

本願の実施例によれば、本願は、単語スロットの認識方法の電子機器、読み取り可能な記憶媒体をさらに提供する。以下、図７と組み合わせて説明する。
本願の実施例によれば、本願は、コンピュータプログラムを提供し、前記コンピュータプログラムがプロセッサに実行される場合、本願の実施例により提供される単語スロットの認識方法を実現する。

図７に示すように、本願の実施例に係る単語スロットの認識方法の電子機器のブロック図である。電子機器は、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、メインフレームコンピュータ、及び他の適切なコンピュータ等の様々な形態のデジタルコンピュータを表すことを目的とする。電子機器は、パーソナルデジタルプロセッサ、携帯電話、スマートフォン、ウェアラブルデバイス、他の類似するコンピューティングデバイス等の様々な形態のモバイルデバイスを表すこともできる。本明細書で示されるコンポーネント、それらの接続と関係、及びそれらの機能は単なる例であり、本明細書の説明及び／又は要求される本願の実現を制限することを意図したものではない。

図７に示すように、機器７００は、読み取り専用メモリ（ＲＯＭ）７０２に記憶されているコンピュータプログラム又は記憶ユニット７０８からランダムアクセスメモリ（ＲＡＭ）７０３にロードされたコンピュータプログラムに応じて、各種類の適切な動作及び処理を実行できる計算ユニット７０１を含む。ＲＡＭ７０３には、機器７００の動作に必要な様々なプログラム及びデータも記憶されてもよい。計算ユニット７０１、ＲＯＭ７０２、及びＲＡＭ７０３は、バス７０４を介して相互に接続されている。入力／出力（Ｉ／Ｏ）インターフェース７０５もバス７０４に接続されている。機器７００における複数のコンポーネントは、Ｉ／Ｏインターフェース７０５に接続され、キーボード、マウス等の入力ユニット７０６と、様々なタイプのディスプレイ、スピーカ等の出力ユニット７０７と、磁気ディスク、光ディスク等の記憶ユニット７０８と、ネットワークカード、モデム、無線通信トランシーバー等の通信ユニット７０９と、を含む。通信ユニット７０９は、機器７００がインターネットのようなコンピュータネットワーク及び／又は様々な電気通信ネットワークを介して、他の機器と情報／データを交換することを可能にする。

計算ユニット７０１は、処理及びコンピューティング機能を備える様々な汎用及び／又は専用処理コンポネントであってもよい。計算ユニット７０１のいくつかの例としては、中央処理ユニット（ＣＰＵ）、グラフィックス処理ユニット（ＧＰＵ）、様々な専用の人工知能（ＡＩ）コンピューティングチップ、各種類の機械学習モデルアルゴリズムを実行する様々な計算ユニット、デジタル信号プロセッサ（ＤＳＰ）、及び任意の適切なプロセッサ、コントローラ、マイクロコントローラ等が挙げられるが、これらに限定されない。計算ユニット７０１は、上述した各方法及び処理、たとえば、単語スロットの認識方法を実行する。例えば、いくつかの実施例において、単語スロットの認識方法は、記憶ユニット７０８のような機械読み取り可能な媒体に有形に含まれるコンピュータソフトウェアプログラムとして実現されてもよい。いくつかの実施例において、コンピュータプログラムの一部又は全部は、ＲＯＭ７０２及び／又は通信ユニット７０９を介して、機器７００にロード及び／又はインストールされることができる。コンピュータプログラムがＲＡＭ７０３にロードされ、計算ユニット７０１によって実行される場合、上述した単語スロットの認識方法の１つ又は複数のステップを実行することができる。選択的に、他の実施例において、計算ユニット７０１は、単語スロットの認識方法を実行するように、他の任意の適切な形態（例えば、ファームウェアを介する）によって構成されてもよい。

本明細書で説明されるシステムと技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、特定用途向け集積回路（ＡＳＩＣ）、専用標準製品（ＡＳＳＰ）、システムオンチップ（ＳＯＣ）、ロードプログラマブルロジックデバイス（ＣＰＬＤ）、コンピュータハードウェア、ファームウェア、ソフトウェア、及び／又はそれらの組み合わせで実現することができる。これらの様々な実施形態は、１つ又は複数のコンピュータプログラムで実施され、当該１つ又は複数のコンピュータプログラムは、少なくとも１つのプログラマブルプロセッサを含むプログラマブルシステムで実行及び／又は解釈されることができ、当該プログラマブルプロセッサは、専用又は汎用のプログラマブルプロセッサであってもよく、ストレージシステム、少なくとも１つの入力装置、及び少なくとも１つの出力装置からデータ及び命令を受信し、データ及び命令を当該ストレージシステム、当該少なくとも１つの入力装置、及び当該少なくとも１つの出力装置に送信することができる。

本願の方法を実施するためのプログラムコードは、１つ又は複数のプログラミング言語の任意の組み合わせを用いて記述することができる。これらのプログラムコードを汎用コンピュータ、専用コンピュータ、又はその他のプログラマブルデータ処理装置のプロセッサ又はコントローラに提供できるため、プログラムコードがプロセッサ又はコントローラによって実行されると、フローチャート及び／又はブロック図に規定された機能／操作が実行されるようになる。プログラムコードは、完全に機械上で実行され、一部が機械上で実行されることができ、独立したソフトウェアパッケージとして、一部が機械上で実行され且つ一部が遠隔機械上で実行され、又は完全に遠隔機械又はサーバ上で実行されてもよい。

本願の文脈において、機械読み取り可能な媒体は、命令実行システム、装置、又は機器によって使用されるか、又は命令実行システム、装置、又は機器と組み合わせて使用されるプログラムを含むか又は記憶することができる有形媒体であってもよい。機械読み取り可能な媒体は、機械読み取り可能な信号媒体又は機械読み取り可能な記憶媒体であってもよい。機械読み取り可能な媒体は、電子的、磁気的、光学的、電磁的、赤外線、又は半導体システム、装置又は機器、又は上記内容の任意の組み合わせを含むことができるが、これらに限定されない。機械読み取り可能な記憶媒体のより具体的な例は、１つ又は複数のラインに基づく電気的接続、ポータブルコンピュータディスク、ハードディスク、ランダムアクセスメモリ（ＲＡＭ）、読み取り専用メモリ（ＲＯＭ）、消去可能プログラマブル読み取り専用メモリ（ＥＰＲＯＭ又はフラッシュメモリ）、光ファイバ、ポータブルコンパクトディスク読み取り専用メモリ（ＣＤ－ＲＯＭ）、光ストレージデバイス、磁気ストレージデバイス、又は前述した内容の任意の適切な組み合わせを含む。

ユーザとのインタラクションを提供するために、ここで説明されているシステム及び技術をコンピュータで実施することができ、当該コンピュータは、ユーザに情報を表示するためのディスプレイ装置（例えば、ＣＲＴ（陰極線管）又はＬＣＤ（液晶ディスプレイ）モニタ）と、キーボード及びポインティングデバイス（例えば、マウス又はトラックボール）とを有し、ユーザは、当該キーボード及び当該ポインティングデバイスによって入力をコンピュータに提供することができる。他の種類の装置も、ユーザとのインタラクションを提供することができ、例えば、ユーザに提供されるフィードバックは、任意の形態のセンシングフィードバック（例えば、視覚フィードバック、聴覚フィードバック、又は触覚フィードバック）であってもよく、任意の形態（音響入力と、音声入力と、触覚入力とを含む）でユーザからの入力を受信することができる。

ここで説明されるシステム及び技術は、バックエンドコンポーネントを含むコンピューティングシステム（例えば、データサーバとする）、又はミドルウェアコンポーネントを含むコンピューティングシステム（例えば、アプリケーションサーバ）、又はフロントエンドコンポーネントを含むコンピューティングシステム（例えば、グラフィカルユーザインターフェース又はウェブブラウザを有するユーザコンピュータであり、ユーザは、当該グラフィカルユーザインターフェース又は当該ウェブブラウザによってここで説明されるシステム及び技術の実施形態とインタラクションする）、又はこのようなバックエンドコンポーネントと、ミドルウェアコンポーネントと、フロントエンドコンポーネントの任意の組み合わせを含むコンピューティングシステムで実施することができる。任意の形態又は媒体のデジタルデータ通信（例えば、通信ネットワーク）によってシステムのコンポネントを相互に接続することができる。通信ネットワークの例は、ローカルエリアネットワーク（ＬＡＮ）と、ワイドエリアネットワーク（ＷＡＮ）と、インターネットと、ブロックチェーンネットワークと、を含む。

コンピュータシステムは、クライアントとサーバとを含むことができる。クライアントとサーバは、一般に、互いに離れており、通常に通信ネットワークを介してインタラクションする。対応するコンピュータ上で実行され、且つ互いにクライアント－サーバの関係を有するコンピュータプログラムによって、クライアントとサーバとの関係が生成される。サーバはクラウドサーバであってもよく、クラウドコンピューティングサーバ又はクラウドホストコンピュータと呼ばれるクラウドコンピューティングサービスシステムにおけるホスト製品であってもよく、従来の物理ホストとＶＰＳ（ＶｉｒｔｕａｌＰｒｉｖａｔｅＳｅｒｖｅｒ、仮想プライベートサーバ）サービスにおいて、管理の難度が大きく、トラフィックの拡張性が弱いという欠点を解決する。サーバは分散型システムのサーバであってもよく、又はブロックチェーンを組み合わせたサーバであってもよい。

本願の実施例の技術的解決手段によれば、入力文における候補単語スロットセグメントの単語と、単語スロットライブラリにおける単語との間のマッチング度に基づいて、候補単語スロットセグメントにおける単語スロットの認識を行い、単語スロットの認識精度を確保するだけでなく、さらに大量の単語スロットを構成する必要がなく、単語スロットを構成するコストを効果的に低減させ、開発者の作業負荷を軽減させることができる。

本明細書の説明において、「第１」、「第２」という用語は、説明という目的にのみ使用され、相対的な重要性を示す又は暗示する、又は示された技術的特徴の数を暗黙的に示すと理解することはできない。したがって、「第１」及び「第２」で限定された特徴には、明示的又は暗黙的に該特徴の少なくとも１つが含まれてもよい。本願の説明において、「複数」とは、特に明記しない限り、少なくとも２つ、例えば２つ、３つなどを意味する。

なお、上に示される様々な形態のフローを使用して、ステップを並べ替え、追加し、又は削除することができる。例えば、本願に記載されている各ステップは、並列に実行されてもよく、順次的に実行されてもよく、異なる順序で実行されてもよいが、本願で開示されている技術的解決手段が所望の結果を実現することができれば、本明細書では限定しない。

上記発明を実施するための形態は、本願の保護範囲を制限するものではない。当業者は、設計要件と他の要因に基づいて、様々な修正、組み合わせ、サブコンビネーション、及び置換を行うことができる。本願の精神と原則内で行われる任意の修正、同等の置換、及び改善等は、いずれも本願の保護範囲内に含まれるべきである。

Claims

単語スロットの認識方法であって、
取得された入力文に応答して、前記入力文に含まれる各第１単語及び各第１単語に対応する品詞を決定するステップと、
前記各第１単語に対応する品詞に基づいて、前記入力文における各第１単語を組み合わせて、前記入力文に含まれる候補単語スロットセグメントを取得するステップと、
予め設定された単語スロットライブラリをクエリして、前記候補単語スロットセグメントにおける組み合わされた第１単語と前記単語スロットライブラリの各参照単語スロットにおける第２単語との間のマッチング度を決定するステップであって、前記参照単語スロットは少なくとも１つの第２単語及び第２単語の品詞を含むステップと、
各前記候補単語スロットセグメントにおける第１単語と各前記参照単語スロットにおける第２単語との間のマッチング度に基づいて、前記候補単語スロットセグメントに含まれるターゲット単語スロット及び前記ターゲット単語スロットの単語スロット名を決定するステップと、を含み、
前記各前記候補単語スロットセグメントにおける第１単語と各前記参照単語スロットにおける第２単語との間のマッチング度に基づいて、前記候補単語スロットセグメントに含まれるターゲット単語スロット及び前記ターゲット単語スロットの単語スロット名を決定するステップは、
各第２単語の対応する参照単語スロットにおける重み値を取得するステップと、
いずれかの参照単語スロットにいずれかの候補単語スロットセグメントにおける各第１単語が含まれ、前記いずれかの参照単語スロットにあるが、前記いずれかの候補単語スロットセグメントにない第２単語の重み値が第１閾値より小さい場合、前記いずれかの候補単語スロットセグメントがターゲット単語スロットであると決定し、対応する単語スロット名が前記いずれかの参照単語スロットの単語スロット名であると決定するステップと、を含む、
ことを特徴とする単語スロットの認識方法。
前記各第１単語に対応する品詞に基づいて、前記入力文における各第１単語を組み合わせて、前記入力文に含まれる候補単語スロットセグメントを取得するステップは、
前記入力文における品詞が名詞である少なくとも２つの隣接する第１単語を組み合わせて、前記入力文における１つの候補単語スロットセグメントを生成するステップ、又は、
前記入力文における品詞が接続詞である第１単語に隣接する２つの第１単語を組み合わせて、前記入力文における１つの候補単語スロットセグメントを生成するステップ、を含む、
ことを特徴とする請求項１に記載の方法。
前記各前記候補単語スロットセグメントにおける第１単語と各前記参照単語スロットにおける第２単語との間のマッチング度に基づいて、前記候補単語スロットセグメントに含まれるターゲット単語スロット及び前記ターゲット単語スロットの単語スロット名を決定するステップは、
いずれかの候補単語スロットセグメントにおける各第１単語が、それぞれいずれかの参照単語スロットにおける第２単語とマッチングする場合、前記いずれかの候補単語スロットセグメントがターゲット単語スロットであると決定し、対応する単語スロット名が前記いずれかの参照単語スロットの単語スロット名であると決定するステップを含む、
ことを特徴とする請求項１に記載の方法。
前記予め設定された単語スロットライブラリにおける第１参照単語スロット、前記第１参照単語スロットに含まれる各第３単語及び各第３単語の品詞を取得するステップであって、前記予め設定された単語スロットライブラリにおける全ての参照単語スロットを前記第１参照単語スロットとして定義するステップと、
前記第１参照単語スロットを事前に訓練された同義語モデルに入力して第２参照単語スロットを出力し、前記第２参照単語スロットにおける各第４単語の品詞を取得するステップと、
各前記第３単語と各前記第４単語との間のマッチング度、及び前記各第３単語の品詞と対応する前記各第４単語の品詞との間のマッチング度に基づいて、前記第２参照単語スロットの信頼度を決定するステップと、
前記第２参照単語スロットの信頼度が第２閾値より大きい場合、前記第２参照単語スロット、前記第４単語及び各前記第４単語の品詞を前記予め設定された単語スロットライブラリに追加するステップと、をさらに含む、
ことを特徴とする請求項１～３のいずれかに記載の方法。
単語スロットの認識装置であって、
取得された入力文に応答して、前記入力文に含まれる各第１単語及び各第１単語に対応する品詞を決定するための第１決定モジュールと、
前記各第１単語に対応する品詞に基づいて、前記入力文における各第１単語を組み合わせて、前記入力文に含まれる候補単語スロットセグメントを取得するための第１取得モジュールと、
予め設定された単語スロットライブラリをクエリして、前記候補単語スロットセグメントにおける組み合わされた第１単語と前記単語スロットライブラリの各参照単語スロットにおける第２単語との間のマッチング度を決定するための第２決定モジュールであって、前記参照単語スロットは少なくとも１つの第２単語及び第２単語の品詞を含む第２決定モジュールと、
各前記候補単語スロットセグメントにおける第１単語と各前記参照単語スロットにおける第２単語との間のマッチング度に基づいて、前記候補単語スロットセグメントに含まれるターゲット単語スロット及び前記ターゲット単語スロットの単語スロット名を決定するための第３決定モジュールと、を含み、
前記第３決定モジュールが、
各第２単語の対応する参照単語スロットにおける重み値を取得するための第１取得ユニットと、
いずれかの参照単語スロットにいずれかの候補単語スロットセグメントにおける各第１単語が含まれ、前記いずれかの参照単語スロットにあるが、前記いずれかの候補単語スロットセグメントにない第２単語の重み値が第１閾値より小さい場合、前記いずれかの候補単語スロットセグメントがターゲット単語スロットであると決定し、対応する単語スロット名が前記いずれかの参照単語スロットの単語スロット名であると決定するための第２決定ユニットと、を含む、
ことを特徴とする単語スロットの認識装置。
前記第１取得モジュールが、
前記入力文における品詞が名詞である少なくとも２つの隣接する第１単語を組み合わせて、前記入力文における１つの候補単語スロットセグメントを生成するための第１組み合わせユニット、
又は、
前記入力文における品詞が接続詞である第１単語に隣接する２つの第１単語を組み合わせて、前記入力文における１つの候補単語スロットセグメントを生成するための第２組み合わせユニット、を含む、
ことを特徴とする請求項５に記載の装置。
前記第３決定モジュールが、
いずれかの候補単語スロットセグメントにおける各第１単語が、それぞれいずれかの参照単語スロットにおける第２単語とマッチングする場合、前記いずれかの候補単語スロットセグメントがターゲット単語スロットであると決定し、対応する単語スロット名が前記いずれかの参照単語スロットの単語スロット名であると決定するための第１決定ユニットを含む、
ことを特徴とする請求項５に記載の装置。
前記予め設定された単語スロットライブラリにおける第１参照単語スロット、前記第１参照単語スロットに含まれる各第３単語及び各第３単語の品詞を取得するための第２取得モジュールでって、前記予め設定された単語スロットライブラリにおける全ての参照単語スロットを前記第１参照単語スロットとして定義する第２取得モジュールと、
前記第１参照単語スロットを事前に訓練された同義語モデルに入力して第２参照単語スロットを出力し、前記第２参照単語スロットにおける各第４単語の品詞を取得するための第１生成モジュールと、
各前記第３単語と各前記第４単語との間のマッチング度、及び前記各第３単語の品詞と対応する前記各第４単語の品詞との間のマッチング度に基づいて、前記第２参照単語スロットの信頼度を決定するための第４決定モジュールと、
前記第２参照単語スロットの信頼度が第２閾値より大きい場合、前記第２参照単語スロット、前記第４単語及び各前記第４単語の品詞を前記予め設定された単語スロットライブラリに追加するための第１追加モジュールと、をさらに含む、
ことを特徴とする請求項５～７のいずれかに記載の装置。
電子機器であって、
少なくとも１つのプロセッサと、
前記少なくとも１つのプロセッサと通信可能に接続されるメモリと、を含み、
前記メモリには、前記少なくとも１つのプロセッサによって実行可能な命令が記憶され、前記命令は、前記少なくとも１つのプロセッサが請求項１～４のいずれかに記載の単語スロットの認識方法を実行できるように、前記少なくとも１つのプロセッサによって実行される、
ことを特徴とする電子機器。
コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体であって、
前記コンピュータ命令は、コンピュータに請求項１～４のいずれかに記載の単語スロットの認識方法を実行させる、
ことを特徴とする非一時的なコンピュータ読み取り可能な記憶媒体。
コンピュータプログラムであって、
前記コンピュータプログラムがプロセッサに実行される場合、請求項１～４のいずれかに記載の単語スロットの認識方法を実現する、
ことを特徴とするコンピュータプログラム。