JP7276448B2 - 言語処理装置、言語処理方法及び言語処理プログラム - Google Patents
言語処理装置、言語処理方法及び言語処理プログラム Download PDFInfo
- Publication number
- JP7276448B2 JP7276448B2 JP2021528084A JP2021528084A JP7276448B2 JP 7276448 B2 JP7276448 B2 JP 7276448B2 JP 2021528084 A JP2021528084 A JP 2021528084A JP 2021528084 A JP2021528084 A JP 2021528084A JP 7276448 B2 JP7276448 B2 JP 7276448B2
- Authority
- JP
- Japan
- Prior art keywords
- term
- verb
- case
- history database
- term occurrence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims description 3
- 238000000034 method Methods 0.000 claims description 29
- 230000008569 process Effects 0.000 claims description 16
- 230000004044 response Effects 0.000 claims description 11
- 239000000284 extract Substances 0.000 claims description 4
- 230000003993 interaction Effects 0.000 claims description 4
- 238000004458 analytical method Methods 0.000 description 21
- 238000009825 accumulation Methods 0.000 description 11
- 238000006243 chemical reaction Methods 0.000 description 6
- 239000003607 modifier Substances 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 230000000877 morphologic effect Effects 0.000 description 4
- 238000003058 natural language processing Methods 0.000 description 4
- 230000002776 aggregation Effects 0.000 description 3
- 238000004220 aggregation Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 239000003795 chemical substances by application Substances 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/313—Selection or weighting of terms for indexing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/253—Grammatical analysis; Style critique
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/027—Concept to speech synthesisers; Generation of natural phrases from machine-based concepts
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
- G10L15/19—Grammatical context, e.g. disambiguation of the recognition hypotheses based on word sequence rules
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
- G10L2015/227—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of the speaker; Human-factor methodology
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Software Systems (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
検索対象である動詞及び出力対象格、並びに検索条件である当該動詞の格及び項の組合せを含む出力要求をユーザから取得し、
動詞の格及び項が紐付いた項出現パターンを動詞の語義又は用法ごとに格納した項出現履歴データベースを参照し、
前記検索条件に含まれる動詞の格及び項の組合せと一致する項出現パターンを前記項出現履歴データベースから取得し、
前記項出現履歴データベースから取得した項出現パターンから前記検索対象に含まれる動詞の格に対応する項を抽出し、抽出した項を用いて、ユーザへの応答を生成する。
検索対象である動詞及び出力対象格、並びに検索条件である当該動詞の格及び項の組合せを含む出力要求をユーザから取得し、
動詞の格及び項が紐付いた項出現パターンを動詞の語義又は用法ごとに格納した項出現履歴データベースを参照し、
前記検索条件に含まれる動詞の格及び項の組合せと一致する項出現パターンを前記項出現履歴データベースから取得し、
前記項出現履歴データベースから取得した項出現パターンから前記検索対象に含まれる動詞の格に対応する項を抽出し、抽出した項を用いて、ユーザへの応答を生成する。
本開示のシステムは、コンピュータ100が、対話履歴を蓄積し、対話履歴の中で使われた動詞の意味内容ごとに、格とその格に対応する項を記録したデータベースを構築する。このデータベースを項出現履歴と呼ぶ。項出現履歴の一例を図3に示す。
(手順S101)
発話文そのものを記録した対話履歴の1つの発話文について、形態素解析(例えば、非特許文献2第3章「形態素解析」参照。)、構文解析(例えば、非特許文献2第4章「構文解析」参照。)、述語項構造解析(例えば、非特許文献1第9章「意味の解析(2)」及び非特許文献2第5章「意味解析」参照。)を実施する。形態素解析の結果、意味を持つ最小の言語単位である「形態素」が特定される。「形態素」は、例えば単語(word)である。構文解析の結果、構文構造が特定される。述語項構造解析の結果、発話文中の述語動詞の用法とそれぞれの格に対応する項となった名詞が特定される。
(手順S102)
当該動詞の当該用法の項出現履歴の中に、手順S101で特定した項の一覧に相当する項出現パターン、すなわち、全ての格に対応する名詞(項)が手順S101で特定した項の一覧と同一で、かつ、発話者IDが当該発話文の発話者を示すIDである項出現パターン、が存在するか否かを検査する。そのような項出現パターンが存在する場合、その出現回数欄の数字を1つ増加させる。ここで、出現回数欄の数字の初期値は0とする。そのような項出現パターンが存在しない場合は、手順S101で特定した項の一覧と当該発話文の発話者を示す発話者IDとの組を新たな項出現パターンとして、当該用法の項出現履歴に新規登録する。このとき、対応する出現回数欄の数字を1とする。
(手順S103)
対話履歴の中に未処理の発話文が残っていれば、処理対象の発話文を1つ後の発話文として手順S101に戻る。対話履歴の中に未処理の発話文が残っていなければ処理を終了する。
本開示のシステムは、各手順を実行する手段を備え、過去の対話で使用された動詞の格の項となった名詞に関する履歴を作成し、項出現履歴データベースに蓄積する。このため、本開示は、ある格の項に関する聞き返しをされた人が当該格の項を特定する意図を明確に持っていない場合や当該格に関する記憶を有していない場合でも、項出現履歴データベースを参照し、意思決定したり、過去の情報を確認することができる。また、聞き返しができないような状況においては、当該格の項の情報を取得したい者が項出現履歴データベースを参照して所望の格の項の情報を確認することができる。
図5は、本実施形態の一例を表すブロック図である。本実施形態においては、コンピュータ100が、項出現履歴DB(DataBase)14及びユーザ要求処理部15を備え、ユーザからの出力要求に対し、項出現履歴DB14を参照することで、出力要求に応じた動詞の格に対応する項の情報をユーザに返す。項出現履歴DB14は、プロセッサ110に接続されている記憶装置125に格納されている。本実施形態においては、項出現履歴DB14を構築するために、コンピュータ100が、対話履歴蓄積処理を実行する対話履歴蓄積部11、対話履歴DB12、項出現履歴生成処理を実行する項出現履歴生成部13を備える。
対話履歴蓄積部11は、対話履歴蓄積処理を実行し、発話文を対話履歴DB12へ蓄積する。対話履歴DB12は、プロセッサ110に接続されている記憶装置125に格納されている。
項出現履歴生成部13は、対話履歴DB12に蓄積された発話文に対して項出現履歴生成処理を実行し、項出現パターンを項出現履歴DB14に格納する。
ユーザ要求処理部15は、項出現履歴DB14に格納された項出現パターンを用いてユーザ要求処理を実行する。本実施形態のシステムのユーザは、本システムの利用時においては他者との対話は行っておらず、過去の項出現履歴DB14を使って所望の格の情報を検索する処理を実施する。
図8は、本実施形態の一例を表すブロック図である。本実施形態では、テキスト表示部71、述語項構造解析部72、項出現パターン生成部73及び発話文判定部74をさらに備える。
12:対話履歴データベース
21:発話入力部
22:テキスト変換部
13:項出現履歴生成部
31、72:述語項構造解析部
32、73:項出現パターン生成部
14:項出現履歴データベース
15:ユーザ要求処理部
51:項出現履歴DBインタフェース
52:質問入力部
53:情報表示部
71:テキスト表示部
74:発話文判定部
100:コンピュータ
110:プロセッサ
115:メモリ
120:プログラムモジュール
125、140:記憶装置
130:ユーザ装置
135:ネットワーク
Claims (7)
- 検索対象である動詞及び出力対象格、並びに検索条件である当該動詞の格及び項の組合せを含む出力要求をユーザから取得し、
動詞の格及び項が紐付いた項出現パターンを動詞の語義又は用法ごとに格納した項出現履歴データベースを参照し、
前記検索条件に含まれる動詞の格及び項の組合せと一致する項出現パターンを前記項出現履歴データベースから取得し、
前記項出現履歴データベースから取得した項出現パターンから出力対象格に対応する項を抽出し、抽出した項を用いて、ユーザへの応答を生成する、
言語処理装置。 - 前記項出現パターンは、動詞の格及び項にさらに発話者の識別情報が紐付いており、
対話に含まれる発話文のテキストデータを発話者ごとに蓄積する対話履歴データベースから発話文を取得し、
発話文に含まれる動詞及び当該動詞の語義又は用法を抽出し、発話文に含まれる名詞のなかから動詞の格として用いられている名詞を特定し、動詞の格及び項及び発話者の識別情報が紐付いた項出現パターンを作成し、前記動詞の語義又は用法に応じて、前記項出現履歴データベースに格納する、
請求項1に記載の言語処理装置。 - 前記項出現履歴データベースは、項出現パターンの出現回数をさらに格納し、
発話文に含まれる項出現パターンが既に前記項出現履歴データベースに格納されている場合、前記項出現履歴データベースに格納されている項出現パターンの出現回数を増加させ、
項出現パターンの出現回数を用いて、前記ユーザへの応答を生成する、
請求項2に記載の言語処理装置。 - 前記ユーザを含む複数のユーザの対話が入力され、
前記複数のユーザの対話に含まれる発話文に含まれる動詞を抽出し、
発話文に含まれる名詞のなかから動詞の格として用いられている名詞を特定し、
発話文に含まれる動詞と当該動詞の格に用いられている名詞との組合せに対応する項出現パターンを前記項出現履歴データベースから取得し、
前記項出現履歴データベースから取得した項出現パターンを用いて事前に定められた処理を実行し、処理結果を前記複数のユーザのうちの少なくとも一人に提示する、
請求項2又は3に記載の言語処理装置。 - 前記項出現履歴データベースから取得する項出現パターンは、発話文に含まれる動詞と当該動詞の格に用いられている名詞との組合せに加え、更に発話者の識別情報に対応する項出現パターンである、
請求項4に記載の言語処理装置。 - 検索対象である動詞及び出力対象格、並びに検索条件である当該動詞の格及び項の組合せを含む出力要求をユーザから取得し、
動詞の格及び項が紐付いた項出現パターンを動詞の語義又は用法ごとに格納した項出現履歴データベースを参照し、
前記検索条件に含まれる動詞の格及び項の組合せと一致する項出現パターンを前記項出現履歴データベースから取得し、
前記項出現履歴データベースから取得した項出現パターンから出力対象格に対応する項を抽出し、抽出した項を用いて、ユーザへの応答を生成する、
言語処理方法。 - コンピュータに、
検索対象である動詞及び出力対象格、並びに検索条件である当該動詞の格及び項の組合せを含む出力要求をユーザから取得する手順、
動詞の格及び項が紐付いた項出現パターンを動詞の語義又は用法ごとに格納した項出現履歴データベースを参照する手順、
前記検索条件に含まれる動詞の格及び項の組合せと一致する項出現パターンを前記項出現履歴データベースから取得する手順、
前記項出現履歴データベースから取得した項出現パターンから出力対象格に対応する項を抽出し、抽出した項を用いて、ユーザへの応答を生成する手順、
を実行させるための言語処理プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2019/024003 WO2020255234A1 (ja) | 2019-06-18 | 2019-06-18 | 言語処理装置、言語処理方法及び言語処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2020255234A1 JPWO2020255234A1 (ja) | 2020-12-24 |
JP7276448B2 true JP7276448B2 (ja) | 2023-05-18 |
Family
ID=74036992
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021528084A Active JP7276448B2 (ja) | 2019-06-18 | 2019-06-18 | 言語処理装置、言語処理方法及び言語処理プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US11971915B2 (ja) |
JP (1) | JP7276448B2 (ja) |
WO (1) | WO2020255234A1 (ja) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007206888A (ja) | 2006-01-31 | 2007-08-16 | Toyota Central Res & Dev Lab Inc | 応答生成装置、方法及びプログラム |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6310150B2 (ja) * | 2015-03-20 | 2018-04-11 | 株式会社東芝 | 意図理解装置、方法およびプログラム |
-
2019
- 2019-06-18 WO PCT/JP2019/024003 patent/WO2020255234A1/ja active Application Filing
- 2019-06-18 US US17/619,596 patent/US11971915B2/en active Active
- 2019-06-18 JP JP2021528084A patent/JP7276448B2/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007206888A (ja) | 2006-01-31 | 2007-08-16 | Toyota Central Res & Dev Lab Inc | 応答生成装置、方法及びプログラム |
Non-Patent Citations (1)
Title |
---|
吉野 幸一郎 KOICHIRO YOSHINO,述語項の類似度に基づく情報抽出・推薦を行う音声対話システム,情報処理学会論文誌 論文誌ジャーナル Vol.52 No.12 [CD-ROM],日本,一般社団法人情報処理学会,2011年12月15日,第52巻 第12号,pp.3386-3397 |
Also Published As
Publication number | Publication date |
---|---|
WO2020255234A1 (ja) | 2020-12-24 |
JPWO2020255234A1 (ja) | 2020-12-24 |
US20220382790A1 (en) | 2022-12-01 |
US11971915B2 (en) | 2024-04-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7346609B2 (ja) | 自然言語理解(nlu)フレームワークを使用して意味探索を実行するシステムおよび方法 | |
Gardent et al. | Creating training corpora for nlg micro-planning | |
US10902041B2 (en) | Systems and methods for learning semantic patterns from textual data | |
Tur et al. | Spoken language understanding: Systems for extracting semantic information from speech | |
US7949676B2 (en) | Information search system, information search supporting system, and method and program for information search | |
US11126793B2 (en) | Unsupervised induction of user intents from conversational customer service corpora | |
US10460028B1 (en) | Syntactic graph traversal for recognition of inferred clauses within natural language inputs | |
JP6676110B2 (ja) | 発話文生成装置とその方法とプログラム | |
US10896222B1 (en) | Subject-specific data set for named entity resolution | |
US10997223B1 (en) | Subject-specific data set for named entity resolution | |
Griol et al. | Combining speech-based and linguistic classifiers to recognize emotion in user spoken utterances | |
US20050131677A1 (en) | Dialog driven personal information manager | |
WO2013088287A1 (en) | Generation of natural language processing model for information domain | |
JP5620349B2 (ja) | 対話装置、対話方法および対話プログラム | |
JP2000353161A (ja) | 自然言語生成における文体制御方法及び装置 | |
WO2021063524A1 (en) | Unsupervised induction of user intents from conversational customer service corpora | |
Govindaraj et al. | Intensified sentiment analysis of customer product reviews using acoustic and textual features | |
CN114742054A (zh) | 一种面向开放领域的混合式信息抽取方法与系统 | |
JP5636309B2 (ja) | 音声対話装置および音声対話方法 | |
JP7276448B2 (ja) | 言語処理装置、言語処理方法及び言語処理プログラム | |
Aliero et al. | Systematic review on text normalization techniques and its approach to non-standard words | |
JP3009636B2 (ja) | 音声言語解析装置 | |
Sayeedunnisa et al. | Sarcasm detection: a contemporary research affirmation of recent literature | |
WO2017119060A1 (ja) | 情報提示システム | |
JP2015210342A (ja) | 発話生成手法学習装置、発話生成手法選択装置、発話生成手法学習方法、発話生成手法選択方法、プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211110 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221108 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221227 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230404 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230417 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7276448 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |