JP2019511033A - ニューラルネットワークを用いたテキストセグメントの係り受け解析の生成 - Google Patents
ニューラルネットワークを用いたテキストセグメントの係り受け解析の生成 Download PDFInfo
- Publication number
- JP2019511033A JP2019511033A JP2018539314A JP2018539314A JP2019511033A JP 2019511033 A JP2019511033 A JP 2019511033A JP 2018539314 A JP2018539314 A JP 2018539314A JP 2018539314 A JP2018539314 A JP 2018539314A JP 2019511033 A JP2019511033 A JP 2019511033A
- Authority
- JP
- Japan
- Prior art keywords
- neural network
- training
- dependency analysis
- token
- analysis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 159
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 100
- 238000000034 method Methods 0.000 claims abstract description 38
- 230000008569 process Effects 0.000 claims abstract description 27
- 238000003058 natural language processing Methods 0.000 claims abstract description 13
- 238000012549 training Methods 0.000 claims description 82
- 238000012545 processing Methods 0.000 claims description 17
- 230000009471 action Effects 0.000 claims description 14
- 238000004590 computer program Methods 0.000 abstract description 13
- 239000013598 vector Substances 0.000 description 11
- 230000001419 dependent effect Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 230000003993 interaction Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 230000026676 system process Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 2
- 238000013515 script Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 101100327917 Caenorhabditis elegans chup-1 gene Proteins 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Machine Translation (AREA)
Abstract
Description
100 係り受け解析生成システム
102 入力テキストセグメント
110 初期ニューラルネットワークレイヤ
112 特徴表現
120 POS出力レイヤ
122 POSタグ
130 解析サブシステム
132 状態特徴
140 係り受け解析ニューラルネットワーク
142 状態更新
152 係り受け解析
Claims (14)
入力テキストシーケンス内の各トークンについて、
前記トークンについての特徴入力を受け取り、
前記トークンについての前記特徴入力を集合的に処理して、前記入力テキストシーケンス内の前記トークンの音声の部分を決定する際に使用するための、前記特徴入力の代替表現を生成する
ように構成された1つまたは複数の初期ニューラルネットワークレイヤ
を備える第1のニューラルネットワークと、
前記1つまたは複数の初期ニューラルネットワークレイヤによって生成された前記入力テキストシーケンス内の前記トークンについての前記特徴の前記代替表現を処理して、前記入力テキストシーケンスの係り受け解析を生成する
ように構成された係り受け解析ニューラルネットワークと
を備えるシステム。
各トークンについて、
前記特徴入力の前記代替表現を受け取り、音声の対応する部分が前記入力テキストシーケンス内の前記トークンの音声の前記部分である可能性を表す、音声タグの複数の部分のそれぞれについてのそれぞれのスコアを生成する
ように構成された出力レイヤ
をさらに備える請求項1に記載のシステム。
前記解析した入力テキストセグメントに基づいて、前記入力テキストセグメントに応答する動作の実施を引き起こす
ように構成された自然言語処理システムを備える請求項1から6のいずれか一項に記載のシステム。
トレーニングテキストシーケンスと、各トレーニングテキストシーケンスについて、前記トレーニングテキストシーケンス内の各トークンについての音声タグのそれぞれの部分とを含む第1のトレーニングデータを得るステップと、
トレーニングテキストシーケンスと、各トレーニングテキストシーケンスについて、前記トレーニングテキストシーケンスの係り受け解析を定義するパーサ状態のセットとを含む第2のトレーニングデータを得るステップと、
前記第1および第2のトレーニングデータに関して前記第1のニューラルネットワークおよび前記係り受け解析ニューラルネットワークをトレーニングするステップを含み、トレーニングする前記ステップが、
前記第1のトレーニングデータからのトレーニング例上の前記第1のニューラルネットワークをトレーニングして、前記第1のニューラルネットワークのパラメータの値を更新するステップと、
前記係り受け解析ニューラルネットワークおよび前記第1のニューラルネットワークの前記初期ニューラルネットワークレイヤをトレーニングするステップであって、
前記第2のトレーニングデータからのトレーニング例について解析損失を決定することと、
前記係り受け解析ニューラルネットワークおよび前記初期ニューラルネットワークレイヤを通じて前記解析損失を逆伝播し、前記係り受け解析ニューラルネットワークおよび前記初期ニューラルネットワークレイヤのパラメータの値を更新することと
を含むステップと
を反復的に実施するステップを含む、方法。
前記第1のニューラルネットワークの前記トレーニングを実施するステップと、前記第1および第2のトレーニングデータとは異なるトレーニング例に関して前記解析ニューラルネットワークおよび前記初期ニューラルネットワークレイヤの前記トレーニングとを実施するステップとを反復的に交替するステップ
を含む請求項9に記載の方法。
前記第2のトレーニングデータ内の前記トレーニングテキストシーケンスのそれぞれについて、
前記トレーニングテキストシーケンスの前記係り受け解析を得るステップと、
前記係り受け解析を広げて、前記トレーニングテキストシーケンスの前記係り受け解析を定義するパーサ状態の前記セットを決定するステップと
を含む請求項9または10に記載の方法。
前記トレーニング動作を反復的に実施する前に、前記第1のニューラルネットワークを事前トレーニングするステップ
をさらに含む請求項9から11のいずれか一項に記載の方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201662310513P | 2016-03-18 | 2016-03-18 | |
US62/310,513 | 2016-03-18 | ||
PCT/US2017/023047 WO2017161320A1 (en) | 2016-03-18 | 2017-03-17 | Generating dependency parses of text segments using neural networks |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2019511033A true JP2019511033A (ja) | 2019-04-18 |
JP2019511033A5 JP2019511033A5 (ja) | 2019-12-19 |
JP6789303B2 JP6789303B2 (ja) | 2020-11-25 |
Family
ID=58547795
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018539314A Active JP6789303B2 (ja) | 2016-03-18 | 2017-03-17 | ニューラルネットワークを用いたテキストセグメントの係り受け解析の生成 |
Country Status (6)
Country | Link |
---|---|
US (1) | US10878188B2 (ja) |
EP (1) | EP3394798A1 (ja) |
JP (1) | JP6789303B2 (ja) |
KR (1) | KR102201936B1 (ja) |
CN (1) | CN109313719B (ja) |
WO (1) | WO2017161320A1 (ja) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109558583A (zh) * | 2017-09-27 | 2019-04-02 | 株式会社理光 | 一种自动生成文摘的方法、装置及设备 |
US10482162B2 (en) * | 2017-11-30 | 2019-11-19 | International Business Machines Corporation | Automatic equation transformation from text |
US10721190B2 (en) * | 2018-07-31 | 2020-07-21 | Microsoft Technology Licensing, Llc | Sequence to sequence to classification model for generating recommended messages |
CN110033091B (zh) * | 2018-12-13 | 2020-09-01 | 阿里巴巴集团控股有限公司 | 一种基于模型进行预测的方法和装置 |
RU2721190C1 (ru) * | 2018-12-25 | 2020-05-18 | Общество с ограниченной ответственностью "Аби Продакшн" | Обучение нейронных сетей с использованием функций потерь, отражающих зависимости между соседними токенами |
US10956474B2 (en) | 2019-03-14 | 2021-03-23 | Microsoft Technology Licensing, Llc | Determination of best set of suggested responses |
US11436486B2 (en) * | 2019-08-19 | 2022-09-06 | Advanced Micro Devices, Inc. | Neural network internal data fast access memory buffer |
CN110765243A (zh) * | 2019-09-17 | 2020-02-07 | 平安科技(深圳)有限公司 | 自然语言处理系统的构建方法、电子装置及计算机设备 |
CN112800737B (zh) * | 2019-10-29 | 2024-06-18 | 京东科技控股股份有限公司 | 自然语言文本生成方法和装置以及对话系统 |
CN111178039B (zh) * | 2019-12-18 | 2023-05-09 | 北京明略软件系统有限公司 | 一种模型训练方法、装置、实现文本处理的方法及装置 |
CN111832316B (zh) * | 2020-06-30 | 2024-05-24 | 北京小米松果电子有限公司 | 语义识别的方法、装置、电子设备和存储介质 |
CN111832315B (zh) * | 2020-06-30 | 2024-04-30 | 北京小米松果电子有限公司 | 语义识别的方法、装置、电子设备和存储介质 |
CN112528671A (zh) * | 2020-12-02 | 2021-03-19 | 北京小米松果电子有限公司 | 语义分析方法、装置以及存储介质 |
CN112699665B (zh) * | 2021-03-25 | 2021-08-27 | 北京智源人工智能研究院 | 一种安全报告文本的三元组抽取方法、装置及电子设备 |
CN113762445B (zh) * | 2021-04-26 | 2023-11-07 | 重庆大学 | 一种基于装配式建筑的标识解析系统 |
CN113468878A (zh) * | 2021-07-13 | 2021-10-01 | 腾讯科技(深圳)有限公司 | 词性标注方法、装置、电子设备及存储介质 |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03263266A (ja) | 1990-03-14 | 1991-11-22 | Fujitsu Ltd | 未知語の品詞選択装置 |
US6076051A (en) * | 1997-03-07 | 2000-06-13 | Microsoft Corporation | Information retrieval utilizing semantic representation of text |
JP2002523828A (ja) | 1998-08-24 | 2002-07-30 | ビーシーエル コンピューターズ, インコーポレイテッド | 適応型自然言語インターフェース |
US7016828B1 (en) * | 2000-10-23 | 2006-03-21 | At&T Corp. | Text-to-scene conversion |
US20060241946A1 (en) | 2003-08-12 | 2006-10-26 | Martin Oerder | Speech input interface for dialog systems |
GB2428508B (en) * | 2005-07-15 | 2009-10-21 | Toshiba Res Europ Ltd | Parsing method |
US8700403B2 (en) | 2005-11-03 | 2014-04-15 | Robert Bosch Gmbh | Unified treatment of data-sparseness and data-overfitting in maximum entropy modeling |
US7603330B2 (en) * | 2006-02-01 | 2009-10-13 | Honda Motor Co., Ltd. | Meta learning for question classification |
US8874434B2 (en) | 2010-06-02 | 2014-10-28 | Nec Laboratories America, Inc. | Method and apparatus for full natural language parsing |
US9454962B2 (en) | 2011-05-12 | 2016-09-27 | Microsoft Technology Licensing, Llc | Sentence simplification for spoken language understanding |
US8935151B1 (en) * | 2011-12-07 | 2015-01-13 | Google Inc. | Multi-source transfer of delexicalized dependency parsers |
CN102662931B (zh) * | 2012-04-13 | 2015-03-25 | 厦门大学 | 一种基于协同神经网络的语义角色标注方法 |
CN102866989B (zh) * | 2012-08-30 | 2016-09-07 | 北京航空航天大学 | 基于词语依存关系的观点抽取方法 |
US9507852B2 (en) * | 2013-12-10 | 2016-11-29 | Google Inc. | Techniques for discriminative dependency parsing |
CN105940395B (zh) * | 2014-01-31 | 2019-07-16 | 谷歌有限责任公司 | 生成文档的矢量表示 |
CN104049755B (zh) * | 2014-06-18 | 2017-01-18 | 中国科学院自动化研究所 | 信息处理方法及装置 |
CN104575501B (zh) * | 2015-01-19 | 2017-11-03 | 北京云知声信息技术有限公司 | 一种收音机语音操控指令解析方法及系统 |
-
2017
- 2017-03-17 EP EP17717542.9A patent/EP3394798A1/en not_active Withdrawn
- 2017-03-17 CN CN201780008760.9A patent/CN109313719B/zh active Active
- 2017-03-17 KR KR1020187021920A patent/KR102201936B1/ko active IP Right Grant
- 2017-03-17 US US16/084,470 patent/US10878188B2/en active Active
- 2017-03-17 WO PCT/US2017/023047 patent/WO2017161320A1/en active Application Filing
- 2017-03-17 JP JP2018539314A patent/JP6789303B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
CN109313719B (zh) | 2022-03-22 |
KR20180099822A (ko) | 2018-09-05 |
US20190073351A1 (en) | 2019-03-07 |
JP6789303B2 (ja) | 2020-11-25 |
US10878188B2 (en) | 2020-12-29 |
EP3394798A1 (en) | 2018-10-31 |
KR102201936B1 (ko) | 2021-01-12 |
CN109313719A (zh) | 2019-02-05 |
WO2017161320A1 (en) | 2017-09-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6789303B2 (ja) | ニューラルネットワークを用いたテキストセグメントの係り受け解析の生成 | |
US11869530B2 (en) | Generating audio using neural networks | |
CN108351982B (zh) | 卷积门控递归神经网络 | |
JP6790286B2 (ja) | 強化学習を用いたデバイス配置最適化 | |
EP3312777B1 (en) | Recurrent neural network system for data item generation | |
EP3523759B1 (en) | Image processing neural networks with separable convolutional layers | |
JP7043596B2 (ja) | ニューラルアーキテクチャ検索 | |
CN109074517B (zh) | 全局归一化神经网络 | |
CN110023963A (zh) | 使用神经网络处理文本序列 | |
KR20190117713A (ko) | 신경망 아키텍처 최적화 | |
JP2019535091A (ja) | 畳み込みニューラルネットワークを使用したシーケンスの処理 | |
CN109791631A (zh) | 奖励增强模型训练 | |
JP2019517075A (ja) | 比較セットを使用する入力例の分類 | |
JP2018537788A (ja) | 外部メモリを用いたニューラルネットワークの拡張 | |
CN110663049A (zh) | 神经网络优化器搜索 | |
CN110023928A (zh) | 预测搜索引擎排名信号值 | |
CN111133458B (zh) | 增强神经网络 | |
US10635972B1 (en) | Recurrent neural networks with rectified linear units | |
US10657435B1 (en) | Processing inputs using recurrent neural networks | |
CN114298004A (zh) | 复述文本生成方法、装置、设备、介质和程序产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180813 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190726 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190805 |
|
A524 | Written submission of copy of amendment under article 19 pct |
Free format text: JAPANESE INTERMEDIATE CODE: A524 Effective date: 20191105 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20200420 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200807 |
|
C60 | Trial request (containing other claim documents, opposition documents) |
Free format text: JAPANESE INTERMEDIATE CODE: C60 Effective date: 20200807 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20200814 |
|
C21 | Notice of transfer of a case for reconsideration by examiners before appeal proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C21 Effective date: 20200817 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201005 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201102 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6789303 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |