JP6778654B2 - 単語分割推定モデル学習装置、単語分割装置、方法、及びプログラム - Google Patents
単語分割推定モデル学習装置、単語分割装置、方法、及びプログラム Download PDFInfo
- Publication number
- JP6778654B2 JP6778654B2 JP2017113765A JP2017113765A JP6778654B2 JP 6778654 B2 JP6778654 B2 JP 6778654B2 JP 2017113765 A JP2017113765 A JP 2017113765A JP 2017113765 A JP2017113765 A JP 2017113765A JP 6778654 B2 JP6778654 B2 JP 6778654B2
- Authority
- JP
- Japan
- Prior art keywords
- word
- division
- text
- character
- word division
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
20、220 演算部
30、230 既存解析器分割結果取得部
32 単語分割モデル学習部
40、240 単語分割モデル
100 単語分割推定モデル学習装置
200 単語分割装置
232 単語分割部
Claims (8)
- テキストの文字ごとに単語分割境界が存在するか否かを表す単語分割ラベルを付与するための単語分割モデルを学習する単語分割推定モデル学習装置であって、
文字ごとに前記単語分割ラベルが付与されたテキストを受け付ける入力部と、
前記テキストを単語単位に分割した結果を取得する既存解析器分割結果取得部と、
前記テキストの文字ごとに付与された前記単語分割ラベルを正解ラベルとして、文字ごとに対応した隠れ層を有するニューラルネットワークであって、前記テキストの文字の各々の埋め込みを文字ごとの隠れ層の入力として、かつ、前記分割した結果に基づいて各単語の埋め込みを取得し、前記単語の埋め込みを、前記分割した結果から得られる単語の末尾文字の隠れ層の入力として、前記テキストの各文字に付与する単語分割ラベルを出力するニューラルネットワークである単語分割モデルを学習する単語分割モデル学習部と、
を含む単語分割推定モデル学習装置。 - 前記正解ラベルとしての前記単語分割ラベルには、先頭、中間、及び末尾を表すラベルを用いる請求項1に記載の単語分割推定モデル学習装置。
- テキストの文字ごとに単語分割境界が存在するか否かを表す単語分割ラベルを付与するための単語分割モデルを用いて単語分割を行う単語分割装置であって、
前記テキストを単語単位に分割した結果を取得する既存解析器分割結果取得部と、
前記テキストの文字の各々、及び前記テキストを単語単位に分割した結果を入力として、文字ごとに対応した隠れ層を有するニューラルネットワークであって、前記テキストの文字の各々の埋め込みを文字ごとの隠れ層の入力として、かつ、前記分割した結果に基づいて各単語の埋め込みを取得し、前記単語の埋め込みを、前記分割した結果から得られる単語の末尾文字の隠れ層の入力として、前記テキストの各文字に付与する単語分割ラベルを出力するニューラルネットワークであるように予め学習された前記単語分割モデルの出力として、前記テキストの各文字に対して前記単語分割ラベルを付与する単語分割部と、
を含む単語分割装置。 - テキストの文字ごとに単語分割境界が存在するか否かを表す単語分割ラベルを付与するための単語分割モデルを学習する単語分割推定モデル学習装置における単語分割推定モデル学習方法であって、
入力部が、文字ごとに前記単語分割ラベルが付与されたテキストを受け付けるステップと、
既存解析器分割結果取得部が、前記テキストを単語単位に分割した結果を取得するステップと、
単語分割モデル学習部が、前記テキストの文字ごとに付与された前記単語分割ラベルを正解ラベルとして、文字ごとに対応した隠れ層を有するニューラルネットワークであって、前記テキストの文字の各々の埋め込みを文字ごとの隠れ層の入力として、かつ、前記分割した結果に基づいて各単語の埋め込みを取得し、前記単語の埋め込みを、前記分割した結果から得られる単語の末尾文字の隠れ層の入力として、前記テキストの各文字に付与する単語分割ラベルを出力するニューラルネットワークである単語分割モデルを学習するステップと、
を含む単語分割推定モデル学習方法。 - 前記正解ラベルとしての前記単語分割ラベルには、先頭、中間、及び末尾を表すラベルを用いる請求項4に記載の単語分割推定モデル学習方法。
- テキストの文字ごとに単語分割境界が存在するか否かを表す単語分割ラベルを付与するための単語分割モデルを用いて単語分割を行う単語分割装置における単語分割方法であって、
既存解析器分割結果取得部が、前記テキストを単語単位に分割した結果を取得するステップと、
単語分割部が、前記テキストの文字の各々、及び前記テキストを単語単位に分割した結果を入力として、文字ごとに対応した隠れ層を有するニューラルネットワークであって、前記テキストの文字の各々の埋め込みを文字ごとの隠れ層の入力として、かつ、前記分割した結果に基づいて各単語の埋め込みを取得し、前記単語の埋め込みを、前記分割した結果から得られる単語の末尾文字の隠れ層の入力として、前記テキストの各文字に付与する単語分割ラベルを出力するニューラルネットワークであるように予め学習された前記単語分割モデルの出力として、前記テキストの各文字に対して前記単語分割ラベルを付与するステップと、
を含む単語分割方法。 - コンピュータを、請求項1又は請求項2に記載の単語分割推定モデル学習装置の各部として機能させるためのプログラム。
- コンピュータを、請求項3に記載の単語分割装置の各部として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017113765A JP6778654B2 (ja) | 2017-06-08 | 2017-06-08 | 単語分割推定モデル学習装置、単語分割装置、方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017113765A JP6778654B2 (ja) | 2017-06-08 | 2017-06-08 | 単語分割推定モデル学習装置、単語分割装置、方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018206261A JP2018206261A (ja) | 2018-12-27 |
JP6778654B2 true JP6778654B2 (ja) | 2020-11-04 |
Family
ID=64957913
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017113765A Active JP6778654B2 (ja) | 2017-06-08 | 2017-06-08 | 単語分割推定モデル学習装置、単語分割装置、方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6778654B2 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102354898B1 (ko) * | 2019-05-29 | 2022-01-24 | 경희대학교 산학협력단 | 한국어 기반 신경망 언어 모델을 위한 어휘 목록 생성 방법 및 장치 |
CN111062467B (zh) * | 2019-12-18 | 2023-05-12 | 开放智能机器(上海)有限公司 | 一种应用于ai异构编译器的自动切分神经网络子图方法 |
CN111476022B (zh) * | 2020-05-15 | 2023-07-07 | 湖南工商大学 | 实体特征的字符嵌入及混合lstm实体识别方法、系统及介质 |
CN112131866A (zh) * | 2020-09-25 | 2020-12-25 | 马上消费金融股份有限公司 | 一种分词方法、装置、设备及可读存储介质 |
CN112949298B (zh) * | 2021-02-26 | 2022-10-04 | 维沃移动通信有限公司 | 分词方法、装置、电子设备和可读存储介质 |
CN116226362B (zh) * | 2023-05-06 | 2023-07-18 | 湖南德雅曼达科技有限公司 | 一种提升搜索医院名称准确度的分词方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101261623A (zh) * | 2007-03-07 | 2008-09-10 | 国际商业机器公司 | 基于搜索的无词边界标记语言的分词方法以及装置 |
JP2010238043A (ja) * | 2009-03-31 | 2010-10-21 | Mitsubishi Electric Corp | テキスト解析学習装置 |
-
2017
- 2017-06-08 JP JP2017113765A patent/JP6778654B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2018206261A (ja) | 2018-12-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6778654B2 (ja) | 単語分割推定モデル学習装置、単語分割装置、方法、及びプログラム | |
US10664660B2 (en) | Method and device for extracting entity relation based on deep learning, and server | |
Oda et al. | Learning to generate pseudo-code from source code using statistical machine translation | |
US20190114300A1 (en) | Reading Level Based Text Simplification | |
CN103678285A (zh) | 机器翻译方法和机器翻译系统 | |
JP6312467B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
CN104599680A (zh) | 移动设备上的实时口语评价系统及方法 | |
TWI567569B (zh) | Natural language processing systems, natural language processing methods, and natural language processing programs | |
JP6946842B2 (ja) | モデル学習装置、変換装置、方法、及びプログラム | |
JP6145059B2 (ja) | モデル学習装置、形態素解析装置、及び方法 | |
US10936825B1 (en) | Methods and apparatus to improve disambiguation and interpretation in automated text analysis using transducers applied on a structured language space | |
JP5911931B2 (ja) | 述語項構造抽出装置、方法、プログラム、及びコンピュータ読取り可能な記録媒体 | |
KR102204395B1 (ko) | 개체명 인식을 이용한 음성인식 띄어쓰기 보정 방법 및 시스템 | |
WO2019163752A1 (ja) | 形態素解析学習装置、形態素解析装置、方法、及びプログラム | |
KR20120045906A (ko) | 코퍼스 오류 교정 장치 및 그 방법 | |
KR20200072593A (ko) | 신경망 네트워크에 기반한 의존 구문 분석 제어 방법 및 그것을 이용하는 의존 구문 분석 장치 | |
US20230028376A1 (en) | Abstract learning method, abstract learning apparatus and program | |
JP2017041207A (ja) | 構造解析装置、方法、及びプログラム | |
JP2021128421A (ja) | トークン長変換装置、プログラム及び方法 | |
JP6665029B2 (ja) | 言語解析装置、言語解析方法、及びプログラム | |
JP6663881B2 (ja) | 並列句解析装置、並列句解析モデル学習装置、方法、及びプログラム | |
JP2016133956A (ja) | 形態素解析モデル生成装置、形態素解析モデル生成方法、及び、プログラム | |
KR102445497B1 (ko) | 학습 예문 및 어휘 패턴 생성 장치와 이의 동작 방법 | |
JP2016051367A (ja) | データ解析装置、データ解析方法、および、プログラム。 | |
CN115049899B (zh) | 模型训练方法、指代表达式生成方法及相关设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190827 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200515 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200609 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20200807 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200817 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201006 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201012 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6778654 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |