JP2015007943A - 形態素解析装置、形態素解析方法、及び、形態素解析プログラム - Google Patents
形態素解析装置、形態素解析方法、及び、形態素解析プログラム Download PDFInfo
- Publication number
- JP2015007943A JP2015007943A JP2013133481A JP2013133481A JP2015007943A JP 2015007943 A JP2015007943 A JP 2015007943A JP 2013133481 A JP2013133481 A JP 2013133481A JP 2013133481 A JP2013133481 A JP 2013133481A JP 2015007943 A JP2015007943 A JP 2015007943A
- Authority
- JP
- Japan
- Prior art keywords
- word
- morpheme
- words
- analysis
- compound
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
Description
(発明の目的)
本発明の目的は、単語辞書を用いる形態素解析において、単語辞書に登録された情報を効率的に修正して、高精度な解析を実現することができる、形態素解析装置、形態素解析方法、及び、形態素解析プログラムを提供することにある。
(第1の実施形態)
図1は、本実施形態における形態素解析装置の構成の一例を示すブロック図である。
(第2の実施形態)
本実施形態の説明においては、第1の実施形態と本実施形態とで共通する説明は省略し、第1の実施形態に対する本実施形態の相違点のみについて説明する。
Claims (10)
- 単語、所定の単語の並びである複合語及び前記複合語における前記所定の単語に分割可能な位置に関する語切り情報が登録された単語辞書に基づいて、前記複合語を1つの単語として文章の形態素解析を実行する形態素解析手段と、
前記単語辞書に基づいて、前記形態素解析の結果に含まれる前記複合語を前記所定の単語に分割する形態素細分割手段と、
を備えることを特徴とする形態素解析装置。 - 前記語切り情報は、前記位置に挿入された所定の記号、前記所定の単語の並び、又は前記所定の単語の識別子の並びである
ことを特徴とする請求項1に記載の形態素解析装置。 - 前記語切り情報は、前記位置を表す、前記複合語の先頭又は末尾からの文字数である
ことを特徴とする請求項1に記載の形態素解析装置。 - 前記単語辞書には、活用形である前記単語が登録される
ことを特徴とする請求項1乃至3のいずれか1項に記載の形態素解析装置。 - 前記単語辞書には、見出し語である前記単語、及び前記見出し語に対応付けられた前記見出し語の活用形に関する情報が登録される
ことを特徴とする請求項1乃至3のいずれか1項に記載の形態素解析装置。 - 前記形態素解析手段は、前記単語を接続したときの第1の接続コストの情報を保持し、前記文章中における前記第1の接続コストの総和が最小になる前記単語の並びを形態素解析の結果として選択する
ことを特徴とする請求項1乃至5のいずれか1項に記載の形態素解析装置。 - 前記単語辞書には、前記単語が属する品詞の情報が登録される
ことを特徴とする請求項1乃至6のいずれか1項に記載の形態素解析装置。 - 前記形態素解析手段は、前記品詞が異なる前記単語を接続したときの第2の接続コストの情報を保持し、前記文章中における前記第2の接続コストの総和が最小になる前記単語の並びを形態素解析の結果として選択する
ことを特徴とする請求項1乃至5のいずれか1項又は請求項7に記載の形態素解析装置。 - 単語、所定の単語の並びである複合語、及び前記複合語における前記所定の単語に分割可能な位置に関する語切り情報が登録された単語辞書に基づいて、前記複合語を1つの単語として文章の形態素解析を実行し、
前記単語辞書に基づいて、前記形態素解析の結果に含まれる前記複合語を前記所定の単語に分割する
ことを特徴とする形態素解析方法。 - 単語、所定の単語の並びである複合語、及び前記複合語における前記所定の単語に分割可能な位置に関する語切り情報が登録された単語辞書を備える形態素解析装置の備えるコンピュータを、
前記単語辞書に基づいて、前記複合語を1つの単語として文章の形態素解析を実行する形態素解析手段と、
前記単語辞書に基づいて、前記形態素解析の結果に含まれる前記複合語を前記所定の単語に分割する形態素細分割手段と、
して機能させるための形態素解析プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013133481A JP6232774B2 (ja) | 2013-06-26 | 2013-06-26 | 形態素解析装置、形態素解析方法、及び、形態素解析プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013133481A JP6232774B2 (ja) | 2013-06-26 | 2013-06-26 | 形態素解析装置、形態素解析方法、及び、形態素解析プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015007943A true JP2015007943A (ja) | 2015-01-15 |
JP6232774B2 JP6232774B2 (ja) | 2017-11-22 |
Family
ID=52338160
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013133481A Active JP6232774B2 (ja) | 2013-06-26 | 2013-06-26 | 形態素解析装置、形態素解析方法、及び、形態素解析プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6232774B2 (ja) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07175810A (ja) * | 1993-12-18 | 1995-07-14 | Ricoh Co Ltd | 形態素解析装置 |
JPH0844739A (ja) * | 1994-07-29 | 1996-02-16 | Atr Onsei Honyaku Tsushin Kenkyusho:Kk | 形態素解析装置 |
JPH09146952A (ja) * | 1995-11-28 | 1997-06-06 | Fujitsu Ltd | 形態素解析装置 |
JPH11120186A (ja) * | 1997-10-09 | 1999-04-30 | Nippon Telegr & Teleph Corp <Ntt> | データベース作成方法とその装置及びそのプログラムを記録した媒体並びにデータベース検索方法とその装置及びそのプログラムを記録した媒体 |
JP2002251402A (ja) * | 2001-02-26 | 2002-09-06 | Mitsubishi Electric Corp | 文書検索方法及び文書検索装置 |
JP2004246440A (ja) * | 2003-02-12 | 2004-09-02 | Internatl Business Mach Corp <Ibm> | 形態素解析装置、自然言語処理装置、形態素解析方法及びプログラム |
JP2009295052A (ja) * | 2008-06-06 | 2009-12-17 | Yahoo Japan Corp | 複合語の区切り位置を推定する複合語区切り推定装置、方法、およびプログラム |
JP2013097534A (ja) * | 2011-10-31 | 2013-05-20 | Fujitsu Ltd | 形態素解析装置、方法、プログラム、音声合成装置、方法、プログラム |
-
2013
- 2013-06-26 JP JP2013133481A patent/JP6232774B2/ja active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07175810A (ja) * | 1993-12-18 | 1995-07-14 | Ricoh Co Ltd | 形態素解析装置 |
JPH0844739A (ja) * | 1994-07-29 | 1996-02-16 | Atr Onsei Honyaku Tsushin Kenkyusho:Kk | 形態素解析装置 |
JPH09146952A (ja) * | 1995-11-28 | 1997-06-06 | Fujitsu Ltd | 形態素解析装置 |
JPH11120186A (ja) * | 1997-10-09 | 1999-04-30 | Nippon Telegr & Teleph Corp <Ntt> | データベース作成方法とその装置及びそのプログラムを記録した媒体並びにデータベース検索方法とその装置及びそのプログラムを記録した媒体 |
JP2002251402A (ja) * | 2001-02-26 | 2002-09-06 | Mitsubishi Electric Corp | 文書検索方法及び文書検索装置 |
JP2004246440A (ja) * | 2003-02-12 | 2004-09-02 | Internatl Business Mach Corp <Ibm> | 形態素解析装置、自然言語処理装置、形態素解析方法及びプログラム |
JP2009295052A (ja) * | 2008-06-06 | 2009-12-17 | Yahoo Japan Corp | 複合語の区切り位置を推定する複合語区切り推定装置、方法、およびプログラム |
JP2013097534A (ja) * | 2011-10-31 | 2013-05-20 | Fujitsu Ltd | 形態素解析装置、方法、プログラム、音声合成装置、方法、プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP6232774B2 (ja) | 2017-11-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI636452B (zh) | 語音識別方法及系統 | |
JP5462001B2 (ja) | 文脈上の入力方法 | |
JP5362095B2 (ja) | インプットメソッドエディタ | |
JP2019526142A (ja) | 検索語句の誤り訂正方法および装置 | |
US20140039879A1 (en) | Generic system for linguistic analysis and transformation | |
JP2013065284A (ja) | 言語変換において複数の読み方の曖昧性を除去する方法 | |
Shaalan et al. | A hybrid approach for building Arabic diacritizer | |
CN103678288A (zh) | 一种专名自动翻译的方法 | |
JP2017004127A (ja) | テキスト分割プログラム、テキスト分割装置、及びテキスト分割方法 | |
JP2002117027A (ja) | 感情情報抽出方法および感情情報抽出プログラムの記録媒体 | |
JPH10326275A (ja) | 形態素解析方法および装置、並びに日本語形態素解析方法および装置 | |
Ganfure et al. | Design and implementation of morphology based spell checker | |
KR101709693B1 (ko) | 크라우드 소싱을 이용한 웹툰 언어 자동 번역 방법 | |
Okhovvat et al. | A hidden Markov model for Persian part-of-speech tagging | |
Wang et al. | Conditional Random Field-based Parser and Language Model for Tradi-tional Chinese Spelling Checker | |
CN104699662A (zh) | 识别整体符号串的方法和装置 | |
JP6232774B2 (ja) | 形態素解析装置、形態素解析方法、及び、形態素解析プログラム | |
de Mendonça Almeida et al. | Evaluating phonetic spellers for user-generated content in Brazilian Portuguese | |
CN112530406A (zh) | 一种语音合成方法、语音合成装置及智能设备 | |
JP5795302B2 (ja) | 形態素解析装置、方法、及びプログラム | |
Lu et al. | Language model for Mongolian polyphone proofreading | |
Aggarwal et al. | A survey on parts of speech tagging for Indian languages | |
Krishnapriya et al. | Design of a POS tagger using conditional random fields for Malayalam | |
JP2632806B2 (ja) | 言語解析装置 | |
Hu et al. | Non-Deterministic Segmentation for Chinese Lattice Parsing. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160516 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170414 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170425 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170621 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170926 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20171009 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6232774 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |