JP5258819B2 - 形態素解析装置及び形態素解析方法 - Google Patents
形態素解析装置及び形態素解析方法 Download PDFInfo
- Publication number
- JP5258819B2 JP5258819B2 JP2010051112A JP2010051112A JP5258819B2 JP 5258819 B2 JP5258819 B2 JP 5258819B2 JP 2010051112 A JP2010051112 A JP 2010051112A JP 2010051112 A JP2010051112 A JP 2010051112A JP 5258819 B2 JP5258819 B2 JP 5258819B2
- Authority
- JP
- Japan
- Prior art keywords
- analysis
- candidate
- morpheme
- reading
- determination
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Machine Translation (AREA)
Description
第1の実施の形態に係る形態素解析装置1は、日本語テキストの形態素解析を行なう。
図4における例では、判定部103により、第1解析候補の評価点は100点から40点となり、第2解析候補の評価点は50点のままとなる。よって選択部105は、評価点の高い第2解析候補を最適解析候補に選択し、出力部106に出力する。出力部106は、最適解析候補とした第2解析候補「過去に行ったセミナー(かこにいったせみなー)」を音声として出力したり、表示したりする。
第2の実施の形態に係る形態素解析装置(不図示)は、第1の実施の形態に係る形態素解析装置1と比較して、判定部103の行う処理が異なる。
第3の実施の形態に係る形態素解析装置(不図示)は、第1の実施の形態及び第2の実施の形態に係る形態素解析装置と比較して、判定部103の行う処理が異なる。本実施の形態に係る形態素解析装置(不図示)は、判定対象の単語が代表表記でない場合は、該単語が含まれる部分系列を削除対象とし、削除対象としなかった部分系列を残す。
第4の実施の形態に係る形態素解析装置4は、選択部105が選択した最適解析候補に基づいて、格納部104に格納される同音同義語テーブルの代表表記を変更する機能を備える。図11は、形態素解析装置4の構成を表すブロック図である。形態素解析装置4は、第1の実施の形態に係る形態素解析装置1と比較して、変更部400を備える点が異なる。また、格納部104に格納される同音同義語テーブルに各々の単語の出現回数を示す項目が追加されている点が異なる。
101 入力部
102 形態素解析部
103 判定部
104 格納部
105 選択部
106 出力部
400 変更部
Claims (5)
- 入力された日本語テキストの形態素解析を行ない複数の解析候補を作成する形態素解析部と、
一の読みと、前記一の読みに対して複数の表記を持つ同音同義の形態素単位の単語の組とを対応付け、前記組の中で、代表となる表記の代表表記を設定した同音同義語テーブルを格納する格納部と、
前記形態素解析により、複数の前記解析候補の同一部分の文字列に、形態素候補が複数存在する場合には、前記同音同義語テーブルを検索し、前記形態素候補ごとに前記文字列に含まれる単語の表記が前記代表表記であるか否かの判定を行なう判定部と、
前記判定の結果に基づいて、複数の前記解析候補の中から一の前記解析候補を選択する選択部と
を備え、
前記形態素解析部は、
各々の前記解析候補に優先度を表す評価点を付け、
前記判定部は、
前記判定の結果、前記単語の表記が前記代表表記か否かに応じて、前記形態素候補の文字列を含む前記解析候補の前記評価点を調整し、
前記選択部は、
前記評価点の最も高い前記解析候補を選択すること
を特徴とする形態素解析装置。 - 前記判定の結果、全ての前記文字列の前記評価点を下げた場合、前記判定部は、全ての前記文字列の評価点を前記判定前に戻すこと
を特徴とする、請求項1記載の形態素解析装置。 - 前記判定部は、前記判定により前記評価点を下げた前記解析候補を削除する
ことを特徴とする、請求項1記載の形態素解析装置。 - 前記選択部が選択した一の前記解析候補を用いて、
前記同音同義語テーブルにおける前記代表表記の設定を変更する変更部を
さらに備えることを特徴とする、請求項1乃至3記載の形態素解析装置。 - 入力された日本語テキストの形態素解析を行ない複数の解析候補を作成し、
一の読みと、前記一の読みに対して複数の表記を持つ同音同義の形態素単位の単語の組とを対応付け、前記組の中で、代表となる表記の代表表記を設定した同音同義語テーブルを格納し、
前記形態素解析により、複数の前記解析候補の同一部分の文字列に、形態素候補が複数存在する場合には、前記同音同義語テーブルを検索し、前記形態素候補ごとに前記文字列に含まれる単語の表記が前記代表表記であるか否かの判定を行ない、
前記判定の結果に基づいて、複数の前記解析候補の中から一の前記解析候補の選択を行ない、
前記形態素解析では、
各々の前記解析候補に優先度を表す評価点を付け、
前記判定では、
前記判定の結果、前記単語の表記が前記代表表記か否かに応じて、前記形態素候補の文字列を含む前記解析候補の前記評価点を調整し、
前記選択では、
前記評価点の最も高い前記解析候補を選択すること
を特徴とする形態素解析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010051112A JP5258819B2 (ja) | 2010-03-08 | 2010-03-08 | 形態素解析装置及び形態素解析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010051112A JP5258819B2 (ja) | 2010-03-08 | 2010-03-08 | 形態素解析装置及び形態素解析方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011186765A JP2011186765A (ja) | 2011-09-22 |
JP5258819B2 true JP5258819B2 (ja) | 2013-08-07 |
Family
ID=44792954
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010051112A Active JP5258819B2 (ja) | 2010-03-08 | 2010-03-08 | 形態素解析装置及び形態素解析方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5258819B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101767625B1 (ko) | 2016-08-05 | 2017-08-14 | 주식회사 코난테크놀로지 | 동적 계획법 기반 일본어 문장 최소 분할 탐색 장치 및 방법 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06119144A (ja) * | 1992-10-02 | 1994-04-28 | Toshiba Corp | 文書読み上げ装置 |
JPH096780A (ja) * | 1995-06-15 | 1997-01-10 | Canon Inc | 自然言語解析方法及びその装置 |
-
2010
- 2010-03-08 JP JP2010051112A patent/JP5258819B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2011186765A (ja) | 2011-09-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2542951B1 (en) | System and method for inputting text into electronic devices | |
JP2003248676A (ja) | 解データ編集処理装置、解データ編集処理方法、自動要約処理装置、および自動要約処理方法 | |
CN106168954B (zh) | 一种基于编辑距离的负面信息模式模糊匹配方法 | |
KR20070072723A (ko) | 발음 기호를 이용한 문자열 매칭 방법 및 시스템과 그방법을 기록한 컴퓨터 판독 가능한 기록매체 | |
JP2007004633A (ja) | 言語モデル作成装置およびそれにより作成された言語モデルを使用する言語処理装置 | |
JP2013519131A (ja) | 特に小型キーボード装置向けのインターネットコーパスを用いた文脈感応型自動言語訂正 | |
JP2005157524A (ja) | 質問応答システムおよび質問応答処理方法 | |
KR101235501B1 (ko) | 이름을 생성하고 선택하기 위한 시스템 | |
JPWO2012096388A1 (ja) | 意外性判定システム、意外性判定方法およびプログラム | |
JP4738847B2 (ja) | データ検索装置および方法 | |
CN115101042B (zh) | 一种文本处理方法、装置及设备 | |
US8244732B2 (en) | Named entity marking apparatus, named entity marking method, and computer readable medium thereof | |
JP5853595B2 (ja) | 形態素解析装置、方法、プログラム、音声合成装置、方法、プログラム | |
KR100542757B1 (ko) | 음운변이 규칙을 이용한 외래어 음차표기 자동 확장 방법및 그 장치 | |
JP5258819B2 (ja) | 形態素解析装置及び形態素解析方法 | |
JP5642037B2 (ja) | 検索装置、検索方法およびプログラム | |
JP4106470B2 (ja) | 解データ編集処理装置および処理方法 | |
KR101351555B1 (ko) | 대용량 데이터의 텍스트마이닝을 위한 의미기반 분류 추출시스템 | |
JP4187213B2 (ja) | 自動要約処理装置および自動要約処理方法 | |
JP2019095603A (ja) | 情報生成プログラム、単語抽出プログラム、情報処理装置、情報生成方法及び単語抽出方法 | |
JP7124358B2 (ja) | 出力プログラム、情報処理装置及び出力制御方法 | |
JP5533853B2 (ja) | 読み方判断装置、方法、プログラム、及び音声合成装置 | |
JPS60254367A (ja) | 文章分析装置 | |
CN111429886A (zh) | 一种语音识别方法及系统 | |
KR101777141B1 (ko) | 한글 입력 키보드를 이용한 훈민정음 기반 중국어 및 외국어 입력 장치 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110916 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20111125 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20111205 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130111 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130311 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130329 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130423 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160502 Year of fee payment: 3 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5258819 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313114 Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |