JP7243818B2 - 読み曖昧性解消装置、読み曖昧性解消方法、及び読み曖昧性解消プログラム - Google Patents
読み曖昧性解消装置、読み曖昧性解消方法、及び読み曖昧性解消プログラム Download PDFInfo
- Publication number
- JP7243818B2 JP7243818B2 JP2021518262A JP2021518262A JP7243818B2 JP 7243818 B2 JP7243818 B2 JP 7243818B2 JP 2021518262 A JP2021518262 A JP 2021518262A JP 2021518262 A JP2021518262 A JP 2021518262A JP 7243818 B2 JP7243818 B2 JP 7243818B2
- Authority
- JP
- Japan
- Prior art keywords
- morpheme
- reading
- disambiguation
- score
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 14
- 238000012545 processing Methods 0.000 claims description 9
- 230000000877 morphologic effect Effects 0.000 description 25
- 238000004458 analytical method Methods 0.000 description 24
- 238000010586 diagram Methods 0.000 description 13
- 238000005516 engineering process Methods 0.000 description 5
- 241000282994 Cervidae Species 0.000 description 3
- 239000002245 particle Substances 0.000 description 3
- 235000004415 Burchellia bubalina Nutrition 0.000 description 2
- 240000008537 Burchellia bubalina Species 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000008030 elimination Effects 0.000 description 2
- 238000003379 elimination reaction Methods 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 241001026509 Kata Species 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/268—Morphological analysis
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Description
メモリと、
前記メモリに接続された少なくとも1つのプロセッサと、
を含み、
前記プロセッサは、
形態素列と、前記形態素列の各形態素の品詞とを受け付け、
前記形態素列の各形態素について、前記形態素の表記と品詞に基づいて、前記形態素の表記と品詞の組み合わせ毎に予め定められた前記形態素の読み候補から、前記形態素の読み候補を取得し、
他の形態素の出現位置と、前記他の形態素の表記、品詞、又は文字種とに対応して前記形態素の読みが予め定められた曖昧性解消規則を用いて、前記取得された前記形態素の読み候補から、前記形態素の読みを決定する、
ように構成されている読み曖昧性解消装置。
形態素列と、前記形態素列の各形態素の品詞とを受け付け、
前記形態素列の各形態素について、前記形態素の表記と品詞に基づいて、前記形態素の表記と品詞の組み合わせ毎に予め定められた前記形態素の読み候補から、前記形態素の読み候補を取得し、
他の形態素の出現位置と、前記他の形態素の表記、品詞、又は文字種とに対応して前記形態素の読みが予め定められた曖昧性解消規則を用いて、前記取得された前記形態素の読み候補から、前記形態素の読みを決定する
処理をコンピュータに実行させるための読み曖昧性解消プログラムを記憶した非一時的記憶媒体。
Claims (4)
- 形態素列と、前記形態素列の各形態素の品詞とを受け付ける入力部と、
前記形態素列の各形態素について、前記形態素に対応する語のカテゴリ情報を付与するカテゴリ付与部と、
前記形態素列の各形態素について、前記形態素の表記と品詞に基づいて、前記形態素の表記と品詞の組み合わせ毎に予め定められた前記形態素の読み候補から、前記形態素の読み候補を取得する曖昧語候補取得部と、
他の形態素の出現位置と、前記他の形態素の表記、品詞、文字種、又はカテゴリとに対応して前記形態素の読み及びスコアが予め定められた曖昧性解消規則を用いて、前記取得された前記形態素の読み候補から、前記形態素の読みを決定する曖昧性解消部と、
を含み、
前記曖昧性解消規則は、前記他の形態素の出現位置と、前記他の形態素の表記、品詞、又は文字種とに対応して前記形態素の読み及びスコアが予め定められたものであり、
前記曖昧性解消部は、前記取得された前記形態素の読み候補の各々について、前記読み候補についての複数の前記曖昧性解消規則のうちの何れかに該当する場合に、該当する前記曖昧性解消規則のスコアを、前記読み候補のスコアとして加算し、
前記スコアが最も高い前記読み候補のスコアが閾値を超えた場合に、前記形態素の読みとして決定し、前記スコアが最も高い前記読み候補のスコアが閾値以下である場合に、予め定められた前記読み候補を前記形態素の読みとして決定する
読み曖昧性解消装置。 - 前記形態素の読み候補は、前記読みのアクセントを含む請求項1記載の読み曖昧性解消装置。
- 入力部が、形態素列と、前記形態素列の各形態素の品詞とを受け付け、
カテゴリ付与部が、前記形態素列の各形態素について、前記形態素に対応する語のカテゴリ情報を付与し、
曖昧語候補取得部が、前記形態素列の各形態素について、前記形態素の表記と品詞に基づいて、前記形態素の表記と品詞の組み合わせ毎に予め定められた前記形態素の読み候補から、前記形態素の読み候補を取得し、
曖昧性解消部が、他の形態素の出現位置と、前記他の形態素の表記、品詞、文字種、又はカテゴリとに対応して前記形態素の読み及びスコアが予め定められた曖昧性解消規則を用いて、前記取得された前記形態素の読み候補から、前記形態素の読みを決定する
ことを含み、
前記曖昧性解消規則は、前記他の形態素の出現位置と、前記他の形態素の表記、品詞、又は文字種とに対応して前記形態素の読み及びスコアが予め定められたものであり、
前記曖昧性解消部は、前記取得された前記形態素の読み候補の各々について、前記読み候補についての複数の前記曖昧性解消規則のうちの何れかに該当する場合に、該当する前記曖昧性解消規則のスコアを、前記読み候補のスコアとして加算し、
前記スコアが最も高い前記読み候補のスコアが閾値を超えた場合に、前記形態素の読みとして決定し、前記スコアが最も高い前記読み候補のスコアが閾値以下である場合に、予め定められた前記読み候補を前記形態素の読みとして決定する
読み曖昧性解消方法。 - 形態素列と、前記形態素列の各形態素の品詞とを受け付け、
前記形態素列の各形態素について、前記形態素に対応する語のカテゴリ情報を付与し、
前記形態素列の各形態素について、前記形態素の表記と品詞に基づいて、前記形態素の表記と品詞の組み合わせ毎に予め定められた前記形態素の読み候補から、前記形態素の読み候補を取得し、
他の形態素の出現位置と、前記他の形態素の表記、品詞、文字種、又はカテゴリとに対応して前記形態素の読み及びスコアが予め定められた曖昧性解消規則を用いて、前記取得された前記形態素の読み候補から、前記形態素の読みを決定する
ことを含み、
前記曖昧性解消規則は、前記他の形態素の出現位置と、前記他の形態素の表記、品詞、又は文字種とに対応して前記形態素の読み及びスコアが予め定められたものであり、
前記形態素の読みを決定することでは、前記取得された前記形態素の読み候補の各々について、前記読み候補についての複数の前記曖昧性解消規則のうちの何れかに該当する場合に、該当する前記曖昧性解消規則のスコアを、前記読み候補のスコアとして加算し、
前記スコアが最も高い前記読み候補のスコアが閾値を超えた場合に、前記形態素の読みとして決定し、前記スコアが最も高い前記読み候補のスコアが閾値以下である場合に、予め定められた前記読み候補を前記形態素の読みとして決定する
処理をコンピュータに実行させるための読み曖昧性解消プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2019/018451 WO2020225888A1 (ja) | 2019-05-08 | 2019-05-08 | 読み曖昧性解消装置、読み曖昧性解消方法、及び読み曖昧性解消プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2020225888A1 JPWO2020225888A1 (ja) | 2020-11-12 |
JP7243818B2 true JP7243818B2 (ja) | 2023-03-22 |
Family
ID=73051518
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021518262A Active JP7243818B2 (ja) | 2019-05-08 | 2019-05-08 | 読み曖昧性解消装置、読み曖昧性解消方法、及び読み曖昧性解消プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20230252983A1 (ja) |
JP (1) | JP7243818B2 (ja) |
WO (1) | WO2020225888A1 (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006030326A (ja) | 2004-07-13 | 2006-02-02 | Hitachi Ltd | 音声合成装置 |
JP2007248886A (ja) | 2006-03-16 | 2007-09-27 | Mitsubishi Electric Corp | 読み修正装置 |
-
2019
- 2019-05-08 WO PCT/JP2019/018451 patent/WO2020225888A1/ja active Application Filing
- 2019-05-08 US US17/608,731 patent/US20230252983A1/en active Pending
- 2019-05-08 JP JP2021518262A patent/JP7243818B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006030326A (ja) | 2004-07-13 | 2006-02-02 | Hitachi Ltd | 音声合成装置 |
JP2007248886A (ja) | 2006-03-16 | 2007-09-27 | Mitsubishi Electric Corp | 読み修正装置 |
Also Published As
Publication number | Publication date |
---|---|
WO2020225888A1 (ja) | 2020-11-12 |
US20230252983A1 (en) | 2023-08-10 |
JPWO2020225888A1 (ja) | 2020-11-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5901001B1 (ja) | 音響言語モデルトレーニングのための方法およびデバイス | |
US5930746A (en) | Parsing and translating natural language sentences automatically | |
Gorman et al. | Improving homograph disambiguation with supervised machine learning | |
CN105512110B (zh) | 一种基于模糊匹配与统计的错字词知识库构建方法 | |
JP2008083952A (ja) | 辞書作成支援システム、方法及びプログラム | |
US11941361B2 (en) | Automatically identifying multi-word expressions | |
JP6778655B2 (ja) | 単語連接識別モデル学習装置、単語連接検出装置、方法、及びプログラム | |
US8880391B2 (en) | Natural language processing apparatus, natural language processing method, natural language processing program, and computer-readable recording medium storing natural language processing program | |
JP5231698B2 (ja) | 日本語の表意文字の読み方を予測する方法 | |
Barrett et al. | Cross-lingual transfer of correlations between parts of speech and gaze features | |
JP2004303240A (ja) | 単語解析のためのシステムおよび方法 | |
Chennoufi et al. | Impact of morphological analysis and a large training corpus on the performances of Arabic diacritization | |
JP7243818B2 (ja) | 読み曖昧性解消装置、読み曖昧性解消方法、及び読み曖昧性解消プログラム | |
JP2007148630A (ja) | 特許分析装置、特許分析システム、特許分析方法およびプログラム | |
Kumar et al. | Learning agglutinative morphology of Indian languages with linguistically motivated adaptor grammars | |
JP2006178671A (ja) | 同義語対抽出方法、同義語対抽出装置、同義語対抽出プログラム、及び同義語対抽出プログラム記録媒体 | |
Barros et al. | Inflection generation for spanish verbs using supervised learning | |
Hatori et al. | Predicting word pronunciation in Japanese | |
de Almeida | Suffix Identification in Portuguese using Transducers | |
JP6599188B2 (ja) | 対訳辞書作成装置、対訳辞書作成方法およびプログラム | |
KR20180016840A (ko) | 등장인물 추출 방법 및 장치 | |
JP6232774B2 (ja) | 形態素解析装置、形態素解析方法、及び、形態素解析プログラム | |
Trosterud | Language technology in russia | |
CN113806479A (zh) | 文本注音的方法、装置、电子设备及存储介质 | |
JP2018194959A (ja) | 発話文判定装置、方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211018 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221004 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221122 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230207 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230220 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7243818 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |