JP7332486B2 - 記号列変換装置および記号列変換方法 - Google Patents
記号列変換装置および記号列変換方法 Download PDFInfo
- Publication number
- JP7332486B2 JP7332486B2 JP2020001450A JP2020001450A JP7332486B2 JP 7332486 B2 JP7332486 B2 JP 7332486B2 JP 2020001450 A JP2020001450 A JP 2020001450A JP 2020001450 A JP2020001450 A JP 2020001450A JP 7332486 B2 JP7332486 B2 JP 7332486B2
- Authority
- JP
- Japan
- Prior art keywords
- string
- symbol
- output
- input
- symbol string
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/42—Data-driven translation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/53—Processing of non-Latin text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/151—Transformation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/51—Translation evaluation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/55—Rule-based translation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Description
20A 生成部
20B 導出部
20C 特定部
22A ルール情報
22B 学習モデル
Claims (7)
- 入力記号と、前記入力記号を予め定めた変換条件に応じて変換した1または複数の出力記号と、を対応付けたルール情報に基づいて、1または複数の前記入力記号を含む入力記号列に対応する、1または複数の前記出力記号を含む複数の出力記号候補列を生成する生成部と、
複数の前記出力記号候補列の各々の信頼度を、学習モデルを用いて導出する導出部と、
最も高い信頼度の前記出力記号候補列を、前記入力記号列に対応する出力記号列として特定する特定部と、
を備え、
前記信頼度は、
前記出力記号候補列と、前記入力記号列に対応する正解出力記号列と、の類似度である、
記号列変換装置。 - 前記導出部は、
前記入力記号列と前記出力記号候補列との対からなる入力データから前記信頼度を導出するための前記学習モデルを用いて、前記信頼度を導出する、
請求項1に記載の記号列変換装置。 - 前記類似度は、
前記出力記号候補列と前記正解出力記号列との編集距離および音素距離の少なくとも一方が近いほど高い、
請求項1または請求項2に記載の記号列変換装置。 - 前記学習モデルは、
前記類似度の変化率に対する前記信頼度の変化率が、前記類似度が完全一致を示す値に近づくほど高くなる関数を用いて、前記類似度を変換した値を、前記信頼度として導出するためのモデルである、
請求項1~請求項3の何れか1項に記載の記号列変換装置。 - 前記学習モデルを学習する学習部を備える、
請求項1~請求項4の何れか1項に記載の記号列変換装置。 - 前記入力記号列と該入力記号列に対応する前記出力記号列とは、表音文字列と音素列、表意文字および表語文字の少なくとも一方を含む文字列と該文字列の読みを示す記号列、正規化前の文字列と正規化された文字列、である、
請求項1~請求項5の何れか1項に記載の記号列変換装置。 - コンピュータによって実行される記号列変換方法であって、
入力記号と、前記入力記号を予め定めた変換条件に応じて変換した1または複数の出力記号と、を対応付けたルール情報に基づいて、1または複数の前記入力記号を含む入力記号列に対応する、1または複数の前記出力記号を含む複数の出力記号候補列を生成するステップと、
複数の前記出力記号候補列の各々の信頼度を、学習モデルを用いて導出するステップと、
最も高い信頼度の前記出力記号候補列を、前記入力記号列に対応する出力記号列として特定するステップと、
を含み、
前記信頼度は、前記出力記号候補列と、前記入力記号列に対応する正解出力記号列と、の類似度である、
記号列変換方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020001450A JP7332486B2 (ja) | 2020-01-08 | 2020-01-08 | 記号列変換装置および記号列変換方法 |
US17/004,069 US11809831B2 (en) | 2020-01-08 | 2020-08-27 | Symbol sequence converting apparatus and symbol sequence conversion method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020001450A JP7332486B2 (ja) | 2020-01-08 | 2020-01-08 | 記号列変換装置および記号列変換方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021111051A JP2021111051A (ja) | 2021-08-02 |
JP7332486B2 true JP7332486B2 (ja) | 2023-08-23 |
Family
ID=76655508
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020001450A Active JP7332486B2 (ja) | 2020-01-08 | 2020-01-08 | 記号列変換装置および記号列変換方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US11809831B2 (ja) |
JP (1) | JP7332486B2 (ja) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005092682A (ja) | 2003-09-19 | 2005-04-07 | Nippon Hoso Kyokai <Nhk> | 翻字装置、及び翻字プログラム |
JP2010009329A (ja) | 2008-06-27 | 2010-01-14 | Internatl Business Mach Corp <Ibm> | 文字列変換を行う情報処理装置、文字列変換方法、プログラム、および情報処理システム |
JP2015169947A (ja) | 2014-03-04 | 2015-09-28 | 日本電信電話株式会社 | モデル学習装置、形態素解析装置、及び方法 |
US20160179774A1 (en) | 2014-12-18 | 2016-06-23 | International Business Machines Corporation | Orthographic Error Correction Using Phonetic Transcription |
US20180308003A1 (en) | 2017-04-21 | 2018-10-25 | Pranjal Singh | Hybrid approach to approximate string matching using machine learning |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7403888B1 (en) * | 1999-11-05 | 2008-07-22 | Microsoft Corporation | Language input user interface |
US20030088416A1 (en) * | 2001-11-06 | 2003-05-08 | D.S.P.C. Technologies Ltd. | HMM-based text-to-phoneme parser and method for training same |
EP1618556A1 (en) * | 2003-04-30 | 2006-01-25 | Loquendo S.p.A. | Grapheme to phoneme alignment method and relative rule-set generating system |
US7418387B2 (en) * | 2004-11-24 | 2008-08-26 | Microsoft Corporation | Generic spelling mnemonics |
JP4961755B2 (ja) * | 2006-01-23 | 2012-06-27 | 富士ゼロックス株式会社 | 単語アライメント装置、単語アライメント方法、単語アライメントプログラム |
US7831911B2 (en) * | 2006-03-08 | 2010-11-09 | Microsoft Corporation | Spell checking system including a phonetic speller |
JP2009199434A (ja) | 2008-02-22 | 2009-09-03 | Mitsubishi Electric Corp | アルファベット文字列日本語読み変換装置及びアルファベット文字列日本語読み変換プログラム |
US8615388B2 (en) * | 2008-03-28 | 2013-12-24 | Microsoft Corporation | Intra-language statistical machine translation |
US10049655B1 (en) * | 2016-01-05 | 2018-08-14 | Google Llc | Biasing voice correction suggestions |
KR20210016767A (ko) * | 2019-08-05 | 2021-02-17 | 삼성전자주식회사 | 음성 인식 방법 및 음성 인식 장치 |
-
2020
- 2020-01-08 JP JP2020001450A patent/JP7332486B2/ja active Active
- 2020-08-27 US US17/004,069 patent/US11809831B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005092682A (ja) | 2003-09-19 | 2005-04-07 | Nippon Hoso Kyokai <Nhk> | 翻字装置、及び翻字プログラム |
JP2010009329A (ja) | 2008-06-27 | 2010-01-14 | Internatl Business Mach Corp <Ibm> | 文字列変換を行う情報処理装置、文字列変換方法、プログラム、および情報処理システム |
JP2015169947A (ja) | 2014-03-04 | 2015-09-28 | 日本電信電話株式会社 | モデル学習装置、形態素解析装置、及び方法 |
US20160179774A1 (en) | 2014-12-18 | 2016-06-23 | International Business Machines Corporation | Orthographic Error Correction Using Phonetic Transcription |
US20180308003A1 (en) | 2017-04-21 | 2018-10-25 | Pranjal Singh | Hybrid approach to approximate string matching using machine learning |
Also Published As
Publication number | Publication date |
---|---|
US11809831B2 (en) | 2023-11-07 |
JP2021111051A (ja) | 2021-08-02 |
US20210209314A1 (en) | 2021-07-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7280382B2 (ja) | 数字列のエンドツーエンド自動音声認識 | |
JP6251958B2 (ja) | 発話解析装置、音声対話制御装置、方法、及びプログラム | |
KR20230009564A (ko) | 앙상블 스코어를 이용한 학습 데이터 교정 방법 및 그 장치 | |
JP7190283B2 (ja) | 音声認識結果整形モデル学習装置およびそのプログラム | |
US11694028B2 (en) | Data generation apparatus and data generation method that generate recognition text from speech data | |
Rajendran et al. | A robust syllable centric pronunciation model for Tamil text to speech synthesizer | |
Baby et al. | Non-native english lexicon creation for bilingual speech synthesis | |
JP7332486B2 (ja) | 記号列変換装置および記号列変換方法 | |
Route et al. | Multimodal, multilingual grapheme-to-phoneme conversion for low-resource languages | |
JP2023093349A (ja) | 情報処理装置及び情報処理方法 | |
JP2016161765A (ja) | 発音系列拡張装置およびそのプログラム | |
US11080488B2 (en) | Information processing apparatus, output control method, and computer-readable recording medium | |
Chowdhury et al. | Bangla grapheme to phoneme conversion using conditional random fields | |
Kabra et al. | Auto spell suggestion for high quality speech synthesis in hindi | |
JP2009199434A (ja) | アルファベット文字列日本語読み変換装置及びアルファベット文字列日本語読み変換プログラム | |
JP2021089300A (ja) | 多言語音声認識およびテーマ−意義素解析方法および装置 | |
Saychum et al. | Efficient Thai Grapheme-to-Phoneme Conversion Using CRF-Based Joint Sequence Modeling. | |
US20180033425A1 (en) | Evaluation device and evaluation method | |
JP4226942B2 (ja) | アクセント位置推定方法、装置およびプログラム | |
JP2024017194A (ja) | 音声合成装置、音声合成方法およびプログラム | |
JP2013175067A (ja) | 自動読み付与装置及び自動読み付与方法 | |
US11893349B2 (en) | Systems and methods for generating locale-specific phonetic spelling variations | |
CN113811946B (zh) | 数字序列的端到端自动语音识别 | |
Adnew et al. | Semantically Corrected Amharic Automatic Speech Recognition | |
O’Neil et al. | Comparing methods of orthographic conversion for Bàsàá, a language of Cameroon |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220228 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230221 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230222 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230424 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230718 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230810 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7332486 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |