JP7243818B2 - 読み曖昧性解消装置、読み曖昧性解消方法、及び読み曖昧性解消プログラム - Google Patents

読み曖昧性解消装置、読み曖昧性解消方法、及び読み曖昧性解消プログラム Download PDF

Info

Publication number
JP7243818B2
JP7243818B2 JP2021518262A JP2021518262A JP7243818B2 JP 7243818 B2 JP7243818 B2 JP 7243818B2 JP 2021518262 A JP2021518262 A JP 2021518262A JP 2021518262 A JP2021518262 A JP 2021518262A JP 7243818 B2 JP7243818 B2 JP 7243818B2
Authority
JP
Japan
Prior art keywords
morpheme
reading
disambiguation
score
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021518262A
Other languages
English (en)
Other versions
JPWO2020225888A1 (ja
Inventor
のぞみ 小林
勇祐 井島
準二 富田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Publication of JPWO2020225888A1 publication Critical patent/JPWO2020225888A1/ja
Application granted granted Critical
Publication of JP7243818B2 publication Critical patent/JP7243818B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Description

開示の技術は、読み曖昧性解消装置、読み曖昧性解消方法、及び読み曖昧性解消プログラムに関する。
読み上げ等で必要となる音声合成システムにおいて、語の読みを正しく推定することは、システムの精度向上のための重要な要素の一つである。語の読みの曖昧性解消とは、「たくさんの方(カタ)からいただきました」及び「西の方(ホウ)から来ました」の「方」のように、同じ表記で異なる読みを持つ語について、入力文における正しい読みを推定する問題である。
語の読みの曖昧性解消の従来研究として、形態素表記および品詞のn-gramを特徴とした解消手法が提案されている(米田隆一、「形態素解析器の出力する読みの曖昧性解消」、奈良先端科学技術大学院大学 修士論文、NAIST-IS-MT0151124、2003年)。
また、関連する研究として、読みを推定する手法も提案されており、特徴として文字のn-gramを使用している(笹田鉄郎、森信介、河原達也、「音声とテキストからの語彙獲得による読み推定精度の向上」、言語処理学会第14回年次大会発表論文集 p.420-p.243、2008年)。
読みの曖昧性解消には、ケース(1)と、ケース(2)とがある。ケース(1)は、対象とする語の周辺に出現する語が手がかりとなる場合である。また、ケース(2)は、出現している文で語られているトピック(例えば「野球」「将棋」等)が手がかりとなる場合である。ケース(1)については従来のn-gramでとらえることができる。しかし、従来手法で使われている形態素表記や文字表記では、例えば「鹿の角(ツノ)」と「水牛の角(ツノ)」は異なるn-gramとなる。このため、学習データに「鹿の角」が存在しても「水牛の角」が存在しなければ、後者に対して正しく「角(ツノ)」と推定することはできず、バリエーションをカバーできないという問題がある。
また、ケース(2)については、nに大きな値を設定すれば理論上は可能だが、実用で使われる3-gram、5-gramではとらえられないという問題がある。例えば「プロ野球/人生/17年/目/を/迎える/40/歳/、/巨人(組織の「キョジン」、キョにアクセントがくる)/谷/が/「/1/番/」で/今季/初/出場」(”/”は形態素境界)の場合、「巨人」の前後3から5形態素を見ただけでは一般名詞の「巨人」なのか、組織の「巨人」なのかを区別することは難しい。
開示の技術は、上記の点に鑑みてなされたものであり、形態素列における各形態素の読みを精度よく推定することができる読み曖昧性解消装置、読み曖昧性解消方法、及び読み曖昧性解消プログラムを提供することを目的とする。
本開示の第1態様は、読み曖昧性解消装置であって、形態素列と、前記形態素列の各形態素の品詞とを受け付ける入力部と、前記形態素列の各形態素について、前記形態素の表記と品詞に基づいて、前記形態素の表記と品詞の組み合わせ毎に予め定められた前記形態素の読み候補から、前記形態素の読み候補を取得する曖昧語候補取得部と、他の形態素の出現位置と、前記他の形態素の表記、品詞、又は文字種とに対応して前記形態素の読みが予め定められた曖昧性解消規則を用いて、前記取得された前記形態素の読み候補から、前記形態素の読みを決定する曖昧性解消部と、を含む。
本開示の第2態様は、読み曖昧性解消方法であって、入力部が、形態素列と、前記形態素列の各形態素の品詞とを受け付け、曖昧語候補取得部が、前記形態素列の各形態素について、前記形態素の表記と品詞に基づいて、前記形態素の表記と品詞の組み合わせ毎に予め定められた前記形態素の読み候補から、前記形態素の読み候補を取得し、曖昧性解消部が、他の形態素の出現位置と、前記他の形態素の表記、品詞、又は文字種とに対応して前記形態素の読みが予め定められた曖昧性解消規則を用いて、前記取得された前記形態素の読み候補から、前記形態素の読みを決定する。
本開示の第3態様は、読み曖昧性解消プログラムであって、形態素列と、前記形態素列の各形態素の品詞とを受け付け、前記形態素列の各形態素について、前記形態素の表記と品詞に基づいて、前記形態素の表記と品詞の組み合わせ毎に予め定められた前記形態素の読み候補から、前記形態素の読み候補を取得し、他の形態素の出現位置と、前記他の形態素の表記、品詞、又は文字種とに対応して前記形態素の読みが予め定められた曖昧性解消規則を用いて、前記取得された前記形態素の読み候補から、前記形態素の読みを決定する処理をコンピュータに実行させるためのプログラムである。
開示の技術によれば、形態素列における各形態素の読みを精度よく推定することができる。
本実施形態の読み曖昧性解消装置として機能するコンピュータの一例の概略ブロック図である。 入力される形態素解析結果の一例を示す図である。 入力される形態素解析結果の一例を示す図である。 本実施形態の読み曖昧性解消装置の一例の構成を示すブロック図である カテゴリ情報付き形態素解析結果の一例を示す図である。 読み候補リストの一例を示す図である。 読み候補リストの他の例を示す図である。 曖昧性解消規則リストの一例を示す図である。 曖昧性解消規則の規則部の適用範囲を説明するための図である。 曖昧性解消規則の規則部の条件タイプを説明するための図である。 曖昧性解消済形態素解析結果の一例を示す図である。 曖昧性解消済形態素解析結果の一例を示す図である。 本実施形態の読み曖昧性解消装置における読み曖昧性解消処理ルーチンの一例を示すフローチャートである。
以下、開示の技術の実施形態の一例を、図面を参照しつつ説明する。なお、各図面において同一又は等価な構成要素及び部分には同一の参照符号を付与している。また、図面の寸法比率は、説明の都合上誇張されており、実際の比率とは異なる場合がある。
図1は、本実施形態の読み曖昧性解消装置のハードウェア構成を示すブロック図である。
図1に示すように、読み曖昧性解消装置10は、CPU(Central Processing Unit)11、ROM(Read Only Memory)12、RAM(Random Access Memory)13、ストレージ14、入力部15、表示部16及び通信インタフェース(I/F)17を有する。各構成は、バス19を介して相互に通信可能に接続されている。
CPU11は、中央演算処理ユニットであり、各種プログラムを実行したり、各部を制御したりする。すなわち、CPU11は、ROM12又はストレージ14からプログラムを読み出し、RAM13を作業領域としてプログラムを実行する。CPU11は、ROM12又はストレージ14に記憶されているプログラムに従って、上記各構成の制御及び各種の演算処理を行う。本実施形態では、ROM12又はストレージ14には、入力された文の読みの曖昧性を解消するための読み曖昧性解消プログラムが格納されている。
ROM12は、各種プログラム及び各種データを格納する。RAM13は、作業領域として一時的にプログラム又はデータを記憶する。ストレージ14は、HDD(Hard Disk Drive)又はSSD(Solid State Drive)により構成され、オペレーティングシステムを含む各種プログラム、及び各種データを格納する。
入力部15は、マウス等のポインティングデバイス、及びキーボードを含み、各種の入力を行うために使用される。
本実施の形態における入力は、図2、図3に示すような、形態素列である「文」もしくは「文の集合」を、従来の形態素解析器により解析した形態素解析結果である。この形態素解析結果は、各形態素について、少なくとも「表記」と「読み(発音表記)」と「品詞」の情報を含む。
図2の例は、形態素列「鹿/が/角/を/こす/っ/た」の形態素解析結果であり、図3の例は、形態素列「セリーグ/では/12年/5月/の/杉内/俊哉/(/巨人/)/以来/の/記録」の形態素解析結果である。
表示部16は、例えば、液晶ディスプレイであり、各種の情報を表示する。表示部16は、タッチパネル方式を採用して、入力部15として機能しても良い。
通信インタフェース17は、他の機器と通信するためのインタフェースであり、例えば、イーサネット(登録商標)、FDDI、Wi-Fi(登録商標)等の規格が用いられる。
次に、読み曖昧性解消装置10の機能構成について説明する。
図4は、読み曖昧性解消装置の機能構成の例を示すブロック図である。
図4に示すように、読み曖昧性解消装置10は、機能構成として、カテゴリ辞書20、カテゴリ情報付与部22、読み候補リスト24、曖昧語候補取得部26、曖昧性解消規則リスト28、及び曖昧性解消部30を有する。各機能構成は、CPU11がROM12又はストレージ14に記憶された読み曖昧性解消プログラムを読み出し、RAM13に展開して実行することにより実現される。
カテゴリ辞書20は、各形態素の表記毎に、カテゴリ情報を格納した辞書であり、例えば、「日本語語彙大系」が使用できる。
カテゴリ情報付与部22は、カテゴリ辞書20を用いて、形態素列の各形態素について、形態素に対応する語のカテゴリ情報を付与する。具体的には、カテゴリ情報付与部22は、カテゴリ辞書20を参照して、入力された形態素解析結果の各形態素の表記に対応するカテゴリ情報を付与した、カテゴリ情報付き形態素解析結果を出力する(図5参照)。
読み候補リスト24は、例えば、図6に示すような、各形態素の表記及び主品詞の組み合わせ毎に、読み(発音表記)を格納したものである。読み(発音表記)では、アクセント位置情報である「’」が含まれている。図6の例では、形態素の表記「角」及び主品詞「名詞」の組み合わせに対して、2つの読み(発音表記)「カク’」「ツノ’」が格納されており、形態素の表記「角」及び主品詞「名詞」の組み合わせに対して、この2つの読み(発音表記)が、読み候補となる。
なお、読み候補リスト24は、例えば、図7に示すように、各形態素の表記及び主品詞の組み合わせ毎に、読み(発音表記)と共に、曖昧性解消後に付与すべき品詞の情報や、曖昧性解消されなかった場合にデフォルトとして付与すべき発音表記であることを示すフラグ情報等が格納されていてもよい。
曖昧語候補取得部26は、入力された形態素解析結果の各形態素について、当該形態素の表記と品詞に基づいて、読み候補リスト24を参照して、当該形態素の読み候補を取得する。
例えば、曖昧語候補取得部26は、形態素解析結果の各形態素について、当該形態素の品詞から、主品詞のみを切り出し、「表記」と「主品詞」の対で、読み候補リスト24を検索し、該当する対が存在すれば、当該対に対応する読み(発音表記)を、読み候補として取得する。主品詞の切り出しは、上記の図2、図3の例の場合、品詞を「:」で区切ったときの1つ目を抽出することで得られる。
例えば、上記図3の例の場合、形態素の表記「巨人」に対し、品詞「名詞:固有:組織」から主品詞「名詞」を切り出して、読み候補リスト24を検索し、「巨人 名詞 キョ’ジン」を読み候補として取得する。
また、上記図2の例の場合、形態素の表記「角」に対し、品詞「名詞」で、読み候補リスト24を検索し、「角 名詞 カク’」と「角 名詞 ツノ’」を読み候補として取得する。
曖昧性解消規則リスト28は、形態素の表記毎に、他の形態素の出現位置と、当該他の形態素の表記、品詞、又はカテゴリとに対応して当該形態素の読み及びスコアが予め定められた曖昧性解消規則が格納されている。
曖昧性解消規則の例を図8に示す。曖昧性解消規則は「表記」、「読み(発音表記)」、「規則部」、及び「スコア」から成り、さらに「規則部」は「適用範囲」、「条件タイプ」、「条件内容」の組からなる「条件」を持つ。曖昧性解消規則の「規則部」に、複数の「条件」が定義されてもよい。なお、図8の例では、規則部の「適用範囲」、「条件タイプ」、及び「条件内容」が「:」を区切り文字として記載されている。
「適用範囲」は、図9に示すように、範囲指定、出現位置指定(範囲)、又は出現位置指定により定義される。範囲指定は、文全体の形態素、前方に出現する形態素、又は後方に出現する形態素を対象として指定するためのものである。出現位置指定(範囲)は、形態素列中の所定範囲に出現する形態素を対象として指定するためのものである。出現位置指定は、前方の所定位置に出現する形態素、又は後方の所定位置に出現する形態素を対象として指定するためのものである。なお、範囲指定と、出現位置指定(範囲)とは、複数の条件を定義する場合には使用されない。
「条件タイプ」は、図10に示すように、「条件内容」で定義する内容がどの種類に関するものかを示すものであり、表記、品詞、カテゴリ情報、又は文字種が指定される。本実施の形態では、「条件タイプ」の先頭に「REXP_」と記載すると、条件表記を正規表現として扱うこととし、「条件タイプ」で文字種が指定された場合には、先頭に「REXP_」が必ず記載されるものとする。
「条件内容」は、「条件タイプ」で指定された種類における具体的な値であり、「条件タイプ」でカテゴリ情報が指定された場合には、カテゴリ番号が指定される。「条件タイプ」で文字種が指定された場合には、「条件内容」に、漢字、ひらなが、カタカナ、数字、英字などの文字種に該当する正規表現が指定される。例えば、曖昧性解消規則の「表記」が「御」であり、「読み(発音表記)」が「オ」であり、「規則部」が、「+1:REXP_C:¥p{InHiragana}」である場合には、「直後の形態素表記の文字種がひらがなを含む」という規則に該当すれば、「御」の「読み(発音表記)」が「オ」であると判定することを指定する。例えば、「御/祝い」の御の「読み(発音表記)」を「オ」と判定することができる。
曖昧性解消部30は、入力された形態素解析結果の各形態素に対し、当該形態素の読み候補の各々について、形態素解析結果が、曖昧性解消規則リスト28から得られる、当該読み候補についての曖昧性解消規則に該当する場合に、曖昧性解消規則のスコアを、当該読み候補のスコアとして加算する。曖昧性解消部30は、スコアが最も高い読み候補を、当該形態素の読みとして決定する。
具体的には、曖昧性解消部30は、読み候補が存在する各形態素を解消対象として、カテゴリ情報付き形態素解析結果を、当該読み候補に対する曖昧性解消規則の「規則部」と照合し、該当する曖昧性解消規則があれば、その曖昧性解消規則のスコアを当該読み候補のスコアとして加算する。
曖昧性解消規則の照合は、各条件の「適用範囲」の形態素について、「条件タイプ」が「条件内容」に該当するかをチェックすることで行う。複数の条件が存在する場合は個々の条件についてチェックを実施し、一つでも該当しない条件が存在すれば、曖昧性解消規則に該当しないと判断する。
上記図2の例の場合、「角」が解消対象であり、その解消対象に対し、曖昧性解消規則の規則部「-2:CAT:537 -1:REXP_POS:^格助詞」を適用する。この規則部は「二つ前の形態素のカテゴリ情報が537」かつ「ひとつ前の形態素の品詞が“^格助詞(正規表現で、格助詞から始まることを表す)”」を表しており、上記図2の形態素解析結果の例はこの規則部を満たすため、「ツノ’」という発音表記にスコア10が加点される。
上記図3の例の場合、「巨人」が解消対象であり、曖昧性解消規則の規則部「A:REXP_WF:リーグ$」が適用される。この規則部は「文中の形態素いずれかの表記が”リーグ$(正規表現で、リーグで終わることを表す”)」を表しており、先頭の形態素の表記「セリーグ」がこの規則部に該当するため、スコア5点が加算される。
また、「条件タイプ」が「文字種」の場合、解消対象の形態素の表記に対し、「条件内容」で指定された文字種を表す正規表現を満たすかどうかを判定することにより、曖昧性解消規則の照合を行う。
該当する曖昧性解消規則を全て適用した後、読み候補である読み(発音表記)のうち、スコアのもっとも高い読み候補を、解消後の読み(発音表記)と判断し、入力された形態素解析結果における「読み(発音表記)」フィールドを、解消後の読み(発音表記)に書き換える。曖昧性が解消されなかった場合、書き換えは行わない。なお、スコアに閾値を設け、読み候補のスコアが閾値を超えた場合に曖昧性が解消されたと判断して、当該読み候補への書き換えを実施してもよい。
例えば、上記図2の形態素解析結果の例では、図11に示すように、「角」の読みが、「ツノ’」に書き換えられ、読み曖昧性解消済形態素解析結果として、表示部16に表示される。
また、上記図3の例では、図12に示すように、「巨人」の読みが、「キョ’ジン」に書き換えられ、読み曖昧性解消済形態素解析結果として、表示部16に表示される。
また、「読み(発音表記)」フィールドだけでなく、読み候補リストに解消後の品詞(図7参照)を持たせておいて、品詞フィールドの書き換えを実施してもよい。
さらに、上記のルールによる方法で曖昧性が解消されなかった場合、もしくは、閾値で棄却された場合、読み候補リストに「デフォルトフラグ」を用意しておき、フラグが付与されている読み候補の情報に修正することもできる。
次に、読み曖昧性解消装置10の作用について説明する。
図13は、読み曖昧性解消装置による読み曖昧性解消処理の流れを示すフローチャートである。CPU11がROM12又はストレージ14から読み曖昧性解消プログラムを読み出して、RAM13に展開して実行することにより、読み曖昧性解消処理が行なわれる。
ステップS100において、CPU11は、カテゴリ情報付与部22として、カテゴリ辞書20を用いて、入力部15により入力された形態素解析結果の各形態素について、形態素に対応する語のカテゴリ情報を付与する。
ステップS102において、CPU11は、曖昧語候補取得部26として、入力された形態素解析結果の各形態素について、当該形態素の表記と品詞に基づいて、読み候補リスト24を参照して、当該形態素の読み候補を取得する。
ステップS104において、CPU11は、曖昧性解消部30として、入力された形態素解析結果の各形態素に対し、当該形態素の読み候補の各々について、曖昧性解消規則リスト28から得られる、当該読み候補についての曖昧性解消規則に該当する場合に、曖昧性解消規則のスコアを、当該読み候補のスコアとして加算する。そして、CPU11は、入力された形態素解析結果の各形態素に対し、スコアが最も高い読み候補を、当該形態素の読みとして決定する。
以上説明したように、本開示の技術の実施形態の読み曖昧性解消装置10は、他の形態素の出現位置と、他の形態素の表記、品詞、又はカテゴリとに対応して形態素の読みが予め定められた曖昧性解消規則を用いて、取得された形態素の読み候補から、形態素の読みを決定する。これにより、形態素解析結果に含まれる形態素列における各形態素の読みを精度よく推定することができる。特に、音声合成の入力となる語の読みの曖昧性を解消することができる。
なお、上記各実施形態でCPUがソフトウェア(プログラム)を読み込んで実行した言語処理を、CPU以外の各種のプロセッサが実行してもよい。この場合のプロセッサとしては、FPGA(Field-Programmable Gate Array)等の製造後に回路構成を変更可能なPLD(Programmable Logic Device)、及びASIC(Application Specific Integrated Circuit)等の特定の処理を実行させるために専用に設計された回路構成を有するプロセッサである専用電気回路等が例示される。また、読み曖昧性解消処理を、これらの各種のプロセッサのうちの1つで実行してもよいし、同種又は異種の2つ以上のプロセッサの組み合わせ(例えば、複数のFPGA、及びCPUとFPGAとの組み合わせ等)で実行してもよい。また、これらの各種のプロセッサのハードウェア的な構造は、より具体的には、半導体素子等の回路素子を組み合わせた電気回路である。
また、上記各実施形態では、読み曖昧性解消プログラムがストレージ14に予め記憶(インストール)されている態様を説明したが、これに限定されない。プログラムは、CD-ROM(Compact Disk Read Only Memory)、DVD-ROM(Digital Versatile Disk Read Only Memory)、及びUSB(Universal Serial Bus)メモリ等の非一時的(non-transitory)記憶媒体に記憶された形態で提供されてもよい。また、プログラムは、ネットワークを介して外部装置からダウンロードされる形態としてもよい。
また、カテゴリ辞書20、読み候補リスト24、及び曖昧性解消規則リスト28が、読み曖昧性解消装置10内にある場合を例に説明したが、これに限定されるものではない。カテゴリ辞書20、読み候補リスト24、及び曖昧性解消規則リスト28の少なくとも1つが、読み曖昧性解消装置10の外部にあってもよい。
また、形態素解析結果に含まれる読みを書き換える読み曖昧性解消装置10に本開示の技術を適用する場合を例に説明したが、これに限定されるものではない。例えば、形態素列と、形態素列の各形態素の品詞とを入力として、各形態素の読みを推定する装置に、本開示の技術を適用してもよい。
以上の実施形態に関し、更に以下の付記を開示する。
(付記項1)
メモリと、
前記メモリに接続された少なくとも1つのプロセッサと、
を含み、
前記プロセッサは、
形態素列と、前記形態素列の各形態素の品詞とを受け付け、
前記形態素列の各形態素について、前記形態素の表記と品詞に基づいて、前記形態素の表記と品詞の組み合わせ毎に予め定められた前記形態素の読み候補から、前記形態素の読み候補を取得し、
他の形態素の出現位置と、前記他の形態素の表記、品詞、又は文字種とに対応して前記形態素の読みが予め定められた曖昧性解消規則を用いて、前記取得された前記形態素の読み候補から、前記形態素の読みを決定する、
ように構成されている読み曖昧性解消装置。
(付記項2)
形態素列と、前記形態素列の各形態素の品詞とを受け付け、
前記形態素列の各形態素について、前記形態素の表記と品詞に基づいて、前記形態素の表記と品詞の組み合わせ毎に予め定められた前記形態素の読み候補から、前記形態素の読み候補を取得し、
他の形態素の出現位置と、前記他の形態素の表記、品詞、又は文字種とに対応して前記形態素の読みが予め定められた曖昧性解消規則を用いて、前記取得された前記形態素の読み候補から、前記形態素の読みを決定する
処理をコンピュータに実行させるための読み曖昧性解消プログラムを記憶した非一時的記憶媒体。

Claims (4)

  1. 形態素列と、前記形態素列の各形態素の品詞とを受け付ける入力部と、
    前記形態素列の各形態素について、前記形態素に対応する語のカテゴリ情報を付与するカテゴリ付与部と、
    前記形態素列の各形態素について、前記形態素の表記と品詞に基づいて、前記形態素の表記と品詞の組み合わせ毎に予め定められた前記形態素の読み候補から、前記形態素の読み候補を取得する曖昧語候補取得部と、
    他の形態素の出現位置と、前記他の形態素の表記、品詞、文字種、又はカテゴリとに対応して前記形態素の読み及びスコアが予め定められた曖昧性解消規則を用いて、前記取得された前記形態素の読み候補から、前記形態素の読みを決定する曖昧性解消部と、
    を含み、
    前記曖昧性解消規則は、前記他の形態素の出現位置と、前記他の形態素の表記、品詞、又は文字種とに対応して前記形態素の読み及びスコアが予め定められたものであり、
    前記曖昧性解消部は、前記取得された前記形態素の読み候補の各々について、前記読み候補についての複数の前記曖昧性解消規則のうちの何れかに該当する場合に、該当する前記曖昧性解消規則のスコアを、前記読み候補のスコアとして加算し、
    前記スコアが最も高い前記読み候補のスコアが閾値を超えた場合に、前記形態素の読みとして決定し、前記スコアが最も高い前記読み候補のスコアが閾値以下である場合に、予め定められた前記読み候補を前記形態素の読みとして決定する
    読み曖昧性解消装置。
  2. 前記形態素の読み候補は、前記読みのアクセントを含む請求項記載の読み曖昧性解消装置。
  3. 入力部が、形態素列と、前記形態素列の各形態素の品詞とを受け付け、
    カテゴリ付与部が、前記形態素列の各形態素について、前記形態素に対応する語のカテゴリ情報を付与し、
    曖昧語候補取得部が、前記形態素列の各形態素について、前記形態素の表記と品詞に基づいて、前記形態素の表記と品詞の組み合わせ毎に予め定められた前記形態素の読み候補から、前記形態素の読み候補を取得し、
    曖昧性解消部が、他の形態素の出現位置と、前記他の形態素の表記、品詞、文字種、又はカテゴリとに対応して前記形態素の読み及びスコアが予め定められた曖昧性解消規則を用いて、前記取得された前記形態素の読み候補から、前記形態素の読みを決定する
    ことを含み、
    前記曖昧性解消規則は、前記他の形態素の出現位置と、前記他の形態素の表記、品詞、又は文字種とに対応して前記形態素の読み及びスコアが予め定められたものであり、
    前記曖昧性解消部は、前記取得された前記形態素の読み候補の各々について、前記読み候補についての複数の前記曖昧性解消規則のうちの何れかに該当する場合に、該当する前記曖昧性解消規則のスコアを、前記読み候補のスコアとして加算し、
    前記スコアが最も高い前記読み候補のスコアが閾値を超えた場合に、前記形態素の読みとして決定し、前記スコアが最も高い前記読み候補のスコアが閾値以下である場合に、予め定められた前記読み候補を前記形態素の読みとして決定する
    読み曖昧性解消方法。
  4. 形態素列と、前記形態素列の各形態素の品詞とを受け付け、
    前記形態素列の各形態素について、前記形態素に対応する語のカテゴリ情報を付与し、
    前記形態素列の各形態素について、前記形態素の表記と品詞に基づいて、前記形態素の表記と品詞の組み合わせ毎に予め定められた前記形態素の読み候補から、前記形態素の読み候補を取得し、
    他の形態素の出現位置と、前記他の形態素の表記、品詞、文字種、又はカテゴリとに対応して前記形態素の読み及びスコアが予め定められた曖昧性解消規則を用いて、前記取得された前記形態素の読み候補から、前記形態素の読みを決定する
    ことを含み、
    前記曖昧性解消規則は、前記他の形態素の出現位置と、前記他の形態素の表記、品詞、又は文字種とに対応して前記形態素の読み及びスコアが予め定められたものであり、
    前記形態素の読みを決定することでは、前記取得された前記形態素の読み候補の各々について、前記読み候補についての複数の前記曖昧性解消規則のうちの何れかに該当する場合に、該当する前記曖昧性解消規則のスコアを、前記読み候補のスコアとして加算し、
    前記スコアが最も高い前記読み候補のスコアが閾値を超えた場合に、前記形態素の読みとして決定し、前記スコアが最も高い前記読み候補のスコアが閾値以下である場合に、予め定められた前記読み候補を前記形態素の読みとして決定する
    処理をコンピュータに実行させるための読み曖昧性解消プログラム。
JP2021518262A 2019-05-08 2019-05-08 読み曖昧性解消装置、読み曖昧性解消方法、及び読み曖昧性解消プログラム Active JP7243818B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2019/018451 WO2020225888A1 (ja) 2019-05-08 2019-05-08 読み曖昧性解消装置、読み曖昧性解消方法、及び読み曖昧性解消プログラム

Publications (2)

Publication Number Publication Date
JPWO2020225888A1 JPWO2020225888A1 (ja) 2020-11-12
JP7243818B2 true JP7243818B2 (ja) 2023-03-22

Family

ID=73051518

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021518262A Active JP7243818B2 (ja) 2019-05-08 2019-05-08 読み曖昧性解消装置、読み曖昧性解消方法、及び読み曖昧性解消プログラム

Country Status (3)

Country Link
US (1) US20230252983A1 (ja)
JP (1) JP7243818B2 (ja)
WO (1) WO2020225888A1 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006030326A (ja) 2004-07-13 2006-02-02 Hitachi Ltd 音声合成装置
JP2007248886A (ja) 2006-03-16 2007-09-27 Mitsubishi Electric Corp 読み修正装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006030326A (ja) 2004-07-13 2006-02-02 Hitachi Ltd 音声合成装置
JP2007248886A (ja) 2006-03-16 2007-09-27 Mitsubishi Electric Corp 読み修正装置

Also Published As

Publication number Publication date
WO2020225888A1 (ja) 2020-11-12
US20230252983A1 (en) 2023-08-10
JPWO2020225888A1 (ja) 2020-11-12

Similar Documents

Publication Publication Date Title
JP5901001B1 (ja) 音響言語モデルトレーニングのための方法およびデバイス
US5930746A (en) Parsing and translating natural language sentences automatically
Gorman et al. Improving homograph disambiguation with supervised machine learning
CN105512110B (zh) 一种基于模糊匹配与统计的错字词知识库构建方法
JP2008083952A (ja) 辞書作成支援システム、方法及びプログラム
US11941361B2 (en) Automatically identifying multi-word expressions
JP6778655B2 (ja) 単語連接識別モデル学習装置、単語連接検出装置、方法、及びプログラム
US8880391B2 (en) Natural language processing apparatus, natural language processing method, natural language processing program, and computer-readable recording medium storing natural language processing program
JP5231698B2 (ja) 日本語の表意文字の読み方を予測する方法
Barrett et al. Cross-lingual transfer of correlations between parts of speech and gaze features
JP2004303240A (ja) 単語解析のためのシステムおよび方法
Chennoufi et al. Impact of morphological analysis and a large training corpus on the performances of Arabic diacritization
JP7243818B2 (ja) 読み曖昧性解消装置、読み曖昧性解消方法、及び読み曖昧性解消プログラム
JP2007148630A (ja) 特許分析装置、特許分析システム、特許分析方法およびプログラム
Kumar et al. Learning agglutinative morphology of Indian languages with linguistically motivated adaptor grammars
JP2006178671A (ja) 同義語対抽出方法、同義語対抽出装置、同義語対抽出プログラム、及び同義語対抽出プログラム記録媒体
Barros et al. Inflection generation for spanish verbs using supervised learning
Hatori et al. Predicting word pronunciation in Japanese
de Almeida Suffix Identification in Portuguese using Transducers
JP6599188B2 (ja) 対訳辞書作成装置、対訳辞書作成方法およびプログラム
KR20180016840A (ko) 등장인물 추출 방법 및 장치
JP6232774B2 (ja) 形態素解析装置、形態素解析方法、及び、形態素解析プログラム
Trosterud Language technology in russia
CN113806479A (zh) 文本注音的方法、装置、电子设备及存储介质
JP2018194959A (ja) 発話文判定装置、方法、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211018

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221004

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221122

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230207

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230220

R150 Certificate of patent or registration of utility model

Ref document number: 7243818

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150