JP3953772B2 - 読みがな付与装置およびプログラム - Google Patents

読みがな付与装置およびプログラム Download PDF

Info

Publication number
JP3953772B2
JP3953772B2 JP2001321966A JP2001321966A JP3953772B2 JP 3953772 B2 JP3953772 B2 JP 3953772B2 JP 2001321966 A JP2001321966 A JP 2001321966A JP 2001321966 A JP2001321966 A JP 2001321966A JP 3953772 B2 JP3953772 B2 JP 3953772B2
Authority
JP
Japan
Prior art keywords
hypothesis
word
words
reading
product
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001321966A
Other languages
English (en)
Other versions
JP2003132052A (ja
Inventor
寛之 世木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Broadcasting Corp filed Critical Japan Broadcasting Corp
Priority to JP2001321966A priority Critical patent/JP3953772B2/ja
Publication of JP2003132052A publication Critical patent/JP2003132052A/ja
Application granted granted Critical
Publication of JP3953772B2 publication Critical patent/JP3953772B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、日本語テキストに読みがなを付与して発音列を出力する読みがな付与装置およびプログラムに関するものである。
【0002】
【従来の技術】
従来、この種の読みがな付与装置(読み韻律情報設定装置)は、単語認定および読み韻律情報を設定するための単語辞書と、この単語辞書を用いて多段解析法に基づく形態素解析を行う形態素解析手段と、この形態素解析手段による形態素解析結果を利用して読みがなを付与する読みがな付与手段とを備え、日本語テキストを入力して読み韻律情報を付与し、この読み韻律情報に基づいて合成音声を生成するものであった(特開平11-344998号公報)。このように、入力された日本語テキストを形態素解析して各形態素に分割し、発音付けを行うことにより、単語分割されていない日本語テキストを単語分割して読みがなを付与することができる。
【0003】
また、この種の読みがな付与装置(音声合成装置)は、入力日本語テキストから単語に分割した分割結果候補を全て作成し、その中から単語の接続確率の相乗平均を計算し、相乗平均が最大となる単語分割を選択し、それに対応する発音付けを行う単語分割手段を備えたものであった(特開平7-262191号公報)。ここで採用されている単語分割方法を利用することにより、例えば複合語などの単語列を意味の正しい単語に高い精度で分割し、読みがなを付与することができる。
【0004】
したがって、日本語テキストに読みがなを付与する場合に、前述の形態素解析および単語分割方法を利用することが考えられる。
【0005】
【発明が解決しようとする課題】
しかしながら、このような従来の形態素解析を利用した読みがな付与装置では、あらかじめ辞書に単語の発音だけでなく品詞も記載しておく必要があるために、利便性に欠けるという問題があった。また、従来の形態素解析を利用した読みがな付与装置では、品詞の接続確率値などの接続コストを学習しておく必要があるために、あらかじめ品詞付けされた日本語テキストデータが必要となり、このようなデータを多量に用意するには膨大な時間およびコストがかかるという問題があった。
【0006】
また、従来の単語分割方法を利用した読みがな付与装置では、品詞の接続確率は必要ないが、一つの単語に複数の発音があった場合については配慮がなされていないという問題があった。すなわち、特開平7-262191号公報に開示された技術では、一つの単語に複数の発音があった場合にどのような手段で選択するのかは明記されていない。さらに、従来の単語分割方法を利用した読みがな付与装置では、一度全ての単語分割結果候補を作成し、この単語分割結果候補の単語接続確率の相乗平均を計算するために、例えば、200文字の日本語テキストデータが入力された場合に、最悪2の200乗もの単語分割結果候補が生じることになり、それぞれについて単語接続確率の相乗平均を計算するには膨大な時間がかかる。したがって、複合名詞を分割して発音を付与する場合であればよいが、長い日本語のテキストを分割して発音を付与するのは現実的に無理であるという問題があった。
【0007】
本発明は、このような問題を解決するためになされたもので、非現実的な読みがな候補の計算を省くことにより、効率性および利便性を改善する読みがな付与装置およびプログラムを提供するものである。
【0008】
【課題を解決するための手段】
請求項1に係る本発明の読みがな付与装置は、日本語テキストを入力する入力手段と、単語の発音を登録しているが単語の品詞を登録していない辞書、および同一表記で発音の異なる単語間の接続確率を区別して与える言語モデルを記憶するための記憶手段と、前記入力手段によって文頭から文末まで順次入力される日本語テキストについて、前記辞書に登録されている単語の発音により読みがな候補の仮説を複数生成し、前記言語モデルに基づいて当該仮説における単語間の接続確率の積を前記仮説毎に計算し、単語間の接続確率の積が最大となる仮説のみを残すようにマージし、文末での単語間の接続確率の積が最大となる仮説を選択して読みがなを付与する読みがな付与手段と、前記接続確率の積を前記仮説毎に計算する過程で、単語間の接続確率の前記仮説毎の積が予め決められた範囲内にあるもの以外を削除する削除手段とを設けた構成を有している。
【0009】
この構成により、単語を登録している辞書に各単語の品詞を登録する必要はなくなり、各単語の発音のみを登録したものでよい。また、この構成により、単語分割および読みがな付与がなされていない日本語入力テキストが入力されると、単語の接続確率の積が高い仮説のみ保持していくので、非現実的な読みがな候補について無駄な計算をする必要がなくなり、読みがな付与装置の効率性および利便性を改善することとなる。
【0011】
また、この構成により、読みがな候補の仮説の数を減らして、読みがな付与の処理時間を短縮できることとなる。
【0012】
さらに、請求項に係る本発明のプログラムは、コンピュータに、文頭から文末まで順次入力される日本語テキストに応じて、単語の発音を登録しているが単語の品詞を登録していない辞書に登録されている単語の発音により読みがな候補の仮説を生成する第1のステップと、現在生成されている仮説より、次に入力される文字で区切れない仮説と区切れる仮説とを新たに生成し、これらの仮説における単語間の接続確率の積を、同一表記で発音の異なる単語間の接続確率を区別して与える言語モデルに基づいて前記仮説毎に計算する第2のステップと、末尾の単語とこの単語の一つ前の単語の発音が同一である仮説がある場合に、単語間の接続確率の積が最大である仮説のみを残すようにマージする第3のステップとを実行させ、前記第2のステップで、単語間の接続確率の前記仮説毎の積の最大値から予め決められた範囲内にある仮説以外を削除するものである。
【0013】
このプログラムにより、単語の接続確率の積が高い仮説のみ保持することで、非現実的な読みがな候補の計算を省いて処理時間を短縮することができ、読みがな付与装置の利便性を改善することとなる。なお、読みがな付与に用いる辞書に各単語の品詞を登録する必要はなく、各単語の発音のみを登録したものでよい。
【0015】
また、このプログラムにより、読みがな候補の仮説の数を減らして処理時間を短縮できることとなる。
【0016】
さらに、請求項に係る本発明のプログラムは、請求項において、前記言語モデルは、Nグラムモデルからなるものである。
【0017】
このプログラムで、公知のNグラムモデル(トライグラムモデルなど)を採用することにより、本発明の広範な応用が可能となる。
【0018】
【発明の実施の形態】
以下、本発明の実施の一形態を図面を用いて説明する。
図1に示すように、本発明の実施の一形態に係る読みがな付与装置50は、日本語テキストを入力する入力装置(図示せず)と、単語の発音を登録している辞書、および同一表記で発音の異なる単語間の接続確率を区別して与える言語モデルを記憶するための記憶装置(図示せず)と、前記入力装置によって文頭から文末まで順次入力される日本語テキストについて、前記辞書に登録されている単語の発音により読みがな候補の仮説を複数生成し、前記言語モデルに基づいて当該仮説における単語間の接続確率の積を計算し、単語間の接続確率の積が最大となる仮説のみを残すようにマージし、文末での単語間の接続確率の積が最大となる仮説を選択して読みがなを付与する仮説計算部20および仮説生成・削除部30とを設けたものである。
【0019】
すなわち、読みがな付与装置50は、仮説生成・削除部30と仮説計算部20からなり、入力された日本語テキストから発音列を生成して出力するものである。仮説生成・削除部30には、単語の発音を登録している辞書(品詞情報は含まず)と、単語間の接続確率を同一表記であっても発音の違いに応じて区別して与える言語モデル(Nグラムモデル)を登録している。ここで、Nグラムモデルとは、ある単語の生起はこの単語の直前の(N−1)単語にのみ依存すると考えた言語モデルであり、本実施形態ではトライグラムモデル(N=3)を用いている。
【0020】
また、仮説生成・削除部30は、仮説計算部20に蓄えられている仮説と、前記日本語テキストを入力して、前記辞書の単語(発音情報を含む)による仮説の生成を行う。また、仮説生成・削除部30は、仮説計算部20で前記仮説における単語の接続確率の積が計算されると、仮説における単語の接続確率の積(累積確率)の最大値からあらかじめ決められた閾値までの範囲にある仮設を更新し、この範囲以下の仮説(単語の接続確率の積が前記閾値以下のもの)を削除する。さらに、仮説生成・削除部30は、マージできる仮説(例えば、現在の単語と一つ前の単語が同じである仮説)について、仮説における単語の接続確率の積が最大となるものを残して削除する。
【0021】
一方、仮説計算部20は、前述の仮説の生成が行われた後に、前記Nグラムモデルにより当該仮説における単語の接続確率の積を計算する。ここで、同一表記で発音の異なる単語がある場合に、発音の違いに応じて当該単語の接続確率が与えられる。この計算を、入力された日本語テキストの文字がなくなるまで繰り返し、文字がなくなった時点で、仮説の中で単語の接続確率値の積が最大となるものを選択し、その仮説の発音列を出力する。なお、前記Nグラムモデルは、仮説計算部20あるいは図示しない記憶部に登録しておいてもよい。
【0022】
図2は、パーソナルコンピュータなどの汎用コンピュータの要部を示す。これは、前述の読みがな付与装置50の機能を実現するためのハードウェア構成の一例である。
【0023】
図2において、入力装置51は、単語分割して読みがなを付与するために日本語テキストの文字列を順次入力するものである。また、入力装置51は、本実施形態の単語分割方法(図3に示す)を実現するための読みがな付与プログラムの実行をキーボードやマウスで指示するものである。表示装置52は、前記読みがな付与プログラムの実行によって読みがな付与された日本語テキスト、すなわち全仮説の中から選択された仮説(読みがな候補)の発音列を出力するためのものである。CPU53は、前記読みがな付与プログラムを実行して読みがな付与処理を施すものである。
【0024】
記憶装置54は、例えばハードディスク記憶装置(HDD)などの大容量記憶装置からなり、前記読みがな付与プログラム、前記辞書(単語辞書)および前記言語モデルのデータなどを記憶する。システムメモリ55は、HDD54からロードされた前記読みがな付与プログラム、およびCPU53が実行する処理に対する入出力データを一時記憶する。ここで、前記読みがな付与プログラムは、入力装置51の指示でHDD54からシステムメモリ55にロードされ、CPU53により指示されたプログラムが実行される。
【0025】
次に、図3乃至図5を参照しながら、本実施形態の読みがな付与装置50による読みがな付与方法について説明する。ここでは、一例として、「<文頭>片倉橋本間では工事中です<文末>」に読み仮名を付与する場合を示す。また、前記辞書には、「片倉(katakura)」、「橋本(hashimoto)」、「間(kaN)」、「間(aida)」、「片(heN)」、「倉橋(kurahashi)」、「本間(hoNma)」、「で(de)」、「は(wa)」、「工事(ko:ji)」、「中(chu:)」、「中(naka)」、「です(desu)」を含む単語および発音が登録されているものとする。
【0026】
まず、日本語テキストの入力文字に先立って<文頭>が仮説生成・削除部30に入力され、一つの仮説が生成される。これは、図4のW=0に示すとおりである。次いで、仮説計算部20は、前記仮説について単語の接続確率(P(<文頭>))、すなわちトライグラム値を計算する(前記第1のステップに相当)。
【0027】
次いで、「片」が仮説生成・削除部30に入力されると(ステップS101)、仮説生成・削除部30は「<文頭> 片(切れ目なし)」と「<文頭> 片(heN)」の二つの仮説を生成し(図4のW=1に示す)、仮説計算部20は単語末に達した仮説の単語の接続確率(P(<文頭>)×P(片(heN)|<文頭>))を計算する(ステップS102、S103)。以降、文字が入ってくるたびに、仮説生成・削除部30は図4、図5のように仮説を生成し、仮説計算部20は単語の接続確率の積を計算する(前記第1のステップに相当)。
【0028】
次いで、仮説生成・削除部30は、仮説計算部20で計算された単語の接続確率の積により、この単語の接続確率の積があらかじめ決めておいた範囲にない仮説を削除する(ステップS104、S105)。このように仮説を展開していく上で、仮説における単語の接続確率の積の値が、単語の接続確率の積の最大値からあらかじめ決められた閾値までの範囲外にある場合に、その仮説を削除することにより、読みがな候補の仮説の数を減らして処理を効率化することができる。
【0029】
この後、「は」が仮説生成・削除部30に入力されると、前述のように仮説を生成し、それぞれの仮説について単語の接続確率の積を計算するのだが、以降この三つの仮説のなかで、単語の接続確率の積が一番高い仮説のみ伝える(ステップS106、S107)。なぜなら、これ以降必要となる確率は三つの仮説で同じになるからである(P(*|で(de) は(wa))×・・・)。したがって、この時点で単語の接続確率の積が一番高い仮説が、以降でも一番高い単語の接続確率の積を持つことになる。これは、図5のW=7における▲1▼に示すとおりである。ここで、同一表記で発音の異なる単語があるために、前記トライグラムモデルにより、発音の違いに応じて当該単語の接続確率が与えられる。具体的には、「片」に対する「heN」および「kata」、「本」に対する「moto」および「hoN」、「間」に対する「kaN」および「aida」についてそれぞれの単語発音に応じた接続確率が与えられる。
【0030】
本実施形態では、説明をわかり易くするために途中で2語連続する仮説しか生じさせていないが、そのほかに仮説がある場合でも、2語連続して同じ単語が続いた仮説については前述のステップS107のようにマージすることが可能である。
【0031】
結局、最後の文字列(文字)が入力された時点で一番大きい単語の接続確率の積を持つ仮説の発音列が出力される(ステップS108)。本実施形態では、「katakura hashimoto kaN de wa ko:ji chu: desu」が出力されることになる。
【0032】
以上のように、本発明の実施の一形態に係る読みがな付与装置50は、日本語テキストを入力する入力装置51と、単語の発音を登録している辞書、および同一表記で発音の異なる単語間の接続確率を区別して与える言語モデル(Nグラムモデル)を記憶するための記憶装置54と、入力装置51によって文頭から文末まで順次入力される日本語テキストについて、前記辞書に登録されている単語の発音により読みがな候補の仮説を複数生成し、前記言語モデルに基づいて当該仮説における単語間の接続確率の積を計算し、単語間の接続確率の積が最大となる仮説のみを残すようにマージし、文末での単語間の接続確率の積が最大となる仮説を選択して読みがなを付与する仮説計算部20および仮説生成・削除部30(CPU53、記憶装置54、システムメモリ55)とを設けているので、非現実的な読みがな候補の計算を省き、効率性および利便性を改善することができる。
【0033】
すなわち、あらかじめ単語分割され各単語に発音がつけられたテキスト(このテキスト中の各単語の品詞情報は含まず)を用い、同一表記で異なる発音が割り振られた単語は別の単語として扱い、発音が付与されていないテキストが入力されると、このテキストの単語間の接続確率を計算し、単語の接続確率の積が高い仮説のみ保持していくことにより、非現実的な単語分割による読みがな候補の計算を省き、単語分割および発音付けを効率的に行うことができる。
【0034】
なお、本実施形態では入力装置51としてキーボードやマウスを用いた場合について説明したが、本発明はキーボードやマウスのほかに、OCRなどの読取装置を用いて日本語テキストを入力しても同様の効果が得られるものである。さらに、通信インタフェースを設け、ネットワークを介して日本語テキストデータを取得するように構成しても同様の効果が得られるものである。
【0035】
また、本実施形態では前記辞書および前記言語モデルのデータを読みがな付与装置側(仮説生成・削除部30、仮説計算部20、記憶装置54、システムメモリ55など)に保持した場合について説明したが、本発明は通信インタフェースを設け、ネットワークを介して前記辞書および前記言語モデルのデータを取得するように構成しても同様の効果が得られるものである。さらに、ネットワークを用いることで辞書および言語モデルの更新や配布が容易となる。
【0036】
また、本実施形態では前述のステップS101〜S108を含む読みがな付与動作を実行させるための読みがな付与プログラムを記憶装置54からシステムメモリ55にロードした場合について説明したが、本発明は記憶装置54に記憶された前記読みがな付与プログラムのほかに、前記パーソナルコンピュータで読み取り可能な記録媒体(たとえば、磁気ディスク(FD)、光磁気ディスク、ROM、CD−ROM、ICカードなど)に記憶された前記読みがな付与プログラムを用いても同様の効果が得られる。さらに、記録媒体を持ち運ぶことでプログラムの更新や移動が容易となる。
【0037】
また、本発明は記憶装置54に記憶された前記読みがな付与プログラムをシステムメモリ55にロードする方法のほかに、前記読みがな付与プログラムを通信インタフェースおよびネットワークからファイル形式で取得し、前記パーソナルコンピュータで実行する方法によっても同様の効果が得られる。さらに、ネットワークを用いることでプログラムの更新や配布が容易となる。
【0038】
なお、入力装置51などが前記入力手段を構成し、仮説生成・削除部30、仮説計算部20、記憶装置(HDD)54などが前記記憶手段を構成し、仮説生成・削除部30、仮説計算部20、CPU53などが前記読みがな付与手段および前記削除手段を構成している。また、ステップS103、S105などが前記第2のステップに相当し、ステップS107、S108などが前記第3のステップに相当している。
【0039】
【発明の効果】
以上説明したように、本発明は単語の発音を登録している辞書と、発音が異なる同一表記の単語を区別して計算した単語間の接続確率を与える言語モデル(Nグラムモデル)を有し、単語の接続確率の積が高い仮説のみ保持していき、文末での単語の接続確率の積が最大となるテキスト発音を選択することにより、下記のような優れた効果を有する読みがな付与装置およびプログラムを提供することができるものである。
(a)あらかじめ単語分割されて各単語に発音が付けられたテキストには、テキスト中の各単語に品詞が記載されている必要はない。
(b)辞書に品詞を記載しておく必要はない。
(c)単語の接続確率の積が高い仮説のみ保持することにより、読みがな付与処理を短時間で行うことができる。
【図面の簡単な説明】
【図1】本発明の実施の一形態に係る読みがな付与装置を示すブロック図である。
【図2】本発明の実施の一形態に係る読みがな付与装置(ハードウェア構成)を示すブロック図である。
【図3】本発明の実施の一形態に係る読みがな付与方法を示すフローチャートである。
【図4】本発明の実施の一形態に係る読みがな付与処理を説明する図の一部である。
【図5】本発明の実施の一形態に係る読みがな付与処理を説明する図の一部である。
【符号の説明】
20 仮説計算部
30 仮説生成・削除部
50 読みがな付与装置
51 入力装置
52 表示装置
53 CPU
54 記憶装置(HDD)
55 システムメモリ

Claims (3)

  1. 日本語テキストを入力する入力手段と、単語の発音を登録しているが単語の品詞を登録していない辞書、および同一表記で発音の異なる単語間の接続確率を区別して与える言語モデルを記憶するための記憶手段と、前記入力手段によって文頭から文末まで順次入力される日本語テキストについて、前記辞書に登録されている単語の発音により読みがな候補の仮説を複数生成し、前記言語モデルに基づいて当該仮説における単語間の接続確率の積を前記仮説毎に計算し、単語間の接続確率の積が最大となる仮説のみを残すようにマージし、文末での単語間の接続確率の積が最大となる仮説を選択して読みがなを付与する読みがな付与手段と、前記接続確率の積を前記仮説毎に計算する過程で、単語間の接続確率の前記仮説毎の積が予め決められた範囲内にあるもの以外を削除する削除手段とを設けたことを特徴とする読みがな付与装置。
  2. コンピュータに、文頭から文末まで順次入力される日本語テキストに応じて、単語の発音を登録しているが単語の品詞を登録していない辞書に登録されている単語の発音により読みがな候補の仮説を生成する第1のステップと、現在生成されている仮説より、次に入力される文字で区切れない仮説と区切れる仮説とを新たに生成し、これらの仮説における単語間の接続確率の積を、同一表記で発音の異なる単語間の接続確率を区別して与える言語モデルに基づいて前記仮説毎に計算する第2のステップと、末尾の単語とこの単語の一つ前の単語の発音が同一である仮説がある場合に、単語間の接続確率の積が最大である仮説のみを残すようにマージする第3のステップとを実行させ、前記第2のステップで、単語間の接続確率の前記仮説毎の積の最大値から予め決められた範囲内にある仮説以外を削除することを特徴とするプログラム。
  3. 前記言語モデルは、Nグラムモデルからなることを特徴とする請求項に記載のプログラム。
JP2001321966A 2001-10-19 2001-10-19 読みがな付与装置およびプログラム Expired - Fee Related JP3953772B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001321966A JP3953772B2 (ja) 2001-10-19 2001-10-19 読みがな付与装置およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001321966A JP3953772B2 (ja) 2001-10-19 2001-10-19 読みがな付与装置およびプログラム

Publications (2)

Publication Number Publication Date
JP2003132052A JP2003132052A (ja) 2003-05-09
JP3953772B2 true JP3953772B2 (ja) 2007-08-08

Family

ID=19139089

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001321966A Expired - Fee Related JP3953772B2 (ja) 2001-10-19 2001-10-19 読みがな付与装置およびプログラム

Country Status (1)

Country Link
JP (1) JP3953772B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5377889B2 (ja) * 2008-06-05 2013-12-25 日本放送協会 言語処理装置およびプログラム
KR101083540B1 (ko) * 2009-07-08 2011-11-14 엔에이치엔(주) 통계적인 방법을 이용한 한자에 대한 자국어 발음열 변환 시스템 및 방법
JP5961586B2 (ja) * 2013-05-30 2016-08-02 日本電信電話株式会社 読み仮名修正モデル学習装置と読み仮名修正装置とそれらの方法とプログラム
JP6493866B2 (ja) * 2013-11-12 2019-04-03 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 情報処理装置、情報処理方法、およびプログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07262191A (ja) * 1994-03-24 1995-10-13 Sony Corp 単語分割方法、および音声合成装置
JP3366253B2 (ja) * 1998-05-21 2003-01-14 三菱電機株式会社 音声合成装置
JP4084515B2 (ja) * 1999-11-16 2008-04-30 日本電信電話株式会社 アルファベット文字・日本語読み対応付け装置と方法およびアルファベット単語音訳装置と方法ならびにその処理プログラムを記録した記録媒体

Also Published As

Publication number Publication date
JP2003132052A (ja) 2003-05-09

Similar Documents

Publication Publication Date Title
Nelken et al. Arabic diacritization using weighted finite-state transducers
US8392191B2 (en) Chinese prosodic words forming method and apparatus
JPH03224055A (ja) 同時通訳向き音声認識システムおよびその音声認識方法
US20080235004A1 (en) Disambiguating text that is to be converted to speech using configurable lexeme based rules
US20100125459A1 (en) Stochastic phoneme and accent generation using accent class
Mori Word-based partial annotation for efficient corpus construction
JP3992348B2 (ja) 形態素解析方法および装置、並びに日本語形態素解析方法および装置
US7346511B2 (en) Method and apparatus for recognizing multiword expressions
JP2002117027A (ja) 感情情報抽出方法および感情情報抽出プログラムの記録媒体
JP2002149643A (ja) 日本語の表意文字の読み方を予測する方法
Chennoufi et al. Impact of morphological analysis and a large training corpus on the performances of Arabic diacritization
JP3953772B2 (ja) 読みがな付与装置およびプログラム
JP4084515B2 (ja) アルファベット文字・日本語読み対応付け装置と方法およびアルファベット単語音訳装置と方法ならびにその処理プログラムを記録した記録媒体
JP5199901B2 (ja) 言語モデル作成方法、言語モデル作成装置および言語モデル作成プログラム
JP2005092682A (ja) 翻字装置、及び翻字プログラム
JP5795302B2 (ja) 形態素解析装置、方法、及びプログラム
WO2014030258A1 (ja) 形態素解析装置、テキスト分析方法、及びそのプログラム
JP2003122749A (ja) 単語分割装置およびプログラム
JP7200474B2 (ja) 変換補助装置、変換補助システム、変換補助方法及びコンピュータプログラム
JP3379643B2 (ja) 形態素解析方法および形態素解析プログラムを記録した記録媒体
US20220004708A1 (en) Methods and apparatus to improve disambiguation and interpretation in automated text analysis using structured language space and transducers applied on automatons
JP3628565B2 (ja) 辞書検索方法、装置、および辞書検索プログラムを記録した記録媒体
JP2959769B2 (ja) 日本語文字列の形態素解析方法及び装置
JP2002162986A (ja) 情報処理装置及びその方法、コンピュータ可読メモリ
JP2007072663A (ja) 用例翻訳装置、及び用例翻訳方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040511

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050822

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050830

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051025

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20061024

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061225

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20070207

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070424

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070425

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110511

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120511

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120511

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130511

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140511

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees