JP2003022266A - 文章語文体変換システムおよび文章語文体変換処理プログラム - Google Patents

文章語文体変換システムおよび文章語文体変換処理プログラム

Info

Publication number
JP2003022266A
JP2003022266A JP2001205888A JP2001205888A JP2003022266A JP 2003022266 A JP2003022266 A JP 2003022266A JP 2001205888 A JP2001205888 A JP 2001205888A JP 2001205888 A JP2001205888 A JP 2001205888A JP 2003022266 A JP2003022266 A JP 2003022266A
Authority
JP
Japan
Prior art keywords
style
conversion
character string
sentence
evaluation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001205888A
Other languages
English (en)
Other versions
JP4041875B2 (ja
Inventor
Maki Murata
真樹 村田
Hitoshi Isahara
均 井佐原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Communications Research Laboratory
Original Assignee
Communications Research Laboratory
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Communications Research Laboratory filed Critical Communications Research Laboratory
Priority to JP2001205888A priority Critical patent/JP4041875B2/ja
Publication of JP2003022266A publication Critical patent/JP2003022266A/ja
Application granted granted Critical
Publication of JP4041875B2 publication Critical patent/JP4041875B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 入力した文章語を目的とする文体に適切に変
換できるようにする。 【解決手段】 第1の文字列を同義の第2の文字列に言
い換える変形の規則を多数記憶する変形規則記憶部14
と,文字列を変形した結果が目的とするふさわしい文体
になっているかどうかを評価するための尺度を与える評
価関数または評価規則を記憶する評価情報記憶部15と
を用意し,自然言語で記述された文体変換対象の文字列
を入力すると,変形処理部11によって,入力された文
字列を変形規則を用いて変形し,変換の候補を生成す
る。次に,生成された変換の候補を,評価処理部12に
よって,評価関数または評価規則を用いて評価し,評価
結果のよい表現を選択し,選択された表現の変換結果
を,目的とする文体に変換された文章語として出力す
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は,ある自然言語で記
述された文章語の文字列を,同一の自然言語で記述され
た他の文体による文章語の文字列に変換する文章語文体
変換システムに関するものである。
【0002】
【従来の技術】自然言語で記述された文または文章に関
する表現の変換処理として典型的なものは,機械翻訳で
ある。機械翻訳では,ある国の自然言語で記述された文
または文章を他の国の自然言語で記述された文または文
章に変換する。
【0003】機械翻訳が他の国の言語に変換するのに対
し,同一の自然言語間での文または文章の変換処理を行
うシステムも用いられるようになってきている。例え
ば,要約文を自動生成したり,文章を推敲したりするシ
ステムである。
【0004】一般に同一自然言語間での文の変換処理で
は,変換前の語・句・文などのパターンと変換後の語・
句・文などのパターンとの対からなる変換規則を大量に
用意し,いわゆるパターン・マッチングによって入力文
中に現れる変換前のパターンを探し出し,該当するパタ
ーンがあれば,それを変換後の語・句・文などのパター
ンに置き換える処理を行っている。
【0005】また,同一自然言語間での文の変換処理と
して,要約文を自動生成したり,文章を推敲したりする
ことは行われていたが,例えば芥川龍之介が書いた小説
を,夏目漱石の文体の小説に変換するというように,あ
る特定の個人の文体または一般的な文体の文章を,他の
特定の個人の文体に変換するというようなことは行われ
ていなかった。
【0006】
【発明が解決しようとする課題】従来の同一自然言語内
での文または文章の変換処理では,一般に変換規則によ
る一律な変換を行っており,変換結果の良し悪しについ
ての評価は行われていなかった。そのため,実際によい
変換が行われるかどうかは,あらかじめ用意された変換
規則の良し悪しに大きく依存し,適用された変換規則に
よっては,目的とする変換と異なる変換結果になってし
まうということがあった。
【0007】また,変換の精度を良くしようとすると,
変換規則として真に妥当なものだけを選別する必要があ
り,大量な変換規則を選別するのは,大変な困難を伴う
作業であった。例えば変換規則の中に,「A」という文
字列を「B」という文字列に変換する規則と,これとは
逆に「B」という文字列を「A」という文字列に変換す
る規則とが混在すると,従来の技術では目的とする正し
い変換結果は得られなかった。
【0008】そのため,特に従来技術では,個人文体の
変換や難解な文を小学生にも理解しやすい平易文に変換
するというようなシステムを構築することは難しいとい
う問題があった。
【0009】本発明は上記問題点の解決を図り,文章語
の表現を変える規則として,厳選された規則ではなく,
例えばコンピュータにより自動獲得されたような多種多
様な規則を用いた場合でも,入力した文章語を目的とす
る文体に適切に変換できるシステムを提供することを目
的とする。
【0010】
【課題を解決するための手段】本発明は,上記課題を解
決するため,ある自然言語で記述された文章語を,同一
の自然言語で記述された他の文体による文章語に変換す
るシステムにおいて,第1の文字列を同義の第2の文字
列に言い換える変形の規則を多数記憶する変形規則記憶
手段と,文字列を変形した結果が目的とする文体になっ
ているかどうかを評価するための尺度を与える評価関数
または評価規則を記憶する評価情報記憶手段とを備え,
自然言語で記述された文体変換対象の文字列を入力する
と,変形処理手段によって,入力された文字列を変形規
則記憶手段に記憶された変形の規則を用いて変形し,変
換の候補を生成する。次に,生成された変換の候補を,
評価処理手段によって評価情報記憶手段に記憶された評
価関数または評価規則を用いて評価し,評価結果のよい
表現を選択し,選択された表現の変換結果を,目的とす
る文体に変換された文章語として出力する。
【0011】例えば,評価関数または評価規則による評
価の尺度を,平易な文章集合からなる大量の用例におけ
る変換の候補の出現頻度または出現確率を含むものと
し,その出現頻度または出現確率が大きいものに高い評
価を与えるようにすることにより,入力した難解文の文
字列を平易文に変換する文章語文体変換システムを実現
することができる。
【0012】また,例えば評価関数または評価規則によ
る評価の尺度を,特定の個人の文章集合からなる大量の
用例における変換の候補の出現頻度または出現確率を含
むものとし,その出現頻度または出現確率が大きいもの
に高い評価を与えるようにすることにより,入力した文
字列の表現をある特定の個人の文体に変換する文章語文
体変換システムを実現することができる。
【0013】評価の尺度として,必ずしも前記出現頻度
または出現確率の大小を用いる必要はないが,何らかの
評価尺度によって,文章語の変形の後に目的に合致した
ふさわしい文体になっているかどうかを評価し,高い評
価の変形を変換結果として選択するので,あらかじめ文
体の変形規則として用意する情報は,基本的に文字列の
同義性があれば十分であり,多種多様な変形規則を厳選
することなく用いることができる。変形元と変形先とい
うような変形規則の方向性についての考慮も不要であ
る。すなわち,例えば変形規則の中に,「A」という文
字列を「B」という文字列に変形する規則と,これとは
逆に「B」という文字列を「A」という文字列に変形す
る規則とが混在しているような場合でも,評価によって
最終的に目的とする変換結果が得られることになる。し
たがって,変形規則の作成が容易であり,ある文体変換
のために用意した変形規則を,他の目的の文体変換のた
めに利用するようなことも可能である。
【0014】以上の手段は,コンピュータと,そのコン
ピュータにインストールされ実行されるソフトウェアプ
ログラムとによって実現することができ,そのプログラ
ムは,コンピュータが読み取り可能な可搬媒体メモリ,
半導体メモリ,ハードディスク等の適当な記録媒体に格
納することができる。
【0015】
【発明の実施の形態】図1は,本発明のシステム構成例
を示す。図中,1はCPUおよびメモリなどからなるコ
ンピュータによって実現される文章語文体変換処理装置
であって,変形処理部11,評価処理部12,変形規則
記憶部14,評価情報記憶部15を備える。
【0016】変換対象文10は,本システムにおける入
力となる自然言語文である。以下,特に断らないが変換
対象文10は必ずしも一文に限られるわけではなく,文
章または句,節のようなものであってもよい。変換結果
文13は,本システムの出力であって,変換対象文10
を同一の種類の自然言語で元の文体と異なる文体に言い
換えたものである。
【0017】文章語文体変換処理装置1のモジュール
は,基本的に変形処理部11と評価処理部12とから構
成される。変形処理部11は,変形規則記憶部14に格
納されている変形規則を用いて,変換の候補を獲得する
モジュールである。評価処理部12は,変換の候補の良
さ,すなわち目的のふさわしい文体であるかどうかを,
あらかじめ評価情報記憶部15に記憶されている評価の
尺度(評価関数など)によって評価し,最も評価の高い
変換の候補を選択するモジュールである。
【0018】変換対象文10が入力されると,変形処理
部11は,変形規則を用いて変換の候補を挙げ,評価処
理部12は,変形された文体の妥当性をチェックして,
最も妥当であると判断されたものを選択し,その結果を
変換結果文13として出力する。
【0019】変形規則記憶部14に記憶する変形規則
は,人手によってあらかじめ作成された規則であっても
よいし,コンピュータによって大量の言語データから自
動獲得したものでもよい。変形規則および変換の候補を
評価する評価関数(評価尺度)の評価情報は,扱う問題
ごとに適正なものを用意する。
【0020】評価情報は,評価のための数値情報であっ
てもよいし,関数群もしくはサブルーチン群などによる
手続き的なものであってもよい。また,評価方法を記述
した規則(ルール)であってもよい。これらの組み合わ
せで実現することも可能である。評価処理部12で用い
る評価の尺度の代表的な例としては,目的とする文体の
文章集合からなる大量の言語データ中での出現頻度(ま
たは出現確率)を挙げることができる。
【0021】例えば,文章語の文体を変える本システム
において,変形処理部11が使用する変形規則がすべて
同義性を満足するものであるとする。この場合,文体を
変換したいデータを,そのデータの出現(生起)確率が
目的とする文体の文章集合中で高くなるように変形する
と目的とする文体に非常に近い文章語となる。
【0022】もう少し簡単な例でこれを説明すると,例
えば入力した文章がいわゆる「です調」の文体であり,
「〜です」という文字列が多くあったとする。変形規則
に「〜です」を「〜である」に変形する規則があったと
しよう。目的とする文体が「である調」の文体であれ
ば,その目的とする文体の文章データが大量に格納され
たデータベースを用意して,評価のために用いる。その
データベースにおいて「〜です」と「〜である」の出現
回数を数える。「〜である」の出現回数のほうが数が多
い場合,「〜である」のほうの評価を「〜です」より高
くする。この評価によって,「です調」の文体は,「で
ある調」の文体に自動変換されることになる。
【0023】ここで,出現頻度 (または出現確率) を調
べるコーパスをいろいろと変えることにより,さまざま
な文体の変換の結果を得ることができる。例えば,入力
データが法律関係の文のときに,コーパスとして平易な
文章の集合を与えておくと,法律関係の難解な文章を平
易な文章に変形させることが期待できる。
【0024】また,ここで入力データとして適当に誰か
が書いた小説の文章を入れて,コーパスとしてシェーク
スピアの小説をいれると,シェークスピアの文体の小説
が新たに完成することになる。同様に,芥川龍之介の小
説を夏目漱石の文体に変換するなどといったことも可能
になる。
【0025】本システムで用いる変形規則は,例えば次
のようにしてコンピュータにより自動生成することも可
能である。まず,複数の同一言語により記述された意味
的な対応関係がある言語情報を抽出する(例えば,複数
の異なる辞書ファイルを用意し,それらから同じ単語の
説明文を抽出する)。次に,抽出した複数の言語情報を
突き合わせ,その結果から同義語または同義フレーズを
抽出する。抽出した同義語または同義フレーズから,第
1の文字列を同義の第2の文字列に言い換える変形規則
を自動生成する。
【0026】図2は,変形処理部11の処理フローチャ
ートである。変形処理部11は,まずステップS10に
より,文体の変換対象として指定された変換対象文10
を入力する。キーボードなどからの入力,ファイルから
の入力,アプリケーションプログラムからの入力など,
入力方法は問わない。
【0027】ステップS11では,変形規則記憶部14
から変換に必要な変形規則を読み込む。既に読み込まれ
ている場合には,ここでの読み込みは不要である。ステ
ップS12では,入力した変換対象文10を変形規則を
用いて変形する。この変形した後の表現の候補を評価処
理部12へ引き渡す。このとき,変形した後の表現の候
補を一つずつ評価処理部12へ渡してもよいし,複数あ
る場合には複数まとめて渡してもよい。
【0028】ステップS13では,評価処理部12は,
変形処理部11から変換対象文10を変形した後の表現
の候補を受け取り,評価情報記憶部15に記憶されてい
る評価情報を用いて,目的とする文体にふさわしい表現
になっているかどうかを評価する。この評価情報は,評
価処理部12から呼び出される評価関数のようなもので
も,また評価関数が使用するパラメータのようなもので
もよい。表現の各候補について,評価結果が数値(評価
値)として算出されることになる。ステップS14で
は,評価結果の最もよい変形後の表現を選択し,その変
形した表現を変換結果文13として出力する。
【0029】以下,各種の文章語文体変換処理システム
への具体的な適用例を説明する。
【0030】(A)難解文変換システムへの適用例 図3は,難解文変換システムへの適用例を示している。
図3に示す難解文変換システムでは,法律文章を平易な
文に書き換えたり,難しい新聞の記事を小学生向けの易
しい文に書き換えたりする処理を行う。
【0031】例えば図3の例のように,変換対象文10
として,「大臣を罷免する」という文が入力されたとす
る。変形処理部11は,この変換対象文10を,変形規
則記憶部14にあらかじめ用意された変形規則を用い
て,同義の異なる表現に言い換える。ここで,変形規則
として,「罷免する」→「やめさせる」・・・・という
規則があったとすると,変形処理部11は,変換対象文
10に変形規則を適用することにより,「大臣を罷免す
る」という文から「大臣をやめさせる」という文を生成
する。この他にも,種々の変形規則が存在し,多くの変
形された文が候補として生成されることになる。これら
の文を評価処理部12に渡す。なお,変形されなかった
変換対象文10についても候補の一つとして評価処理部
12に渡す。
【0032】評価処理部12は,評価情報記憶部15に
あらかじめ用意された評価情報(評価関数)を用いて,
変形処理部11が変形した文を評価する。ここで評価の
尺度は,例えば小学生向けというような低年齢層向けの
文章集合での出現頻度または出現確率が大きくなる変換
に高い評価を与えるものである。したがってこの例で
は,評価処理部12は,あらかじめ定められた範囲での
低年齢層向けの文章集合における「大臣を罷免する」と
「大臣をやめさせる」の出現頻度を求める。簡便な手法
としては,変形した部分を含む小さい領域範囲の文字列
が言語データで何回出現したかを数える。「大臣をやめ
させる」のほうが出現頻度が大きい場合,この表現のほ
うが低年齢層向けの易しい表現であるとわかる。これに
よりこの変形はよしとされ,変換結果文13として「大
臣をやめさせる」が出力される。なお,出現頻度ではな
く,出現(生起)確率を計算してもよい。
【0033】また,評価の尺度としては,所定の文章集
合での出現頻度や出現確率に限らず,他の何らかの尺度
を用いることもできる。例えば,あらかじめ単語の結び
付きや,構文解析結果から得られる文法上の言い回しに
対して,評価ポイントを定めておき,それを用いて評価
するようなことも可能である。また,変換後の文章集合
から平易さを示す何らかの尺度を学習し,それに従って
評価する方法も考えられる。
【0034】なお,低年齢層向けの文章集合において,
評価の都度,変換の候補の出現頻度を数えるのではな
く,あらかじめ文章集合に現れる各文,句,文節,単語
などごとに,それらの出現頻度(出現確率)を求めてお
いたテーブルを用意しておき,そのテーブルを検索する
ことによって出現頻度(出現確率)を求めるようにして
もよいことは言うまでもない。
【0035】(B)個人文体変換システムへの適用例 図4は,個人文体変換システムへの適用例を示してい
る。図4に示す個人文体変換システムでは,例えば芥川
龍之介の小説を,夏目漱石の文体の小説に書き換えた
り,ある無名の作家の小説をシェークスピアの文体の小
説に書き換えたりする処理を行う。
【0036】例えば図4の(1)の例のように,変換対
象文10として,「大臣を罷免するなどを行った」とい
う文が入力されたとする。変形処理部11は,この変換
対象文10を,あらかじめ変形規則記憶部14に用意さ
れた変形規則を用いて,異なる同義の表現に言い換え
る。ここで,「といった」という表現を多用する人の文
体への変形規則として, 「するなど」→「するといったこと」 ・・・・ という規則があったとすると,変形処理部11は,変換
対象文10に変形規則を適用することにより,「大臣を
罷免するなどを行った」という文から「大臣を罷免する
といったことを行った」という文を生成する。この他に
も,種々の変形規則が存在し,多くの変形された文が候
補として生成されることになる。これらの文を評価処理
部12に渡す。なお,変形されなかった変換対象文10
についても候補の一つとして評価処理部12に渡す。
【0037】評価処理部12は,あらかじめ評価規則記
憶部15に用意された評価情報(評価関数)を用いて,
変形処理部11が変形した文を評価する。ここで評価の
尺度は,変換目的である特定個人の文章集合での出現頻
度または出現確率が高くなるような表現に,高い評価を
与えるものである。したがってこの例では,評価処理部
12は,その特定個人の文章集合における「大臣を罷免
するなどを行った」という文や,「大臣を罷免するとい
ったことを行った」という文の出現頻度を求める。な
お,出現頻度は,必ずしも文全体の出現回数でなくても
よく,変形した部分を含む小さい領域範囲の文字列が文
章集合の中で何回出現したかでもよい。「大臣を罷免す
るといったことを行った」という文の出現頻度が大きい
場合,評価処理部12は,変換結果文13として「大臣
を罷免するといったことを行った」を出力する。
【0038】また,「であろう」を多用する人への文体
への変更の場合,例えば変形規則として, 「と思われる」→「であろう」 ・・・・ という規則を用い,評価の尺度として,その「であろ
う」を多用する特定個人の文章集合での出現頻度または
出現確率が高くなるような表現をよしとするものを用い
る。
【0039】変形処理部11は,図4の(2)のように
「大臣を罷免すると思われる」という変換対象文10を
入力すると,この入力に対して変形規則を適用すること
により,この文を「大臣を罷免するであろう」という表
現に変形する。評価処理部12による評価によって,
「大臣を罷免するであろう」という表現の評価値が最も
高いことがわかると,評価処理部12はこの文を変換結
果文13として出力する。
【0040】なお,評価の尺度としては,所定の文章集
合での出現頻度や出現確率に限らず,他の何らかの尺度
を用いることができることは,前述したシステムの例と
同様である。
【0041】以上,難解文変換システムへの適用例と個
人文体変換システムへの適用例を説明したが,本システ
ムは,文章語の何らかの文体を変換するものであれば,
同様に適用することができる。この場合,各変形規則は
共用することも可能である。例えば作者Aの文体を作者
Bの文体に変形する規則と,作者Bの文体を作者Aの文
体に変形する規則とが混在している変形規則があった場
合でも,評価情報を変えるだけで,同じ変形規則を用い
て作者Aの文体から作者Bの文体への変換,これとは逆
に作者Bの文体から作者Aの文体への変換を実現するこ
とができる。この点が従来技術と大きく異なる点であ
る。もちろん,変形規則をそれぞれの文体の変換に適し
た規則に選別して用いてもよいことは言うまでもない。
【0042】
【発明の効果】以上説明したように,本発明によれば,
種々の目的とする文体変換を自動的に行うことが可能に
なる。文体変換のための文字列の変形規則は,必ずしも
目的とする文体に変換されるような方向性のある変形の
規則でなくてもよく,少なくとも同義性が満足されれば
十分であるので,変形規則の収集・蓄積を容易に行うこ
とが可能である。
【図面の簡単な説明】
【図1】本発明のシステム構成例を示す図である。
【図2】文章語文体変換の処理フローチャートである。
【図3】難解文変換システムへの適用例を示す図であ
る。
【図4】個人文体変換システムへの適用例を示す図であ
る。
【符号の説明】 1 文章語文体変換処理装置 10 変換対象文 11 変形処理部 12 評価処理部 13 変換結果文 14 変形規則記憶部 15 評価情報記憶部
【手続補正書】
【提出日】平成14年7月15日(2002.7.1
5)
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】特許請求の範囲
【補正方法】変更
【補正内容】
【特許請求の範囲】

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 ある自然言語で記述された文章語を,同
    一の自然言語で記述された他の文体による文章語に変換
    するシステムであって,前記自然言語で記述された第1
    の文字列を同義の第2の文字列に言い換える変形の規則
    を記憶する変形規則記憶手段と,自然言語で記述された
    文体変換対象の文字列を入力する入力手段と,前記入力
    された文字列を前記変形規則記憶手段に記憶された変形
    の規則を用いて変形し,変換の候補を生成する変形処理
    手段と,文字列を変形した結果の表現が目的とする文体
    になっているかどうかを評価するための所定の評価尺度
    に基づいて,前記変形処理手段により生成された変換の
    候補を評価し,評価結果のよい表現を選択する評価処理
    手段と,前記選択された表現の変換結果を,目的とする
    文体に変換された文章語として出力する出力手段とを備
    えることを特徴とする文章語文体変換システム。
  2. 【請求項2】 前記評価尺度は,変換先の文体による文
    章を多く含む文章集合からなる大量の用例における変換
    の候補の出現頻度または出現確率を含み,出現頻度また
    は出現確率が大きいものに高い評価を与えるものである
    ことを特徴とする請求項1記載の文章語文体変換システ
    ム。
  3. 【請求項3】 前記評価尺度は,平易な文章を多く含む
    文章集合からなる大量の用例における変換の候補の出現
    頻度または出現確率を含み,出現頻度または出現確率が
    大きいものに高い評価を与えるものであり,前記文体の
    変換は,入力した難解文の文字列を平易文に変換するも
    のであることを特徴とする請求項1記載の文章語文体変
    換システム。
  4. 【請求項4】 前記評価尺度は,特定の個人の文章集合
    からなる大量の用例における変換の候補の出現頻度また
    は出現確率を含み,出現頻度または出現確率が大きいも
    のに高い評価を与えるものであり,前記文字列の変換
    は,入力した文字列の表現を前記特定の個人の文体に変
    換するものであることを特徴とする請求項1記載の文章
    語文体変換システム。
  5. 【請求項5】 コンピュータによって,ある自然言語で
    記述された文章語を,同一の自然言語で記述された他の
    文体による文章語に変換するためのプログラムであっ
    て,自然言語で記述された文体変換対象の文字列を入力
    する処理と,前記入力された文字列を,前記自然言語で
    記述された第1の文字列を同義の第2の文字列に言い換
    える変形の規則を用いて変形し,変換の候補を生成する
    処理と,文字列を変形した結果の表現が目的とする文体
    になっているかどうかを評価するための所定の評価尺度
    に基づいて,前記変形によって生成された変換の候補を
    評価し,評価結果のよい表現を選択する処理と,前記選
    択された表現の変換結果を,目的とする文体に変換され
    た文章語として出力する処理とを,コンピュータに実行
    させるための文章語文体変換処理プログラム。
JP2001205888A 2001-07-06 2001-07-06 文章語文体変換システムおよび文章語文体変換処理プログラム Expired - Lifetime JP4041875B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001205888A JP4041875B2 (ja) 2001-07-06 2001-07-06 文章語文体変換システムおよび文章語文体変換処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001205888A JP4041875B2 (ja) 2001-07-06 2001-07-06 文章語文体変換システムおよび文章語文体変換処理プログラム

Publications (2)

Publication Number Publication Date
JP2003022266A true JP2003022266A (ja) 2003-01-24
JP4041875B2 JP4041875B2 (ja) 2008-02-06

Family

ID=19042116

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001205888A Expired - Lifetime JP4041875B2 (ja) 2001-07-06 2001-07-06 文章語文体変換システムおよび文章語文体変換処理プログラム

Country Status (1)

Country Link
JP (1) JP4041875B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011090394A (ja) * 2009-10-20 2011-05-06 Toshiba Corp 文書処理装置およびプログラム
JP2011175574A (ja) * 2010-02-25 2011-09-08 Nippon Hoso Kyokai <Nhk> 文書平易化装置および平易化規則テーブル作成装置、ならびにプログラム
JP2017068879A (ja) * 2017-01-23 2017-04-06 日本電信電話株式会社 文体変換装置、方法、及びプログラム
CN110866377A (zh) * 2018-08-08 2020-03-06 北京优酷科技有限公司 文本内容的转换方法及装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011090394A (ja) * 2009-10-20 2011-05-06 Toshiba Corp 文書処理装置およびプログラム
JP2011175574A (ja) * 2010-02-25 2011-09-08 Nippon Hoso Kyokai <Nhk> 文書平易化装置および平易化規則テーブル作成装置、ならびにプログラム
JP2017068879A (ja) * 2017-01-23 2017-04-06 日本電信電話株式会社 文体変換装置、方法、及びプログラム
CN110866377A (zh) * 2018-08-08 2020-03-06 北京优酷科技有限公司 文本内容的转换方法及装置

Also Published As

Publication number Publication date
JP4041875B2 (ja) 2008-02-06

Similar Documents

Publication Publication Date Title
Şeker et al. Initial explorations on using CRFs for Turkish named entity recognition
Alegria et al. Automatic morphological analysis of Basque
US8515733B2 (en) Method, device, computer program and computer program product for processing linguistic data in accordance with a formalized natural language
Bowker Towards a corpus-based approach to terminography
JP3765799B2 (ja) 自然言語処理装置、自然言語処理方法及び自然言語処理プログラム
Abdurakhmonova et al. Developing NLP Tool for Linguistic Analysis of Turkic Languages
US7328404B2 (en) Method for predicting the readings of japanese ideographs
Hämäläinen et al. Development of an open source natural language generation tool for finnish
JP3932350B2 (ja) 言語変換処理統一システム
Amri et al. Amazigh POS tagging using TreeTagger: a language independant model
JP2003022266A (ja) 文章語文体変換システムおよび文章語文体変換処理プログラム
Yeshambel et al. Evaluation of corpora, resources and tools for Amharic information retrieval
Athukorala et al. Swa Bhasha: Message-Based Singlish to Sinhala Transliteration
Esmaeelpour et al. WordPars: A tool for orthographic and phonological neighborhood and other psycholinguistic statistics in Persian
Demilie et al. Automated all in one misspelling detection and correction system for Ethiopian languages
JP4041876B2 (ja) 複数尺度の利用による言語変換処理システムおよびその処理プログラム
JP2003178087A (ja) 外国語電子辞書検索装置および方法
JP3029403B2 (ja) 文章データ音声変換システム
Samir et al. Training and evaluation of TreeTagger on Amazigh corpus
Deksne et al. Towards the Development of Language Analysis Tools for the Written Latgalian Language
Raj A memory based approach to Malayalam noun generation
Chaudhary et al. A Study of Transliteration Approaches
Ahmed Detection of foreign words and names in written text
Abebe Developing A Morphological Analyzer And Generator For Awngi Verb Using Finite State Transducer
Forkel et al. Towards a sustainable handling of interlinear-glossed text in language documentation

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20031205

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20031205

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040127

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040224

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20040402

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20050610

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070618

R150 Certificate of patent or registration of utility model

Ref document number: 4041875

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term