JP2943791B2 - 言語識別装置,言語識別方法および言語識別のプログラムを記録した記録媒体 - Google Patents
言語識別装置,言語識別方法および言語識別のプログラムを記録した記録媒体Info
- Publication number
- JP2943791B2 JP2943791B2 JP10076479A JP7647998A JP2943791B2 JP 2943791 B2 JP2943791 B2 JP 2943791B2 JP 10076479 A JP10076479 A JP 10076479A JP 7647998 A JP7647998 A JP 7647998A JP 2943791 B2 JP2943791 B2 JP 2943791B2
- Authority
- JP
- Japan
- Prior art keywords
- language
- text data
- program
- character code
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Description
れる文字列の言語およびその文字コードの種類(文字コ
ード系)を判別する言語識別装置および方法,与えられ
たテキスト・データまたはキーワード(いずれもエンコ
ードされている)によって表わされるテキスト(文章)
または単語の言語を識別して種々の処理を切り替える各
種装置,ならびに上記装置を制御する,または上記方法
を実現するコンピュータ・プログラムを記憶した記録媒
体に関する。
韓国および台湾(中華民国)で使われている漢字(また
はハングル)用文字コードは,2バイトで1文字を表現
している。これらの文字コード(系)は,言語(日本
語,中国語,韓国語など)ごとに独立して定義されてい
る。エンコード方法(文字コード系,コードの種類また
はエンコードのルール)が異なれば同じ言語の文字でも
異なる文字コードで表される。言語を表わす情報は通常
文字コード・データに付加されていない。このため,一
連の文字コードが与えられたときに,その文字コードが
どのような言語をエンコードして得られたものかは簡単
には分からない。
ム,音声合成システムなどのような言語情報処理システ
ムは,特定の言語および文字コード系を前提としてつく
られている。複数種類の言語で利用可能な言語情報処理
システムを考えた場合にも,言語の種類ごとに言語情報
処理が異なるから,与えられるキーワードおよびテキス
ト・データの言語が分かっていることが必要である。与
えられるキーワード,テキスト・データの言語および文
字コード系が不明であると適切な処理は期待できない。
言語およびその文字コード系を識別できるようにするこ
とを目的とする。
またはテキスト・データの言語および文字コード系が分
からない場合であっても,それぞれの言語に適した各種
言語情報処理が可能になるようにすることを目的とす
る。
は,エンコードされたテキスト・データの言語と文字コ
ード系との組合せを識別する装置であって,言語と文字
コード系との組合せごとに,その組合せにおいて文字コ
ードが出現する確率をそれぞれ記述した複数の出現確率
テーブルを格納した記憶手段,与えられたテキスト・デ
ータに含まれる1または複数の文字コードについて上記
複数の出現確率テーブルからそれぞれ出現確率を読み出
し,言語と文字コード系との組合せごとに,評価データ
を得る手段,および得られた評価データにもとづいて,
与えられたテキスト・データの言語と文字コード系との
組合せを判別する手段を備えていることを特徴とする。
供している。すなわち,この方法はエンコードされたテ
キスト・データの言語と文字コード系との組合せを識別
する方法であって,言語と文字コード系との組合せごと
に,その組合せにおいて文字コードが出現する確率をそ
れぞれ記述した出現確率テーブルをあらかじめ作成して
おき,与えられたテキスト・データに含まれる1または
複数の文字コードについて上記複数の出現確率テーブル
からそれぞれ出現確率を読み出し,言語と文字コード系
との組合せごとに,評価データを得,得られた評価デー
タにもとづいて,与えられたテキスト・データの言語と
文字コード系との組合せを判別することを特徴とする。
ラムを格納した記録媒体も提供している。すなわち,こ
の記録媒体は言語と文字コード系との組合せごとに,そ
の組合せにおいて文字コードが出現する確率を記述した
出現確率テーブルを用いて,エンコードされたテキスト
・データの言語と文字コード系の組合せを識別するため
のプログラムを格納した記録媒体であって,与えられた
テキスト・データに含まれる1または複数の文字コード
について上記複数の出現確率テーブルからそれぞれ出現
確率を読み出し,言語と文字コード系との組合せごと
に,評価データを得,得られた評価データに基づいて,
与えられたテキスト・データの言語と文字コード系との
組合せを判別するようにコンピュータを制御するプログ
ラムを格納した記録媒体である。記録媒体とは磁気ディ
スク記憶装置,光磁気ディスク記憶装置,光ディスク記
憶装置,磁気テープ,半導体メモリ等をいう。
によって表わされる文字の言語と文字コード系との組合
せに依存する。同一の文字コードであっても,その文字
コードの出現確率は,言語ごとに異なる。また,同じ言
語でも文字コード系が異なれば同一文字コードの出現確
率が異なる。第1の発明は,言語と文字コード系との組
合せに特有な文字コードの出現確率に着目して文字コー
ドによって表わされる言語およびその文字コード系の種
類を判別するものである。
ド列の一文字コードごとに上記出現確率テーブルから上
記出現確率が読出され,評価データが言語と文字コード
系との組合せごとに作成される。出現確率に関係する評
価データが低ければ入力された文字コード列はその言語
と文字コード系との組合せに関するものではない可能性
が高いと判断され,評価データが高ければ入力された文
字コード列はその言語と文字コード系との組合せに関す
るものである可能性が高いと考えられる。このようにし
て評価データにもとづいて,与えられたテキスト・デー
タ(文字コード列)の言語と文字コード系との組合せが
判別される。
率の積を算出し,算出された値にもとづいてテキスト・
データの言語およびエンコーディング方法を判別するこ
とが精度の観点から好ましい。いずれか一つの文字コー
ドの出現確率が0または0に非常に近い数値であれば,
積も非常に小さい値となり,そのような言語と文字コー
ド系との組合せが明確に除外される。
析システムは,与えられるテキスト・データの言語を識
別する言語識別手段,複数の言語について設けられた複
数の形態素解析手段,および上記言語識別手段によって
識別された言語に適した上記形態素解析手段に,与えら
れた上記テキスト・データを供給する制御手段を備えた
ことを特徴とする。
供している。すなわち,この方法は複数の言語について
複数の形態素解析手段を設けておき,与えられたテキス
ト・データの言語を識別し,識別された言語に適した上
記形態素解析手段に,与えられた上記テキスト・データ
を供給することを特徴とする。
プログラムを格納した記録媒体も提供している。すなわ
ちこの記録媒体は,複数の言語について設けられた複数
の形態素解析手段へのテキスト・データの供給を切り替
えるためのプログラムを格納した記録媒体であって,与
えられたテキスト・データの言語を識別し,識別された
言語に適した上記形態素解析手段に,与えられた上記テ
キスト・データを供給するようにコンピュータを制御す
るためのプログラムを格納したコンピュータが読取り可
能な記録媒体である。
は複数の言語に対応して設けられている。与えられるテ
キスト・データの言語が識別される。識別された言語に
応じてその言語に適した形態素解析手段にテキスト・デ
ータが供給される。入力するテキスト・データがどのよ
うな言語に関するものかがわからなくても最適な形態素
解析が実施される。
テムは,与えられるキーワードの言語を識別する言語識
別手段,複数の言語について設けられ,入力するキーワ
ードにもとづいてそのキーワードに関連する情報を出力
する複数の検索手段,および上記言語識別手段によって
識別された言語に適した上記検索手段に,与えられたキ
ーワードを供給する制御手段を備えたことを特徴とす
る。
も提供している。すなわち,この方法は,入力するキー
ワードにもとづいてそのキーワードに関連する情報を出
力する複数の検索手段を複数の言語について設けてお
き,与えられたキーワードの言語を識別し,識別された
言語に適した上記検索手段に,与えられたキーワードを
供給することを特徴とする。
ためのプログラムを格納した記録媒体も提供している。
すなわち,この記録媒体は,複数の言語について設けら
れ,入力するキーワードにもとづいてそのキーワードに
関連する情報を出力する複数の検索手段へのキーワード
の供給を切り替えるためのプログラムを格納した記録媒
体であって,与えられるキーワードの言語を識別し,識
別された言語に適した上記検索手段に,与えられたキー
ワードを供給するようにコンピュータを制御するための
プログラムを格納したコンピュータが読取り可能な記録
媒体である。
数の言語に対応して設けられている。
される。識別された言語に応じて,その言語に適した検
索手段にキーワードが供給される。
するものかがわからなくても最適な検索処理を実現でき
る。
は,与えられるテキスト・データの言語を識別する言語
識別手段,上記テキスト・データによって表わされるテ
キストを出力する出力装置,および上記言語識別手段に
よって識別された言語にもとづいて,上記出力装置にお
ける上記テキストの出力形態を制御する出力形態制御手
段を備えていることを特徴とする。
供している。すなわち,この方法は,与えられるテキス
ト・データの言語を識別し,識別された言語にもとづい
て,上記テキスト・データによって表わされるテキスト
を出力する出力装置における上記テキストの出力形態を
制御することを特徴とする。
記録媒体も提供している。すなわち,この記録媒体は,
与えられるテキスト・データの言語を識別し,識別され
た言語にもとづいて,上記テキスト・データによって表
わされるテキストを出力する出力装置における上記テキ
ストの出力形態を制御するようにコンピュータを制御す
るためのプログラムを格納したコンピュータが読取り可
能な記録媒体である。
・データの言語が識別される。識別された言語にもとづ
いて上記テキストの出力形態(例えば,フォントの種類
の選択,縦書きか横書きか,左から右に向かって読むよ
うに出力するか右から左に向かって読むような出力する
かなど)が制御される。言語に応じた最適な出力が可能
となる。
その場合には,プリンタにおけるテキストの印刷形態を
制御する。
には,表示装置における表示形態を制御する。
テムは,与えられるテキスト・データの言語を識別する
言語識別手段,2つの言語の複数の組合せについて設け
られ,一の言語を他の言語に翻訳して出力する複数の翻
訳手段,および上記言語識別手段によって識別された言
語に適した上記翻訳手段に,与えられたテキスト・デー
タを供給する制御手段を備えることを特徴とする。
も提供している。すなわち,この方法は,一の言語を他
の言語に翻訳して出力する複数の翻訳手段が2つの言語
の複数の組合せについて設けられ,与えられたテキスト
・データの言語を識別し,識別された言語に適した上記
翻訳手段に,与えられたテキスト・データを供給するこ
とを特徴とする。
記録媒体も提供している。すなわち,この記録媒体は,
2つの言語の複数の組合せについて設けられ,一の言語
を他の言語に翻訳して出力する複数の翻訳手段へのテキ
スト・データの入力を切り替えるためのプログラムを格
納した記録媒体であって,与えられるテキスト・データ
の言語を識別し,識別された言語に適した上記翻訳手段
に,与えられたテキスト・データを供給するようにコン
ピュータを制御するためのプログラムを格納したコンピ
ュータが読取り可能な記録媒体である。
つの言語の複数の組合せについて設けられている。
が識別される。識別された言語に応じてその言語に適し
た翻訳手段にテキスト・データが与えられる。
なくても,所定の言語に翻訳することができる。
こともできる。
・プロセッサは,複数の言語についてのテキスト・デー
タを記憶するテキスト・データ記憶手段,上記テキスト
・データ記憶手段に記憶されているテキスト・データお
よび入力されるテキスト・データの言語を識別する言語
識別手段,言語の種類ごとに設けられ,入力されたテキ
スト・データをそのテキスト・データによって表わされ
るテキストの言語体系に適した言語のテキスト・データ
に変換する言語入力手段,および上記言語識別手段にお
ける識別結果にもとづいて,入力されたテキスト・デー
タをそれに適した言語の上記言語入力手段に与えるよう
に制御する制御手段を備えていることを特徴とする。
供している。すなわち,この方法は,複数の言語につい
てのテキスト・データが記憶されており,入力するテキ
ストの言語ごとに,入力されたテキスト・データをその
テキスト・データによって表わされるテキストの言語体
系に適した言語に変換する言語入力手段が設けられ,記
憶されているテキスト・データおよび入力されるテキス
ト・データの言語を識別し,言語識別結果にもとづい
て,入力されたテキスト・データをそれに適した言語の
上記言語入力手段に与えるように制御する方法である。
記録媒体も提供している。すなわち,この記録媒体は,
複数の言語についてのテキスト・データが記録されてお
り,入力するテキストの言語ごとに,入力されたテキス
ト・データをそのテキスト・データによって表されるテ
キストの言語体系に適した言語に変換する言語入力手段
が設けられている場合に,入力されたテキスト・データ
をそれに適した上記言語入力手段に供給するためのプロ
グラムを格納した記録媒体であって,記憶されているテ
キスト・データおよび入力されるテキスト・データの言
語を識別し,上記識別結果にもとづいて,入力されたテ
キスト・データをそれに適した言語の上記言語入力手段
に与えるようにコンピュータを制御するためのプログラ
ムを格納したコンピュータが読取り可能な記録媒体であ
る。
のテキスト・データが記憶されている。記憶されている
テキスト・データおよび入力されるテキスト・データの
言語が識別され,この識別結果に応じて入力されたテキ
スト・データがそれに適した言語の上記言語入力手段に
与えられる。
システムは,与えられるテキスト・データの言語を識別
する言語識別手段,複数の言語について設けられ,入力
するテキスト・データによって表わされるテキストを音
声に変換して出力する複数の音声合成装置,および上記
言語識別手段によって識別された言語に適した上記音声
合成装置に,与えられたテキスト・データを供給する制
御手段を備えていることを特徴とする。
も提供している。すなわち,この方法は,入力するテキ
スト・データによって表わされるテキストを音声に変換
して出力する複数の音声合成装置が複数の言語について
設けられ,与えられたテキスト・データの言語を識別
し,識別された言語に適した上記音声合成装置に,与え
られたテキスト・データを供給する方法である。
記録媒体も提供している。すなわち,この記録媒体は,
複数の言語について設けられ,入力するテキスト・デー
タによって表わされるテキストを音声に変換して出力す
る複数の音声合成装置へのテキスト・データの入力を切
り替えるためのプログラムを格納した記録媒体であっ
て,与えられるテキスト・データがどのような言語に関
するものかを識別し,識別された言語に適した上記音声
合成装置に,与えられたテキスト・データを供給するよ
うにコンピュータを制御するためのプログラムを格納し
たコンピュータが読取り可能な記録媒体である。
は,複数の言語に対応して設けられている。
スト・データがどのような言語のものかが識別される。
識別された言語に応じてその言語に適した音声合成装置
にテキスト・データが供給される。
語のものかがわからなくてもそのテキスト・データによ
って表わされるテキストが所定の言語での音声によって
出力される。
テムは,与えられるテキスト・データの言語を識別する
言語識別手段,複数の言語について設けられた複数の処
理手段,および上記言語識別手段によって識別された言
語に適した上記処理手段に,与えられた上記テキスト・
データを供給する制御手段を備えたことを特徴とする。
も提供している。すなわち,この方法は,複数の処理手
段を複数の言語について設けておき,与えられるテキス
ト・データの言語を識別し,識別された言語に適した上
記処理手段に,与えられた上記テキスト・データを供給
することを特徴とする。
プログラムを格納した記録媒体も提供している。すなわ
ち,この記録媒体は,複数の言語について設けられた複
数の処理手段へのテキスト・データの入力を切り替える
ためのプログラムを格納した記録媒体であって,与えら
れるテキスト・データの言語を識別し,識別された言語
に適した上記処理手段に,与えられた上記テキスト・デ
ータを供給するようにコンピュータを制御するためのプ
ログラムを格納したコンピュータが読取り可能な記録媒
体である。
の言語に対応して設けられている。
される。識別された言語に応じてその言語に適した処理
手段にテキスト・データが供給される。
語に関するものかがわからなくても最適な処理が実施さ
れる。
別装置に関するものである。
を,図2は,その電気的構成の概要をそれぞれ示してい
る。
タ10を含む。コンピュータ10にはCRT表示装置
(または液晶ディスプレイ・パネル)11,プリンタ1
2および入力装置(キーボード13Aやマウス13B)
が接続されている。コンピュータ10の内部にはFDド
ライブ14,CD−ROMドライブ15およびHDユニ
ット16が設けられている。FDドライブ14は,FD
(フロッピー・ディスク)19へのデータの書込みおよ
びFD19からのデータの読出しを行なう。CD−RO
Mドライブ15は,CD−ROM(コンパクト・ディス
ク−リード・オンリ・メモリ)18からのデータの読出
しを行なう。HDユニット16は,HD(ハードディス
ク)(図示略)へのデータの書込みおよびHDからのデ
ータの読出しを行なう。コンピュータ10はさらに内部
メモリ(半導体メモリなど)17を含む。
別のための言語識別プログラムおよびこの言語識別に用
いられる出現確率データが格納されている。その内容が
図3に示されている。出現確率データは,文字コード
(すなわち文字)が出現する確率を表わすものである。
文字ごとの出現確率は過去の様々な文書に現れている文
字を統計処理することにより予め求められる。代表的な
文字についてのみ出現確率データを求めておいてもよい
し,すべての文字について求めておいてもよい。出現確
率データは,言語と文字コード系(文字コードの種類ま
たはエンコーディング方法)との組合せごとにテーブル
の形態で格納されている。この実施例においては,中国
語用(大陸用および台湾用)テーブル(出現確率表),
日本語用テーブル(EUC(Extended UNIX Code)コー
ドおよびShift-JIS (Japanese Industrial Standards
)コード),ならびに韓国語用テーブルがある。日本
語は一般的にEUCコードまたはShift−JISコードによ
ってエンコードされる。このEUCコードやShift−JIS
コードが文字コード系またはエンコーディング方法であ
る。したがって,言語の種類のみならず,文字コード系
の識別も行える。日本語以外の他の言語についても同様
である。もっとも,日本語Shift−JISコードは日本語E
UCコードにコード変換が可能であるから,後述する言
語識別処理の例のように日本語についてはEUCコード
・テーブルのみを設けておいてもよい。
ラムおよびデータは,文字コードの言語識別装置の立ち
上げ時に,CD−ROM18から読み出され,HDに格
納される。文字コードの言語識別処理においては,これ
らのプログラムおよびデータの一部は,必要に応じて,
内部メモリ17に一時的に記憶され,または展開され
る。
プログラムおよび出現確率データの相互の関係を概念的
に示している。
ト入力処理ソフトウェアによって(またはキーボード1
3Aを介して)入力されたテキスト・データは,言語識
別プログラムによって,一文字ごとに切出され,切出さ
れた各文字について言語(日本語,中国語,韓国語)と
文字コード系との組合せごとに出現確率データが求めら
れる。求められた出現確率が評価値用ワークエリア(内
部メモリ17の一部)において統計処理(後述する掛算
処理)され,最終的に入力テキスト・データの言語の種
類と文字コード系との組合せが識別される。
コード識別の処理手順を示すフローチャートである。こ
の処理においては「梅花に鶯」という句を表す文字コー
ド列(この文字コード列は,たとえば日本語EUCコー
ドでは0xC7DF,0xB2D6,0xA4CB,0
xB2A9と表わされる,日本語Shift−JISコードでは
0x947E,0x89D4,0x82C9,0x89
A7と表される。ここで,0xは16進数を示す。)が
キーボードから入力された場合にその文字コード列がど
の言語と文字コード系との組合せのものかを識別する例
について説明する。図6はこの句「梅花に鴬」を構成す
る文字コードの出現確率を言語と文字コード系との組合
せごとに示すものであり,各出現確率テーブルにおいて
最大の出現確率を 100%として正規化された値が示され
ている。
分(一文字分)のデータが取り出される(ステップ2
1)。
ード)に対応する出現確率が言語と文字コード系との組
合せごとに出現確率テーブルから読み出される(ステッ
プ23,25,29,31)。取り出された2バイト分
のデータは,他方では,Shift-JIS コードからEUCコ
ードに変換され(ステップ22),変換後のEUCコー
ドによる文字コードの出現確率が日本語用出現確率テー
ブル(EUCコード)から読み出される(ステップ2
7)。
ドは,日本語のEUCコード系では,0.0948%,日本語
のShift-JIS コード系では0%,中国語(大陸)のEU
Cコード系では0.0129%,中国語(台湾)のBig5コ
ード系では0.0022%,韓国語のEUCコード系では10.9
41%の出現確率を持つ。
評価値との積が算出され,この積が新たな評価値とされ
る(評価値の更新)(ステップ24,26,28,3
0,32)。この算出も言語と文字コード系との組合せ
ごと(すなわち,出現確率テーブルごと)に行われる。
評価値の初期値として1が設定されており,一文字目の
文字コードの場合には,読出された出現確率と1とが乗
算される。
大値をもつ評価値を100として他の評価値が正規化さ
れる(ステップ33)。これは,後述するステップ35
でしきい値との比較処理を行うためである。
べての文字コードについて上記の処理が終了していなけ
れば(ステップ34),最大値を持つ評価値を除く他の
すべての評価値の合計が算出される。この算出合計値が
所定のしきい値以下であれば(ステップ35でYE
S),入力したテキスト・データは最大値を持つ評価値
を与える言語と文字コード系との組合せであると判別さ
れる。この算出合計値が所定のしきい値を超えていれば
(ステップ35でNO),再びステップ21からステッ
プ34の処理が繰り返される。
ドに関して,日本語のEUCコードにおける出現確率は
3.2740%,日本語のShift-JIS コードの出現確率は0
%,中国語(大陸)のEUCコードにおける出現確率は
0.1118%,中国語(台湾)のBig5コードにおける出
現確率は0.2874%,韓国語のEUCコードにおける出現
確率は0%である。
ドの出現確率は,日本語のEUCコードでは59.155%,
日本語のShift-JIS コードでは0%,中国語(大陸)の
EUCコードでは0.0001%,中国語(台湾)のBig5
コードでは0%,韓国語のEUCコードでは0.0001%で
ある。
ドの出現確率は,日本語のEUCコードでは0.0001%,
日本語のShift-JIS コードでは0%,中国語(大陸)の
EUCコードでは0.3717%,中国語(台湾)のBig5
コードでは0.0048%,韓国語のEUCコードでは0.0299
%である。
ードの出現確率の積が最終的な評価値として得られる。
入力されたテキスト・データを構成するすべての文字コ
ードについて上記の処理が終了したことになる(ステッ
プ34でYES)。最終的な評価値は日本語のEUCコ
ードでは0.000000001836%,日本語のShift-JIS コード
では0%,中国語(大陸)のEUCコードでは0.000000
000005366 %,中国(台湾)のBig5コードでは0
%,韓国のEUCコードでは0%となる。これらの値を
比べると日本語のEUCコードにおける評価値が一番大
きいから「梅花に鶯」は日本語でしかもEUCコードで
表現されたものであると判断される。このようにして文
字コードによって表わされる文字の言語およびその文字
コードの種類(文字コード系,またはエンコーディング
方法)が識別される。入力テキスト・データが多数の文
字コードを含む場合には,通常は,3〜4文字について
の処理が終了したときに,ステップ35でYESとな
り,入力テキスト・データの言語と文字コード系の組合
せの判別が終えるであろう。
するものである。
の電気的構成の概要を示すブロック図,図8はその処理
手順の概要を示している。
複数種類の言語用の複数の形態素解析装置を含み,入力
するテキスト・データをそのテキスト・データによって
表わされるテキストの言語の種類に適した形態素解析装
置に与え,形態素解析を行わせるものである。
はCD−ROM43に格納されている。このCD−RO
M43が言語識別装置46に装填されることにより,C
D−ROM43に格納されているプログラムおよびデー
タが読取られる。
らマルチリンガル形態素システム42に入力する。テキ
スト・データは,言語識別装置46および切替装置47
に入力する。入力したテキスト・データによって表わさ
れるテキストの言語(必要ならば言語と文字コード系と
の組合せ;以下同じ)が言語識別装置46において識別
される(ステップ55)。この識別処理は上述した第1
実施例の方法により行ってもよいし,言語に特有な文字
が含まれているかどうかにより行うこともできるし,い
わゆる文字のN−gramによる方法または文字列に関
するルールにより行うこともできる。
したテキスト・データが,識別された言語に対応する形
態素解析装置(48,49および50のいずれか)に入
力するように,切替装置47が言語識別装置46によっ
て切替制御される(ステップ56)。これにより,入力
テキスト・データに適した形態素解析装置48,49ま
たは50に,テキスト・データが与えられ,適切な形態
素解析が行われる。
成装置51に与えられ,入力テキスト・データについて
のインデックスが生成される。生成されたインデックス
は検索用インデックス・データ・ベース54に記憶され
る。検索エンジン53を用いて検索用インデックス・デ
ータ・ベース54をアクセスすることにより,ユーザは
自分のコンピュータ52を用いて所望の検索処理を行な
うことができる。
は,Inso CorporationのIntelliScope Search Enhance
r, 富士通株式会社のBreakfast , 言語工学研究所の俊
司,京都大学工学部電気系長尾研究室のJUMAN,奈
良先端科学技術大学院大学情報科学研究科自然言語処理
講座(松本研究室)の茶筌(ChaSen)があり,韓国語の形
態解析素装置には,奈良先端科学技術大学院大学情報科
学研究科自然言語処理講座(松本研究室)の茶筌(KoCh
a) があり,中国語(大陸)の形態素解析装置には,ニ
ューメキシコ大学CRLのChinese Segmenter , 北京大
学の現代漢語文本切分と品詞標記規範があり,英語の形
態素解析装置には,Inso CorporationのIntelliScope S
earch Enhancerがある。
その機能の観点から言語識別装置46,切替装置47,
形態素解析装置48,49,50およびインデックス生
成装置51に分けて示されているが,これらの装置を1
台または複数台のコンピュータにより実現することがで
きる。このことは以下に示す他の実施例においてもあて
はまる。パーソナル・コンピュータ52,検索エンジン
53および検索用インデックス・データ・ベース54を
マルチリンガル形態素解析システムに含ませてもよい。
のである。
的構成の概要を示すブロック図,図10はその処理手順
を示している。
異なる言語の検索装置を有しており,入力するテキスト
・データによって表わされるテキストの言語の種類に適
した検索装置にテキスト・データを与え,検索処理を行
なうものである。
は,CD−ROM62に格納されている。このCD−R
OM62は言語識別装置65に装填されることにより,
CD−ROM62に格納されているプログラムおよびデ
ータが読取られる。
て,例えば,オペレータが入力する。入力装置61から
入力されたキーワードは,言語識別装置65および切替
装置66に入力する。言語識別装置65において,入力
したキーワードの言語の種類が識別される(ステップ7
1)。
入力したキーワードが,識別された種類の言語用の検索
装置67,68または69に入力するように言語識別装
置65によって切替装置66が切替制御される(ステッ
プ72)。これにより,入力したキーワードの言語に適
した検索装置67,68または69にキーワードが与え
られ,そのキーワードにもとづいた検索処理が行われ
る。検索結果は言語検索装置67,68または69から
出力される。
にかかわらず,かつその言語が事前に分からなくとも検
索処理が実行される。マルチリンガル検索システムもま
た1台または複数台のコンピュータにより実現できる。
ある。
構成の概要を示すブロック図,図12はその処理手順の
概要を示している。
テキスト・データによって表わされるテキストの言語の
種類に応じてテキストの出力形態を制御するものであ
る。
ムは,CD−ROM82に格納されている。このCD−
ROM82は,言語識別装置85に装填されることによ
り,CD−ROM82に格納されているプログラムおよ
びデータが読取られる。
入力される。入力されたテキスト・データは,言語識別
装置85,表示制御装置86およびプリンタ制御装置8
8に与えられる。表示制御装置86は,表示装置87に
おけるテキストの表示を制御するものである。プリンタ
制御装置88は,プリンタ89におけるテキストの印刷
を制御するものである。
スト・データによって表わされるテキストの言語が識別
される(ステップ91)。
ト・データによって表わされるテキストの言語の種類に
応じた表示,印刷が行われるように言語識別装置85に
よって表示制御装置86およびプリンタ制御装置88が
制御される(ステップ92,93)。例えば,識別され
た言語に応じて,表示または印刷されるフォントの種類
(言語が日本語であればMSPゴシック,中国語(大
陸)であればMSSoug,中国語(台湾)であればMing L
iU,韓国語であればMS Hei),横書きか縦書きか,左
から右にむかって書くか右から左にむかって書くか,文
字間隔,行間,などが制御される。
表わされる言語の種類に応じて表示装置87における表
示およびプリンタ89における印刷の形態が制御され
る。
のである。
気的構成の概要を示すブロック図,図14はその処理手
順の概要を示している。
語,日本語および韓国語から英語にそれぞれ翻訳する複
数の翻訳エンジンを有しており,入力するテキスト・デ
ータによって表わされる言語の種類に応じた翻訳エンジ
ンに入力テキスト・データを与え,翻訳処理を行なうも
のである。
ムは,CD−ROM102に格納されている。このCD
−ROM102は,言語識別装置105に装填されるこ
とにより,CD−ROM102に格納されているプログ
ラムおよびデータが読取られる。
表わすテキスト・データが与えられ,言語識別装置10
5および切替装置106に入力する。言語識別装置10
5において,入力するテキスト・データによって表わさ
れるテキストの言語が識別される(ステップ111)。
データが,そのテキスト・データによって表わされる言
語に適した翻訳エンジン,すなわち中国語から英語への
翻訳を行なう翻訳エンジン107,日本語から英語への
翻訳を行なう翻訳エンジン108または韓国語から英語
への翻訳を行なう翻訳エンジン109のいずれかに入力
するように,言語識別装置105によって切替装置10
6の切替が制御される(ステップ112)。
よって表わされるテキストの言語の種類が日本語,中国
語,韓国語のいずれであっても英語に翻訳されて出力さ
れる。言語識別装置105,切替装置106および翻訳
エンジン107,108,109は1台または複数台の
コンピュータにより実現できる。
関するものである。
ッサの電気的構成の概要を示すブロック図,図16はそ
の処理手順の概要を(複数の処理形態をまとめて)示し
ている。
ムは,CD−ROM134に格納されている。このCD
−ROM134は,言語識別装置127に装填されるこ
とにより,CD−ROM134に格納されているプログ
ラムおよびデータが読取られる。
は,日本語用の言語入力装置122,中国語用の言語入
力装置123,韓国語用の言語入力装置124および英
語用の言語入力装置125が含まれている。日本語用の
言語入力装置122は,ローマ字またはかな入力された
テキスト・データをかな漢字混じり文のテキスト・デー
タに変換するものである。中国語用の言語入力装置12
3は,アルファベット入力されたテキスト・データを中
国語のテキスト・データに変換するものである。韓国語
用の言語入力装置124は,ハングル文字を構成する字
母(アルファベット入力であってもよい)を入力した場
合にハングル文字を構成するテキスト・データに変換す
るものである。英語用の言語入力装置125は,アルフ
ァベット入力されたテキスト・データよって表わされる
テキストのスペルチェックを行なうものである。
合,中国語のテキスト・データを入力する場合,韓国語
のテキスト・データを入力する場合および英語のテキス
ト・データを入力する場合のいずれであっても共通のキ
ーボード121が用いられる(もちろん,言語に応じて
異なるキーボードを用いてもよい)。
の言語のテキスト・データ(ファイル)が,一般的には
混在して,格納されている。図15に示す例では,中国
語のテキスト・データを記憶しているメモリ領域12
9,日本語のテキスト・データを記憶しているメモリ領
域130,および韓国語のテキスト・データを記憶して
いるメモリ領域131が図示されている。ユーザが所望
のテキスト・ファイルを指定すると,そのファイルが読
み出され,言語識別装置127に与えられる。言語識別
装置127は読み出されたファイルのテキスト・データ
の言語(日本語,中国語,韓国語または英語)を識別し
(ステップ141),識別結果に応じて表示のためのフ
ォントを選択する。これにより,テキスト・データによ
って表される言語の文字が表示される(ステップ14
2)。
入力したときには,キーボード121から入力されたテ
キスト・データは言語識別装置127に与えられ,入力
されたテキスト・データが日本語,中国語,韓国語およ
び英語のいずれの言語のものかが識別される(ステップ
141)。言語が識別されると,キーボード121から
入力されたテキスト・データが対応する入力装置12
2,123,124または125に入力するように,言
語識別装置127によって切替装置133が切替えられ
る(ステップ142)。入力装置(122,123,1
24,125のいずれか)から得られるテキスト・デー
タは,最終的には,その言語に応じた該当するファイル
(メモリ領域)に格納されるように切替装置126の切
替制御が行われる(ステップ142)。該当するファイ
ルがない場合,該当する言語のメモリ領域がない場合に
は,新たなファイルまたはメモリ領域が形成される。
るものである。
の電気的構成を示すブロック図,図18はその処理手順
の概要を示している。
入力するテキスト・データによって表わされるテキスト
をそのテキストの言語の音声で出力するものである。
ムは,CD−ROM152に格納されている。このCD
−ROM152は,言語識別装置155に装着されるこ
とにより,CD−ROM152に格納されているプログ
ラム,データが読取られる。
国語(大陸)のテキスト・データを,中国大陸で一般的
に用いられている中国語(大陸)音声に変換して出力す
る音声合成装置157,日本語のテキスト・データを,
日本語の音声で出力する音声合成装置158,入力する
テキスト・データが韓国語の場合に,韓国語の音声で出
力する音声合成装置159,および中国語(大陸)のテ
キスト・データを台湾で一般的に用いられている中国語
の音声で出力する音声合成装置160を有している。
データは,言語識別装置155および切替装置156に
与えられる。言語識別装置155において,入力したテ
キスト・データによって表わされるテキストの言語が識
別される(ステップ161)。
データが,そのテキスト・データによって表わされるテ
キストの言語の適した音声合成装置157,158,1
59または160に入力するように切替装置156が制
御される(ステップ162)。これにより,入力したテ
キスト・データによって表わされるテキストの言語に適
した音声合成装置157,158,159または160
にテキスト・データが入力するようになる。それぞれの
言語での音声出力が得られる。言語識別装置155,切
替装置156および音声合成装置157〜160は1台
または複数台のコンピュータにより実現可能である。
ものである。
入力するテキスト・データによって表わされるテキスト
の言語が日本語以外の言語であっても日本語の音声で出
力するものである。
ムの電気的構成の概要を示すブロック図である。
は,中国語を日本語に翻訳して出力する翻訳エンジン1
77および韓国語を日本語に翻訳して出力する翻訳エン
ジン178が含まれている。
5における言語識別処理およびその識別結果による切替
装置176の切替処理のプログラムが格納されている。
に装着されると,CD−ROM172に格納されている
プログラムが読み取られる。以下の動作はこのプログラ
ムにしたがって実行される。
力される。入力されたテキスト・データは,言語識別装
置175および切替装置176に与えられる。言語識別
装置175において,入力したテキスト・データによっ
て表わされる言語の種類が識別される。
じて言語識別装置175によって切替装置176の切替
が制御される。これにより入力したテキスト・データが
中国語のテキストを表わすものであれば,中国語日本語
翻訳エンジン177に与えられ,入力したテキスト・デ
ータが韓国語のテキストを表わすものであれば,韓国語
日本語翻訳エンジン178に与えられる。翻訳エンジン
177または178において翻訳された日本語のテキス
ト・データは日本語音声合成装置179に与えられ,日
本語の音声出力が得られる。マルチリンガル音声合成シ
ステムに入力したテキスト・データが日本語のものであ
れば,切替装置176から出力したテキスト・データ
は,直接日本語音声合成装置179に与えられ日本語で
出力されるのはいうまでもない。
いる。
概要を示している。
録媒体のデータ構造を示している。
よび出現確率データの相互の関係を示している。
している。
よび文字コードに対応して示す。
成の概要を示すブロック図である。
理手順の概要を示している。
要を示すブロック図である。
順の概要を示している。
概要を示すブロック図である。
順の概要を示している。
概要を示すブロック図である。
順の概要を示している。
的構成の概要を示すブロック図である。
る処理手順の概要を示している。
成の概要を示すブロック図である。
理手順の概要を示している。
成の概要を示している。
D−ROM 42 マルチリンガル形態素解析システム 48,49,50 形態素解析装置 61,81,101,151 入力装置 65,85,105,127,155,175 言語識
別装置 67,68,69 検索装置 86 表示制御装置 88 プリンタ制御装置 107,108,109,177,178 翻訳エンジ
ン 157,158,159,179 音声合成装置
Claims (18)
- 【請求項1】 エンコードされたテキスト・データの言
語と文字コード系との組合せを識別する装置であって, 言語と文字コード系との組合せごとに,その組合せにお
いて文字コードが出現する確率をそれぞれ記述した複数
の出現確率テーブルを格納した記憶手段, 与えられたテキスト・データに含まれる1または複数の
文字コードについて上記複数の出現確率テーブルからそ
れぞれ出現確率を読み出し,言語と文字コード系との組
合せごとに,評価データを得る手段,および得られた評
価データにもとづいて,与えられたテキスト・データの
言語と文字コード系との組合せを判別する手段, を備えた言語識別装置。 - 【請求項2】 上記の評価データを得る手段が,出現確
率テーブルから読み出された出現確率の積を算出するも
のである,請求項1に記載の言語識別装置。 - 【請求項3】 エンコードされたテキスト・データの言
語と文字コード系との組合せを識別する方法であって, 言語と文字コード系との組合せごとに,その組合せにお
いて文字コードが出現する確率をそれぞれ記述した出現
確率テーブルをあらかじめ作成しておき, 与えられたテキスト・データに含まれる1または複数の
文字コードについて上記複数の出現確率テーブルからそ
れぞれ出現確率を読み出し,言語と文字コード系との組
合せごとに,評価データを得, 得られた評価データにもとづいて,与えられたテキスト
・データの言語と文字コード系との組合せを判別する, 言語識別方法。 - 【請求項4】 出現確率テーブルから読み出された出現
確率の積を算出することにより上記評価データを得るも
のである,請求項3に記載の言語識別方法。 - 【請求項5】 言語と文字コード系との組合せごとに,
その組合せにおいて文字コードが出現する確率を記述し
た出現確率テーブルを用いて,エンコードされたテキス
ト・データの言語と文字コード系との組合せを識別する
ためのプログラムであって, 与えられたテキスト・データに含まれる1または複数の
文字コードについて上記複数の出現確率テーブルからそ
れぞれ出現確率を読み出し,言語と文字コード系との組
合せごとに,評価データを得, 得られた評価データに基づいて,与えられたテキスト・
データの言語と文字コード系との組合せを判別するよう
にコンピュータを制御する言語識別プログラムを格納し
た記録媒体。 - 【請求項6】 上記出現確率テーブルをさらに格納した
請求項5に記載の記録媒体。 - 【請求項7】 上記プログラムが出現確率テーブルから
読み出された出現確率の積を言語と文字コード系との組
合せごとに算出し,得られた積に基づいて与えられたテ
キスト・コードの言語と文字コード系の組合せを判別す
るものである,請求項5に記載の記録媒体。 - 【請求項8】 複数の言語についてそれぞれ設けられた
複数の形態素解析手段へのテキスト・データの供給を制
御するためのプログラムであって, 請求項5に記載の言語識別プログラムを含み,この言語
識別プログラムにより,与えられたテキスト・データの
言語を識別し, さらに,識別された言語に適した上記形態素解析手段
に,与えられた上記テキスト・データを供給するように
コンピュータを制御するためのプログラムを格納したコ
ンピュータが読取り可能な記録媒体。 - 【請求項9】 複数の言語についてそれぞれ設けられ,
入力するキーワードにもとづいてそのキーワードに関連
する情報を出力する複数の検索手段へのキーワードの供
給を制御するためのプログラムであって, 請求項5に記載の言語識別プログラムを含み,この言語
識別プログラムにより,与えられるキーワードの言語を
識別し, さらに,識別された言語に適した上記検索手段に,与え
られたキーワードを供給するようにコンピュータを制御
するためのプログラムを格納したコンピュータが読取り
可能な記録媒体。 - 【請求項10】 請求項5に記載の言語識別プログラム
を含み,この言語識別プログラムにより,与えられるテ
キスト・データの言語を識別し, 識別された言語にもとづいて,上記テキスト・データに
よって表わされるテキストを出力する出力装置における
上記テキストの出力形態を制御するようにコンピュータ
を制御するためのプログラムを格納したコンピュータが
読取り可能な記録媒体。 - 【請求項11】 上記出力装置が上記テキストを印刷す
るプリンタであり, 上記プリンタにおける印刷形態を制御するものである請
求項10に記載の記録媒体。 - 【請求項12】 上記出力装置が上記テキストを表示す
る表示装置であり, 上記表示装置における表示形態を制御するものである請
求項10に記載の記録媒体。 - 【請求項13】 2つの言語の複数の組合せについてそ
れぞれ設けられ,一の言語を他の言語に翻訳して出力す
る複数の翻訳手段へのテキスト・データの入力を切り替
えるためのプログラムであって, 請求項5に記載の言語識別プログラムを含み,この言語
識別プログラムにより,与えられるテキスト・データの
言語を識別し, さらに,識別された言語に適した上記翻訳手段に,与え
られたテキスト・データを供給するようにコンピュータ
を制御するためのプログラムを格納したコンピュータが
読取り可能な記録媒体。 - 【請求項14】 翻訳により得られた上記他の言語を音
声に変換して出力するプログラムをさらに備えた請求項
13に記載の記録媒体。 - 【請求項15】 複数の言語についてのテキスト・デー
タが記憶されており,入力するテキストの言語ごとに,
入力されたテキスト・データをそのテキスト・データに
よって表されるテキストの言語体系に適した言語に変換
する言語入力手段が設けられている場合に,入力された
テキスト・データをそれに適した上記言語入力手段に供
給するためのプログラムであって, 請求項5に記載の言語識別プログラムを含み,この言語
識別プログラムにより,記憶されているテキスト・デー
タおよび入力されるテキスト・データの言語を識別し, さらに,上記識別結果にもとづいて,記憶されているテ
キスト・データについてはその出力を制御し,入力され
たテキスト・データについてはそれに適した言語の上記
言語入力手段に与えるようにコンピュータを制御するた
めのプログラムを格納したコンピュータが読取り可能な
記録媒体。 - 【請求項16】 複数の言語についてそれぞれ設けら
れ,入力するテキスト・データによって表わされるテキ
ストを音声に変換して出力する複数の音声合成装置への
テキスト・データの入力を切り替えるためのプログラム
であって, 請求項5に記載の言語識別プログラムを含み,この言語
識別プログラムにより,与えられるテキスト・データの
言語を識別し, さらに,識別された言語に適した上記音声合成装置に,
与えられたテキスト・データを供給するようにコンピュ
ータを制御するためのプログラムを格納したコンピュー
タが読取り可能な記録媒体。 - 【請求項17】 複数の言語についてそれぞれ設けられ
た複数の処理手段へのテキスト・データの入力を切り替
えるためのプログラムであって, 請求項5に記載の言語識別プログラムを含み,この言語
識別プログラムにより,与えられるテキスト・データの
言語を識別し, さらに,識別された言語に適した上記処理手段に,与え
られた上記テキスト・データを供給するようにコンピュ
ータを制御するためのプログラムを格納したコンピュー
タが読取り可能な記録媒体。 - 【請求項18】 得られた評価データに基づいて,与え
られたテキスト・データの言語と文字コード系との組合
せを判別する手段を欠いている請求項1に記載の言語識
別装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10076479A JP2943791B2 (ja) | 1997-03-14 | 1998-03-11 | 言語識別装置,言語識別方法および言語識別のプログラムを記録した記録媒体 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9-79180 | 1997-03-14 | ||
JP7918097 | 1997-03-14 | ||
JP10076479A JP2943791B2 (ja) | 1997-03-14 | 1998-03-11 | 言語識別装置,言語識別方法および言語識別のプログラムを記録した記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH10320399A JPH10320399A (ja) | 1998-12-04 |
JP2943791B2 true JP2943791B2 (ja) | 1999-08-30 |
Family
ID=26417626
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP10076479A Expired - Fee Related JP2943791B2 (ja) | 1997-03-14 | 1998-03-11 | 言語識別装置,言語識別方法および言語識別のプログラムを記録した記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2943791B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9800657B2 (en) | 2011-08-16 | 2017-10-24 | Empire Technology Development Llc | Allocating data to plurality storage devices |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2366940B (en) | 2000-09-06 | 2004-08-11 | Ericsson Telefon Ab L M | Text language detection |
KR100881000B1 (ko) * | 2002-07-22 | 2009-02-03 | 삼성전자주식회사 | 이동 무선단말기의 문자 입력 방법 |
JP2010240844A (ja) * | 2009-04-01 | 2010-10-28 | Seiko Epson Corp | ラベルプリンター、プログラムおよびラベルプリントシステム |
CN110838290A (zh) * | 2019-11-18 | 2020-02-25 | 中国银行股份有限公司 | 跨语言交流的语音机器人交互方法及装置 |
-
1998
- 1998-03-11 JP JP10076479A patent/JP2943791B2/ja not_active Expired - Fee Related
Non-Patent Citations (1)
Title |
---|
菊井玄一郎、鷲崎誠司、林良彦、砂場倫太郎「インターネット情報ナビゲーションにおける多言語機能」、情報処理学会自然言語処理の応用に関するシンポジウム論文集、Vol.95,No.6,P.97−p.105(1995) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9800657B2 (en) | 2011-08-16 | 2017-10-24 | Empire Technology Development Llc | Allocating data to plurality storage devices |
Also Published As
Publication number | Publication date |
---|---|
JPH10320399A (ja) | 1998-12-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100330801B1 (ko) | 언어식별장치및언어식별방법 | |
EP0686286B1 (en) | Text input transliteration system | |
JP3689954B2 (ja) | 異種コード文字列転記装置および電子辞書 | |
JP2943791B2 (ja) | 言語識別装置,言語識別方法および言語識別のプログラムを記録した記録媒体 | |
JP2000148754A (ja) | マルチリンガル・システム,マルチリンガル処理方法およびマルチリンガル処理のプログラムを記憶した媒体 | |
JPH11328166A (ja) | 文字入力装置及び文字入力処理プログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JPH0883280A (ja) | 文書処理装置 | |
JPH10207875A (ja) | 表作成装置およびその方法 | |
JPH0612548B2 (ja) | 文書処理装置 | |
JPH10232864A (ja) | 文章入力装置、及び文章入力プログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP3273778B2 (ja) | 仮名漢字変換装置及び仮名漢字変換方法 | |
JPH0612453A (ja) | 未知語抽出登録装置 | |
JPH08171568A (ja) | 複数言語入力方法 | |
JPH0380363A (ja) | 文書処理装置 | |
JPH11306176A (ja) | 文字処理装置及び方法並びにその制御プログラムを記憶した媒体 | |
JP3184035B2 (ja) | 単文節カナ漢字変換入力方式 | |
JPH09146937A (ja) | 文字列変換装置および文字列変換方法 | |
JPH07182344A (ja) | 機械翻訳装置 | |
JPS62202259A (ja) | 文書作成装置 | |
JPS60207948A (ja) | カナ漢字変換処理装置 | |
JPH08241315A (ja) | 文書処理装置の単語登録機構 | |
JPH11191107A (ja) | 文書処理方法とその装置 | |
JPH02110771A (ja) | 電訳機 | |
JPH06131329A (ja) | 日本語文字処理装置 | |
JPH0769909B2 (ja) | 文書処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080625 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090625 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090625 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100625 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100625 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110625 Year of fee payment: 12 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110625 Year of fee payment: 12 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120625 Year of fee payment: 13 |
|
LAPS | Cancellation because of no payment of annual fees |