JP2014120178A - 中国語の繁体字と簡体字との変換システム及び中国語の繁体字と簡体字との変換方法 - Google Patents
中国語の繁体字と簡体字との変換システム及び中国語の繁体字と簡体字との変換方法 Download PDFInfo
- Publication number
- JP2014120178A JP2014120178A JP2013259986A JP2013259986A JP2014120178A JP 2014120178 A JP2014120178 A JP 2014120178A JP 2013259986 A JP2013259986 A JP 2013259986A JP 2013259986 A JP2013259986 A JP 2013259986A JP 2014120178 A JP2014120178 A JP 2014120178A
- Authority
- JP
- Japan
- Prior art keywords
- word
- position number
- characters
- simplified
- chinese characters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/53—Processing of non-Latin text
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Document Processing Apparatus (AREA)
- Machine Translation (AREA)
Abstract
【課題】本発明は、自動的に、素早く、且つ正確に簡体字を繁体字に、或いは繁体字を簡体字に変換できる中国語の繁体字と簡体字との変換システム及び中国語の繁体字と簡体字との変換方法を提供することを目的とする。
【解決手段】本発明の中国語の繁体字と簡体字の変換システムは、単語表において、長い単語から短い単語の順で1つの単語を取得する取得モジュールと、文書における単語の位置番号を検索する検索モジュールと、取得された前記単語の位置番号が、該単語より長さが長い別の単語の位置番号と重なるかどうかを判断する判断モジュールと、単語が獲得した位置番号において、重なっている番号を削除する削除モジュールと、該単語の重なっている位置番号を削除した後の位置番号を単語表に保存する保存モジュールと、位置番号が保存された単語表によって、文書を変換する変換モジュールと、を備える。
【選択図】図3
【解決手段】本発明の中国語の繁体字と簡体字の変換システムは、単語表において、長い単語から短い単語の順で1つの単語を取得する取得モジュールと、文書における単語の位置番号を検索する検索モジュールと、取得された前記単語の位置番号が、該単語より長さが長い別の単語の位置番号と重なるかどうかを判断する判断モジュールと、単語が獲得した位置番号において、重なっている番号を削除する削除モジュールと、該単語の重なっている位置番号を削除した後の位置番号を単語表に保存する保存モジュールと、位置番号が保存された単語表によって、文書を変換する変換モジュールと、を備える。
【選択図】図3
Description
本発明は、中国語の文書の変換システム及び変換方法に関し、特に中国語の繁体字と簡体字との変換システム及び繁体字と簡体字との変換方法に関するものである。
中国語には、繁体字と簡体字があり、大部分の繁体字と簡体字の単語の書き方、意味は同じであるが、書き方、意味が全く違う単語もある。例えば、書き方において、特許文献を記載する際に使用する漢字において、パソコン等の電子装置を使用して、簡体字
の簡体字を繁体字に変換した場合
であり、簡体字「屏蔽」を繁体字に変換した場合「遮罩」である。意味においては、単語の意味を考えずに、文字を簡体字から繁体字に変換すると、意味が全く異なってしまう場合があるため、文書全体も全く違う意味になってしまう。このような場合、特に正式な文書或いは専門文書において、文書の繁体字或いは簡体字を一つ一つ調査しなければならならず、変換の正確性が低いため実に不便である。
以上の問題点に鑑みて、本発明は、自動的に文書の簡体字と繁体字とを変換して、素早く、且つ正確に簡体字を繁体字に、或いは繁体字を簡体字に変換できる中国語の繁体字と簡体字との変換システム及び中国語の繁体字と簡体字との変換方法を提供することを目的とする。
上記の課題を解決するために、本発明の中国語の繁体字と簡体字との変換システムは、単語表において、長い単語から短い単語の順で1つの単語を取得する取得モジュールと、文書における単語の位置番号を検索する検索モジュールと、取得された前記単語の位置番号が、該単語より長さが長い別の単語の位置番号と重なっているかどうかを判断する判断モジュールと、単語が獲得した位置番号において、重なっている番号を削除する削除モジュールと、該単語の重なっている位置番号を削除した後の位置番号を単語表に保存する保存モジュールと、位置番号が保存された単語表によって、文書を変換する変換モジュールと、を備える。
上記の課題を解決するために、本発明の中国語の繁体字と簡体字との変換方法は、単語表において、長い単語から短い単語の順で1つの単語を取得するステップと、文書において単語の位置番号を検索するステップと、取得された前記単語の位置番号が、該単語より長さが長い別の単語の位置番号と重なっているかどうかを判断するステップと、単語が獲得した位置番号において、重なっている番号を削除するステップと、該単語の重なっている位置番号を削除した後の位置番号を単語表に保存するステップと、全ての単語が取得された際、位置番号が保存された単語表によって、文書を変換するステップと、を備える。
本発明の中国語の繁体字と簡体字との変換システム及び中国語の繁体字と簡体字との変換方法は、自動的に文書の簡体字と繁体字とを変換して、素早く、且つ正確に簡体字を繁体字に、或いは繁体字を簡体字に変換できるので、文書の繁体字或いは簡体字を一つ一つ調査する必要がなく、便利である。
以下、図面に基づいて、本発明に係る中国語の繁体字と簡体字との変換システム及び繁体字と簡体字との変換方法について詳細に説明する。本発明の中国語の繁体字と簡体字との変換システム20は、パソコン2内で実行される。パソコン2は、データベース5と接続される。パソコン2は、ディスプレイ1、キーボード3、及びマウス4と接続されて、パソコンを具体的に操作する際、入力/出力装置となる。
データベース5は、パソコン2に設置される或いは外部に設置されても良い。データベース5には、変換するための文書及び単語表600が保存されている(図4を参照)。単語表600は、中国語の簡体字と繁体字との間に互いに変換するための対応する単語を備える。例えば、図4に示したように、中国語の簡体字
に対応する繁体字は
であり、簡体字
に対応する繁体字は
であり、簡体字「数」に対応する繁体字は
であり、簡体字「数据」に対応する繁体字は「資料」である。単語表600は、変換を必要とする文書中の全ての中国語の文字(簡体字及び繁体字)を備え、単語表600によって、文書の簡体字を繁体字に変換する或いは繁体字を簡体字に変換する。本実施形態において、パソコン2は、文書の簡体字を繁体字に変換する。文書の様式は、WORD、EXCEL、PDF、XML、HTML等である。
図2に示したように、本発明のパソコン2は、更にデータ線、信号線と接続されたメモリ270及びプロセッサ280を備える。中国語の繁体字と簡体字との変換システム20は、取得モジュール210、検索モジュール220、判断モジュール230、削除モジュール240、保存モジュール250、変換モジュール260を備える。取得モジュール210、検索モジュール220、判断モジュール230、削除モジュール240、保存モジュール250、変換モジュール260は、それぞれプログラムコード化された後、メモリ270に保存され、中国語の繁体字と簡体字との変換システム20にそれぞれ対応する機能を提供する。
取得モジュール210は、単語表600中、長い単語から短い単語の順で1つの単語を取得する。取得モジュール210は、先ず、単語表600の中から、最も長い単語を取得する。例えば、図4に示したように、4つの単語において、単語
の長さが最も長いので、取得モジュール210は、先ず、単語
を取得し、次に単語「資料」を取得する。取得モジュール210は長さが同じ単語については、ランダムに取得する。また、ユーザは、予め各単語に優先番号を付けることができ、取得モジュール210はこの優先番号に基づいて単語を取得する。例えば、単語
の優先番号はAであり、単語「数据」の優先番号はBであり、漢字
の優先番号はCであり、漢字「数」の優先番号はDであり、優先順が最も高い順からA、B、C、D、とする。取得モジュール210は、先ず、優先番号Aの単語
を取得し、次に優先番号Bの単語「数据」を取得し、次に優先番号Cの漢字
を取得し、最後に優先番号Dの漢字「数」を取得する。本実施形態において、取得モジュール210は各単語を一度しか取得しない。具体的には、各単語には、1つの状態信号が備えられ、ある1つの単語が取得モジュール210に取得されると、この単語の状態信号が変更され、取得モジュール210は単語の状態信号によって、単語が取得されたかどうかを判断する。例えば、漢字
が取得される前の状態信号が01であり、漢字
が取得された後、状態信号は00に変更され、取得モジュール210が漢字
の状態信号00を読み取った際、漢字
は既に読み取られていると判断し、漢字
を取得しない。
検索モジュール220は、文書における単語の位置番号を検索する。具体的には、各様式の文書に記載された文字全てに番号がつけられており、この番号の順に並べられている。文書の各文字には、それぞれ1つずつ対応する位置番号がつけられている。この位置番号は数字であり、小さい数字から大きい数字の順に番号がつけられており、位置番号によって文書中における文字の具体的な位置を検索することができる。一般文書において、位置番号を検索する関数が提供されることによって、ユーザが書いた文字の位置番号を検索することができる。例えば、WORD文書中で、位置番号を検索する際の関数は、mAppNO.Index()であり、検索モジュール220は、該関数を利用して、文書における各単語の位置番号を検索する。単語は、複数の文字が組み合わさって形成され、文書中において、各文字に一つ一つ対応する位置番号がある。従って、各単語は、1つ或いは複数の位置番号を備える。例えば、単語
は、4つの文字を備える。これにより、単語
は4つの位置番号を備える。各単語の文字の数は決まっているので、単語中の1つの位置番号がわかれば、他の文字の位置番号も計算することができる。従って、ユーザは、単語中の1つの位置番号を該単語の位置番号と設定する。これによりメモリ270の記憶容量を減らすことができ、且つ計算効率を向上させることができる。本実施形態において、選択された単語の第一文字の番号を該単語の番号と設定する。例えば、単語
の4つの文字の位置番号がそれぞれ「67」、「68」、「69」、「70」である場合、位置番号「67」を選択して、該単語の位置番号と設定する。文書中において、単語が対応する位置番号を有さない場合、文書において該単語は記載されていないことを意味する。単語が文書中に、1回或いは複数回記載された際、単語は、1つ或いは複数の位置番号を備える。図5に示したように、単語表600中において、各単語は複数の位置番号を備え、各単語の位置番号は、単語の第一文字に基づく。
判断モジュール230は、取得された前記単語の位置番号が、この取得された単語より長さが長い別の単語の位置番号と重なるかどうかを判断する。取得された単語の位置番号が、該取得された単語より長さが長い別の単語の位置番号と重なった場合、取得された単語の位置番号と、長さが長い別の単語の位置番号には、同じ位置番号が存在することを意味する。具体的には、単語
が文書中に3回記載されており、位置番号がそれぞれ「67」、「75」、「86」であり、並びに単語
は、その文書中で長さが最も長いので、判断モジュール230は、該単語の位置番号は、該単語より長さが長い別の単語の位置番号と重ならないと判断する。漢字
の場合、文書中に7回記載されており、その位置番号はそれぞれ、「1」、「5」、「22」、「55」、「67」、「75」、「86」であり、漢字
より長さが長い別の単語は、単語
、単語「数据」であり、単語
の位置番号は、漢字
の位置番号と重なり、その重なった位置番号は「67」、「75」、「86」であり、単語「数据」の位置番号と漢字
の位置番号は重ならない。各単語は、いずれか1つの文字の位置番号を該単語の位置番号に設定するので、取得した単語の位置番号と、該単語より長さが長い別の単語の位置番号が重なるかどうかを判断する際、各単語の位置番号のみを比べるのではなく、各単語の長さも考慮しなければならない。具体的には、単語
の位置番号は3つであり、それぞれ「67」、「75」、「86」であり、単語は4つの文字を備える。該単語の実際の位置番号は、「67」、「68」、「69」、「70」、「75」、「76」、「77」、「78」、「86」、「87」、「88」、「89」であり、単語
より長さが短い単語の位置番号を上述の位置番号と比べて、単語
削除モジュール240は、単語が獲得した全ての位置番号において、重なった番号を削除する。具体的には、漢字
は文書中に7回記載され、位置番号はそれぞれ「1」、「5」、「22」、「55」、「67」、「75」、「86」である。この中で、重なった位置番号は、「67」、「75」、「86」であり、削除モジュール240はこれら重なった位置番号を削除するので、漢字
の位置番号は「1」、「5」、「22」、「55」である。
保存モジュール250は、前記単語の重なった位置番号を削除した後の位置番号を単語表600に保存する。具体的には、漢字
の位置番号は「1」、「5」、「22」、「55」であり、該4つの位置番号が単語表600に保存される(図5を参照)。図5に示したように、単語表600の単語間において位置番号は重ならない。
判断モジュール230は、全ての単語が取得されたかどうかを判断する。つまり、各単語の状態信号が変更されると、単語は取得されたことを意味する。
変換モジュール260は、位置番号が保存された単語表600によって、文書を変換する。具体的には、変換モジュール260は、文書中における各単語の位置番号を検索し、文書中の単語を単語表600から該単語と対応する変換単語に変換して、文書の簡単字を対応する繁体字に変換する。漢字
を例に挙げて説明すると、変換モジュール260は、位置番号が保存された単語表600から単語
の4つの位置番号、つまり、簡体字の漢字
に対応する繁体字の漢字
を探し出し、文書の4つ位置番号にある漢字
を漢字
に変換する。
図3に示したように、繁体字と簡体字との変換方法は、以下のステップ(S10〜S70)を備える。ステップS10において、取得モジュール210は、単語表600中、長い単語から短い単語の順で1つの単語を取得する。取得モジュール210は、先ず、単語表600から、最も長い単語を取得する。例えば、図4に示したように、4つの単語において、単語
の長さが最も長いので、取得モジュール210は、先ず、単語
を取得し、次に単語
を取得し、取得モジュール210は、長さが同じ単語については、ランダムに取得する。また、ユーザは、予め各単語に優先番号を付けることができる。この際、取得モジュール210はこの優先番号に基づいて単語を取得する。例えば、単語
の優先番号はAであり、単語「数据」の優先番号はBであり、漢字
の優先番号はCであり、漢字「数」の優先番号はDであり、優先順が最も高い順からA、B、C、D、とする。取得モジュール210は、先ず、優先番号Aの単語
を取得し、次に優先番号Bの単語「数据」を取得し、次に優先番号Cの漢字
を取得し、最後に優先番号Dの漢字「数」を取得する。本実施形態において、取得モジュール210は各単語を一度しか取得しない。具体的には、各単語には、1つの状態信号を有し、ある1つの単語が取得モジュール210に取得された際、その単語の状態信号は変更され、取得モジュール210は単語の状態信号によって、その単語が取得されたかどうかを判断する。例えば、漢字
が取得される前の状態信号が01である場合、漢字
が取得された後、状態信号は00に変更される。取得モジュール210が漢字
の状態信号00を読み取ると、漢字
は既に読み取られたと判断し、漢字
は取得しない。
ステップS20において、検索モジュール220は、各様式の文書に記載された文字全てに番号がつけられており、この番号の順に並べられている。文書の各文字には、それぞれ1つずつ対応する位置番号がつけられている。この位置番号は数字であり、小さい数字から大きい数字の順に番号がつけられており、位置番号によって文書中における文字の具体的な位置を検索することができる。一般文書において、位置番号を検索する関数が提供されることによって、ユーザが書いた文字の位置番号を検索することができる。例えば、WORD文書中で、位置番号を検索する際の関数は、mAppNO.Index()であり、検索モジュール220は、該関数を利用して、文書における各単語の位置番号を検索する。単語は、複数の文字が組み合わさって形成され、文書中において、各文字に一つ一つ対応する位置番号がある。従って、各単語は、1つ或いは複数の位置番号を備える。例えば、単語
は、4つの文字を備える。これにより、単語
は4つの位置番号を備える。各単語の文字の数は決まっているので、単語中の1つの位置番号がわかれば、他の文字の位置番号も計算することができる。従って、ユーザは、単語中の1つの位置番号を該単語の位置番号と設定する。これによりメモリの記憶容量を減らすことができ、且つ計算の効率を向上することができる。本実施形態において、選択された単語の第一文字の番号を該単語の番号と設定する。例えば、単語
の4つの文字の位置番号がそれぞれ「67」、「68」、「69」、「70」である場合、位置番号「67」を選択して、該単語の位置番号と設定する。文書中における単語が対応する位置番号を有さない場合、文書にこの単語は記載されていないことを意味する。単語が文書中において、1回或いは複数回記載された際、この単語は、1つ或いは複数の位置番号を備える。図5に示したように、単語表600中において、各単語は複数の位置番号を備え、各単語の位置番号は、単語の第一文字が文書における位置番号である。
ステップS30において、判断モジュール230は、取得された前記単語の位置番号が、この取得された単語より長さが長い別の単語の位置番号と重なるかどうかを判断する。取得された単語の位置番号が、該取得された単語より長さが長い別の単語の位置番号と重なった場合、取得された単語の位置番号と、長さが長い別の単語の位置番号には、同じ位置番号が存在することを意味する。具体的には、単語
が文書中に3回記載されており、位置番号はそれぞれ「67」、「75」、「86」であり、単語
は文書中で長さが最も長いので、判断モジュール230は、該単語の位置番号は、該単語より長さが長い別の単語の位置番号と重ならないと判断する。漢字
の場合、文書中に7回記載されており、その位置番号はそれぞれ、「1」、「5」、「22」、「55」、「67」、「75」、「86」であり、漢字
より長さが長い別の単語は、単語
、単語「数据」であり、単語
の位置番号は、漢字
の位置番号と重なり、その重なった位置番号は「67」、「75」、「86」である。この場合、ステップS40に進む。
ステップS40において、削除モジュール240は、単語が獲得した位置番号中において重なっている番号を削除する。具体的には、漢字
は文書中において7回記載されており、位置番号はそれぞれ「1」、「5」、「22」、「55」、「67」、「75」、「86」である。この中で、重なっている位置番号は、「67」、「75」、「86」である。この際、削除モジュール240は重なった位置番号を削除するので、漢字
の位置番号は「1」、「5」、「22」、「55」である。
ステップS50において、保存モジュール250は、前記単語の重なっている位置番号を削除した後の位置番号を単語表600に保存する。具体的には、漢字
の位置番号は「1」、「5」、「22」、「55」であり、該4つの位置番号が単語表600に保存される。図5に示しているように、単語表600の単語間において、位置番号は重なっていない。
ステップS60において、判断モジュール230は、全ての単語が取得されたかどうかを判断する。単語が取得されたと判断された場合、ステップS70に進む、単語が取得されていないと判断された場合、ステップS10に戻る。
ステップS70において、変換モジュール260は、位置番号が保存された単語表600によって、文書を変換する。具体的には、変換モジュール260は、文書中における各単語の位置番号を検索し、文書中の該単語を単語表600からこの単語と対応する変換単語に変換して、文書の簡単字を対応する繁体字に変換する。漢字
を例に挙げて説明すると、変換モジュール260は、位置番号が保存された単語表600から漢字
の4つの位置番号、つまり、簡体字の漢字
に対応する繁体字の漢字
を探し出し、文書の4つ位置番号にある漢字
を漢字
に変換する。
1 ディスプレイ
2 パソコン
3 キーボード
4 マウス
5 データベース
20 中国語の繁体字と簡体字との変換システム
210 取得モジュール
220 検索モジュール
230 判断モジュール
240 削除モジュール
250 保存モジュール
260 変換モジュール
270 メモリ
280 プロセッサ
600 単語表
2 パソコン
3 キーボード
4 マウス
5 データベース
20 中国語の繁体字と簡体字との変換システム
210 取得モジュール
220 検索モジュール
230 判断モジュール
240 削除モジュール
250 保存モジュール
260 変換モジュール
270 メモリ
280 プロセッサ
600 単語表
Claims (10)
- 中国語の繁体字と簡体字との変換システムにおいて、
単語表において、長い単語から短い単語の順で1つの単語を取得する取得モジュールと、
文書における単語の位置番号を検索する検索モジュールと、
取得された該単語の位置番号が、該単語より長さが長い別の単語の位置番号と重なるかどうかを判断する判断モジュールと、単語が獲得した位置番号において重なっている番号を削除する削除モジュールと、
前記単語の重なった位置番号を削除した後の位置番号を単語表に保存する保存モジュールと、
位置番号が保存された単語表によって、文書を変換する変換モジュールと、
を備えることを特徴とする中国語の繁体字と簡体字との変換システム。 - 前記単語表は、中国語の簡体字と繁体字との間に互いに変換するための対応する単語を備えることを特徴とする請求項1に記載の中国語の繁体字と簡体字との変換システム。
- 前記位置番号はであり、小さい数字から大きい数字の順に番号がつけられており、位置番号によって文書中における文字の具体的な位置を検索することを特徴とする請求項1に記載の中国語の繁体字と簡体字との変換システム。
- 前記単語は、いずれか1つの文字の位置番号を該単語の位置番号に設定することを特徴とする請求項1から3のいずれか1項に記載の中国語の繁体字と簡体字との変換システム。
- 取得された単語の位置番号が、該取得された単語より長さが長い別の単語の位置番号と重なった場合、取得された単語の位置番号と、長さが長い別の単語の位置番号には、同じ位置番号が存在することを意味することを特徴とする請求項1から3のいずれか1項に記載の中国語の繁体字と簡体字との変換システム。
- 中国語の繁体字と簡体字との変換方法において、
単語表において、長い単語から短い単語の順で1つの単語を取得するステップと、
文書において単語の位置番号を検索するステップと、
取得された前記単語の位置番号が、該単語より長さが長い別の単語の位置番号と重なるかどうかを判断するステップと、
単語が獲得した位置番号において重なっている番号を削除するステップと、
該単語の重なっている位置番号を削除した後の位置番号を単語表に保存するステップと、
全ての単語が取得された際、位置番号が保存された単語表によって、文書を変換するステップと、
を備えることを特徴とする中国語の繁体字と簡体字との変換方法。 - 前記単語表は、中国語の簡体字と繁体字との間に互いに変換するための対応する単語を備えることを特徴とする請求項6に記載の中国語の繁体字と簡体字との変換方法。
- 前記位置番号は数字によって、小さい数字から大きい数字の順に番号がつけられ、位置番号によって文書中における文字の具体的な位置を検索することを特徴とする請求項6に記載の中国語の繁体字と簡体字との変換方法。
- 前記単語は、いずれか1つの文字の位置番号を該単語の位置番号に設定することを特徴とする請求項6から8のいずれか1項に記載の中国語の繁体字と簡体字との変換方法。
- 取出された該単語の位置番号が、該単語より長さが長い別の単語の位置番号と重なり、取得した単語の位置番号と、該単語より長さが長い別の単語の位置番号とには、同じ位置番号が存在することを特徴とする請求項6から8のいずれか1項に記載の中国語の繁体字と簡体字との変換方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210548121.0 | 2012-12-17 | ||
CN201210548121.0A CN103870442A (zh) | 2012-12-17 | 2012-12-17 | 中文简繁体转换系统及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2014120178A true JP2014120178A (ja) | 2014-06-30 |
Family
ID=50908986
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013259986A Pending JP2014120178A (ja) | 2012-12-17 | 2013-12-17 | 中国語の繁体字と簡体字との変換システム及び中国語の繁体字と簡体字との変換方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US9208148B2 (ja) |
JP (1) | JP2014120178A (ja) |
CN (1) | CN103870442A (ja) |
TW (1) | TW201430592A (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108108337A (zh) * | 2016-11-25 | 2018-06-01 | 北大方正集团有限公司 | 简繁互转方法及装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006252164A (ja) * | 2005-03-10 | 2006-09-21 | Fuji Xerox Co Ltd | 中国語文書処理装置 |
JP2008052720A (ja) * | 2006-08-21 | 2008-03-06 | Fuji Xerox Co Ltd | 簡体字と繁体字とを相互変換する方法及びその変換装置 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5268840A (en) * | 1992-04-30 | 1993-12-07 | Industrial Technology Research Institute | Method and system for morphologizing text |
JPH08263478A (ja) * | 1995-03-24 | 1996-10-11 | Matsushita Electric Ind Co Ltd | 中国語簡繁体字文書変換装置 |
JP3566111B2 (ja) * | 1998-11-30 | 2004-09-15 | 松下電器産業株式会社 | 記号辞書作成方法及び記号辞書検索方法 |
CN1143232C (zh) * | 1998-11-30 | 2004-03-24 | 皇家菲利浦电子有限公司 | 正文的自动分割 |
CN1192302C (zh) * | 1999-09-22 | 2005-03-09 | 微软公司 | 简繁体汉字输入系统及其方法 |
CA2362416C (en) * | 2000-01-05 | 2009-08-04 | Mitsubishi Denki Kabushiki Kaisha | Keyword extracting device |
CN1271546C (zh) * | 2000-10-13 | 2006-08-23 | 财团法人资讯工业策进会 | 中文繁体字与简体字的即时互换方法 |
CN1369833A (zh) * | 2001-02-16 | 2002-09-18 | 意蓝科技股份有限公司 | 词汇式繁体中文与简体中文的转换系统及转换方法 |
JP2008287406A (ja) * | 2007-05-16 | 2008-11-27 | Sony Corp | 情報処理装置および情報処理方法、プログラム、並びに、記録媒体 |
CN101303692B (zh) * | 2008-06-19 | 2012-08-29 | 徐文和 | 一种供机器语言翻译的通用数码语义库 |
US8326809B2 (en) * | 2008-10-27 | 2012-12-04 | Sas Institute Inc. | Systems and methods for defining and processing text segmentation rules |
US8447588B2 (en) * | 2008-12-18 | 2013-05-21 | Palo Alto Research Center Incorporated | Region-matching transducers for natural language processing |
US9104244B2 (en) * | 2009-06-05 | 2015-08-11 | Yahoo! Inc. | All-in-one Chinese character input method |
TWM423854U (en) * | 2011-10-20 | 2012-03-01 | Ipxnase Technology Ltd | Document analyzing apparatus |
-
2012
- 2012-12-17 CN CN201210548121.0A patent/CN103870442A/zh active Pending
- 2012-12-20 TW TW101148557A patent/TW201430592A/zh unknown
-
2013
- 2013-08-30 US US14/014,467 patent/US9208148B2/en not_active Expired - Fee Related
- 2013-12-17 JP JP2013259986A patent/JP2014120178A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006252164A (ja) * | 2005-03-10 | 2006-09-21 | Fuji Xerox Co Ltd | 中国語文書処理装置 |
JP2008052720A (ja) * | 2006-08-21 | 2008-03-06 | Fuji Xerox Co Ltd | 簡体字と繁体字とを相互変換する方法及びその変換装置 |
Also Published As
Publication number | Publication date |
---|---|
CN103870442A (zh) | 2014-06-18 |
US9208148B2 (en) | 2015-12-08 |
TW201430592A (zh) | 2014-08-01 |
US20140172410A1 (en) | 2014-06-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10810356B2 (en) | Visual searching and navigation | |
JP6381002B2 (ja) | 検索推奨方法及び装置 | |
CN107622080B (zh) | 一种数据处理方法及设备 | |
US10579616B2 (en) | Data search system, data search method, and program product | |
CN106648569B (zh) | 目标序列化实现方法和装置 | |
CN103970751A (zh) | 多国语言网页转换系统及方法 | |
US20190171773A1 (en) | Multi-index method and apparatus, cloud system and computer-readable storage medium | |
JP2005107597A (ja) | 類似文検索装置、類似文検索方法、およびプログラム | |
CN108846069B (zh) | 一种基于标记语言的文档执行方法及装置 | |
US20140067853A1 (en) | Data search method, information system, and recording medium storing data search program | |
KR20160100322A (ko) | 시멘틱상으로 의미있는 텍스트 선택들의 식별 | |
CN110795920B (zh) | 一种文档生成方法及设备 | |
US20140280050A1 (en) | Term searching based on context | |
JP2014120178A (ja) | 中国語の繁体字と簡体字との変換システム及び中国語の繁体字と簡体字との変換方法 | |
US8302045B2 (en) | Electronic device and method for inspecting electrical rules of circuit boards | |
CN111142871A (zh) | 一种前端页面开发系统、方法、设备、介质 | |
US10942934B2 (en) | Non-transitory computer-readable recording medium, encoded data searching method, and encoded data searching apparatus | |
WO2015075920A1 (ja) | 入力支援装置、入力支援方法及び記録媒体 | |
KR101224128B1 (ko) | 회의록 문서 생성 및 검색 시스템 | |
WO2014170965A1 (ja) | 文書処理方法、文書処理装置および文書処理プログラム | |
JP2009199164A (ja) | 文書管理装置、文書管理方法及び記録媒体 | |
US9990420B2 (en) | Method of searching and generating a relevant search string | |
JP2014146324A (ja) | 多国言語で表示されたウェブページ間で切り換えることができるシステム及びその切り換え方法 | |
US20230409620A1 (en) | Non-transitory computer-readable recording medium storing information processing program, information processing method, information processing device, and information processing system | |
JP2009301511A (ja) | 索引情報作成装置、索引情報作成方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20141017 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20150323 |