JP2014120178A - 中国語の繁体字と簡体字との変換システム及び中国語の繁体字と簡体字との変換方法 - Google Patents

中国語の繁体字と簡体字との変換システム及び中国語の繁体字と簡体字との変換方法 Download PDF

Info

Publication number
JP2014120178A
JP2014120178A JP2013259986A JP2013259986A JP2014120178A JP 2014120178 A JP2014120178 A JP 2014120178A JP 2013259986 A JP2013259986 A JP 2013259986A JP 2013259986 A JP2013259986 A JP 2013259986A JP 2014120178 A JP2014120178 A JP 2014120178A
Authority
JP
Japan
Prior art keywords
word
position number
characters
simplified
chinese characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2013259986A
Other languages
English (en)
Inventor
Chung-Il Yi
忠一 李
De Yi Xie
徳意 謝
Hai-Yun Chen
海雲 陳
zhi-qiang Yi
志強 易
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hongfujin Precision Industry Shenzhen Co Ltd
Hon Hai Precision Industry Co Ltd
Original Assignee
Hongfujin Precision Industry Shenzhen Co Ltd
Hon Hai Precision Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hongfujin Precision Industry Shenzhen Co Ltd, Hon Hai Precision Industry Co Ltd filed Critical Hongfujin Precision Industry Shenzhen Co Ltd
Publication of JP2014120178A publication Critical patent/JP2014120178A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/53Processing of non-Latin text

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Abstract

【課題】本発明は、自動的に、素早く、且つ正確に簡体字を繁体字に、或いは繁体字を簡体字に変換できる中国語の繁体字と簡体字との変換システム及び中国語の繁体字と簡体字との変換方法を提供することを目的とする。
【解決手段】本発明の中国語の繁体字と簡体字の変換システムは、単語表において、長い単語から短い単語の順で1つの単語を取得する取得モジュールと、文書における単語の位置番号を検索する検索モジュールと、取得された前記単語の位置番号が、該単語より長さが長い別の単語の位置番号と重なるかどうかを判断する判断モジュールと、単語が獲得した位置番号において、重なっている番号を削除する削除モジュールと、該単語の重なっている位置番号を削除した後の位置番号を単語表に保存する保存モジュールと、位置番号が保存された単語表によって、文書を変換する変換モジュールと、を備える。
【選択図】図3

Description

本発明は、中国語の文書の変換システム及び変換方法に関し、特に中国語の繁体字と簡体字との変換システム及び繁体字と簡体字との変換方法に関するものである。
中国語には、繁体字と簡体字があり、大部分の繁体字と簡体字の単語の書き方、意味は同じであるが、書き方、意味が全く違う単語もある。例えば、書き方において、特許文献を記載する際に使用する漢字において、パソコン等の電子装置を使用して、簡体字
Figure 2014120178
の簡体字を繁体字に変換した場合
Figure 2014120178
であり、簡体字「屏蔽」を繁体字に変換した場合「遮罩」である。意味においては、単語の意味を考えずに、文字を簡体字から繁体字に変換すると、意味が全く異なってしまう場合があるため、文書全体も全く違う意味になってしまう。このような場合、特に正式な文書或いは専門文書において、文書の繁体字或いは簡体字を一つ一つ調査しなければならならず、変換の正確性が低いため実に不便である。
以上の問題点に鑑みて、本発明は、自動的に文書の簡体字と繁体字とを変換して、素早く、且つ正確に簡体字を繁体字に、或いは繁体字を簡体字に変換できる中国語の繁体字と簡体字との変換システム及び中国語の繁体字と簡体字との変換方法を提供することを目的とする。
上記の課題を解決するために、本発明の中国語の繁体字と簡体字との変換システムは、単語表において、長い単語から短い単語の順で1つの単語を取得する取得モジュールと、文書における単語の位置番号を検索する検索モジュールと、取得された前記単語の位置番号が、該単語より長さが長い別の単語の位置番号と重なっているかどうかを判断する判断モジュールと、単語が獲得した位置番号において、重なっている番号を削除する削除モジュールと、該単語の重なっている位置番号を削除した後の位置番号を単語表に保存する保存モジュールと、位置番号が保存された単語表によって、文書を変換する変換モジュールと、を備える。
上記の課題を解決するために、本発明の中国語の繁体字と簡体字との変換方法は、単語表において、長い単語から短い単語の順で1つの単語を取得するステップと、文書において単語の位置番号を検索するステップと、取得された前記単語の位置番号が、該単語より長さが長い別の単語の位置番号と重なっているかどうかを判断するステップと、単語が獲得した位置番号において、重なっている番号を削除するステップと、該単語の重なっている位置番号を削除した後の位置番号を単語表に保存するステップと、全ての単語が取得された際、位置番号が保存された単語表によって、文書を変換するステップと、を備える。
本発明の中国語の繁体字と簡体字との変換システム及び中国語の繁体字と簡体字との変換方法は、自動的に文書の簡体字と繁体字とを変換して、素早く、且つ正確に簡体字を繁体字に、或いは繁体字を簡体字に変換できるので、文書の繁体字或いは簡体字を一つ一つ調査する必要がなく、便利である。
本発明に係る中国語の繁体字と簡体字との変換システムを応用する環境を示す図である。 図1に示した中国語の繁体字と簡体字との変換システムの機能モジュールを示す図である。 本発明に係る中国語の繁体字と簡体字との変換方法の流れ図である。 図3に示した中国語の繁体字と簡体字との変換方法の単語表を示す図である。 図3に示した中国語の繁体字と簡体字との変換方法の位置番号が保存された単語表を示す図である。
以下、図面に基づいて、本発明に係る中国語の繁体字と簡体字との変換システム及び繁体字と簡体字との変換方法について詳細に説明する。本発明の中国語の繁体字と簡体字との変換システム20は、パソコン2内で実行される。パソコン2は、データベース5と接続される。パソコン2は、ディスプレイ1、キーボード3、及びマウス4と接続されて、パソコンを具体的に操作する際、入力/出力装置となる。
データベース5は、パソコン2に設置される或いは外部に設置されても良い。データベース5には、変換するための文書及び単語表600が保存されている(図4を参照)。単語表600は、中国語の簡体字と繁体字との間に互いに変換するための対応する単語を備える。例えば、図4に示したように、中国語の簡体字
Figure 2014120178
に対応する繁体字は
Figure 2014120178
であり、簡体字
Figure 2014120178
に対応する繁体字は
Figure 2014120178
であり、簡体字「数」に対応する繁体字は
Figure 2014120178
であり、簡体字「数据」に対応する繁体字は「資料」である。単語表600は、変換を必要とする文書中の全ての中国語の文字(簡体字及び繁体字)を備え、単語表600によって、文書の簡体字を繁体字に変換する或いは繁体字を簡体字に変換する。本実施形態において、パソコン2は、文書の簡体字を繁体字に変換する。文書の様式は、WORD、EXCEL、PDF、XML、HTML等である。
図2に示したように、本発明のパソコン2は、更にデータ線、信号線と接続されたメモリ270及びプロセッサ280を備える。中国語の繁体字と簡体字との変換システム20は、取得モジュール210、検索モジュール220、判断モジュール230、削除モジュール240、保存モジュール250、変換モジュール260を備える。取得モジュール210、検索モジュール220、判断モジュール230、削除モジュール240、保存モジュール250、変換モジュール260は、それぞれプログラムコード化された後、メモリ270に保存され、中国語の繁体字と簡体字との変換システム20にそれぞれ対応する機能を提供する。
取得モジュール210は、単語表600中、長い単語から短い単語の順で1つの単語を取得する。取得モジュール210は、先ず、単語表600の中から、最も長い単語を取得する。例えば、図4に示したように、4つの単語において、単語
Figure 2014120178
の長さが最も長いので、取得モジュール210は、先ず、単語
Figure 2014120178
を取得し、次に単語「資料」を取得する。取得モジュール210は長さが同じ単語については、ランダムに取得する。また、ユーザは、予め各単語に優先番号を付けることができ、取得モジュール210はこの優先番号に基づいて単語を取得する。例えば、単語
Figure 2014120178
の優先番号はAであり、単語「数据」の優先番号はBであり、漢字
Figure 2014120178
の優先番号はCであり、漢字「数」の優先番号はDであり、優先順が最も高い順からA、B、C、D、とする。取得モジュール210は、先ず、優先番号Aの単語
Figure 2014120178
を取得し、次に優先番号Bの単語「数据」を取得し、次に優先番号Cの漢字
Figure 2014120178
を取得し、最後に優先番号Dの漢字「数」を取得する。本実施形態において、取得モジュール210は各単語を一度しか取得しない。具体的には、各単語には、1つの状態信号が備えられ、ある1つの単語が取得モジュール210に取得されると、この単語の状態信号が変更され、取得モジュール210は単語の状態信号によって、単語が取得されたかどうかを判断する。例えば、漢字
Figure 2014120178
が取得される前の状態信号が01であり、漢字
Figure 2014120178
が取得された後、状態信号は00に変更され、取得モジュール210が漢字
Figure 2014120178
の状態信号00を読み取った際、漢字
Figure 2014120178
は既に読み取られていると判断し、漢字
Figure 2014120178
を取得しない。
検索モジュール220は、文書における単語の位置番号を検索する。具体的には、各様式の文書に記載された文字全てに番号がつけられており、この番号の順に並べられている。文書の各文字には、それぞれ1つずつ対応する位置番号がつけられている。この位置番号は数字であり、小さい数字から大きい数字の順に番号がつけられており、位置番号によって文書中における文字の具体的な位置を検索することができる。一般文書において、位置番号を検索する関数が提供されることによって、ユーザが書いた文字の位置番号を検索することができる。例えば、WORD文書中で、位置番号を検索する際の関数は、mAppNO.Index()であり、検索モジュール220は、該関数を利用して、文書における各単語の位置番号を検索する。単語は、複数の文字が組み合わさって形成され、文書中において、各文字に一つ一つ対応する位置番号がある。従って、各単語は、1つ或いは複数の位置番号を備える。例えば、単語
Figure 2014120178
は、4つの文字を備える。これにより、単語
Figure 2014120178
は4つの位置番号を備える。各単語の文字の数は決まっているので、単語中の1つの位置番号がわかれば、他の文字の位置番号も計算することができる。従って、ユーザは、単語中の1つの位置番号を該単語の位置番号と設定する。これによりメモリ270の記憶容量を減らすことができ、且つ計算効率を向上させることができる。本実施形態において、選択された単語の第一文字の番号を該単語の番号と設定する。例えば、単語
Figure 2014120178
の4つの文字の位置番号がそれぞれ「67」、「68」、「69」、「70」である場合、位置番号「67」を選択して、該単語の位置番号と設定する。文書中において、単語が対応する位置番号を有さない場合、文書において該単語は記載されていないことを意味する。単語が文書中に、1回或いは複数回記載された際、単語は、1つ或いは複数の位置番号を備える。図5に示したように、単語表600中において、各単語は複数の位置番号を備え、各単語の位置番号は、単語の第一文字に基づく。
判断モジュール230は、取得された前記単語の位置番号が、この取得された単語より長さが長い別の単語の位置番号と重なるかどうかを判断する。取得された単語の位置番号が、該取得された単語より長さが長い別の単語の位置番号と重なった場合、取得された単語の位置番号と、長さが長い別の単語の位置番号には、同じ位置番号が存在することを意味する。具体的には、単語
Figure 2014120178
が文書中に3回記載されており、位置番号がそれぞれ「67」、「75」、「86」であり、並びに単語
Figure 2014120178
は、その文書中で長さが最も長いので、判断モジュール230は、該単語の位置番号は、該単語より長さが長い別の単語の位置番号と重ならないと判断する。漢字
Figure 2014120178
の場合、文書中に7回記載されており、その位置番号はそれぞれ、「1」、「5」、「22」、「55」、「67」、「75」、「86」であり、漢字
Figure 2014120178
より長さが長い別の単語は、単語
Figure 2014120178
、単語「数据」であり、単語
Figure 2014120178
の位置番号は、漢字
Figure 2014120178
の位置番号と重なり、その重なった位置番号は「67」、「75」、「86」であり、単語「数据」の位置番号と漢字
Figure 2014120178
の位置番号は重ならない。各単語は、いずれか1つの文字の位置番号を該単語の位置番号に設定するので、取得した単語の位置番号と、該単語より長さが長い別の単語の位置番号が重なるかどうかを判断する際、各単語の位置番号のみを比べるのではなく、各単語の長さも考慮しなければならない。具体的には、単語
Figure 2014120178
の位置番号は3つであり、それぞれ「67」、「75」、「86」であり、単語は4つの文字を備える。該単語の実際の位置番号は、「67」、「68」、「69」、「70」、「75」、「76」、「77」、「78」、「86」、「87」、「88」、「89」であり、単語
Figure 2014120178
より長さが短い単語の位置番号を上述の位置番号と比べて、単語
Figure 2014120178
の位置番号と重なるかどうかを判断する。
削除モジュール240は、単語が獲得した全ての位置番号において、重なった番号を削除する。具体的には、漢字
Figure 2014120178
は文書中に7回記載され、位置番号はそれぞれ「1」、「5」、「22」、「55」、「67」、「75」、「86」である。この中で、重なった位置番号は、「67」、「75」、「86」であり、削除モジュール240はこれら重なった位置番号を削除するので、漢字
Figure 2014120178
の位置番号は「1」、「5」、「22」、「55」である。
保存モジュール250は、前記単語の重なった位置番号を削除した後の位置番号を単語表600に保存する。具体的には、漢字
Figure 2014120178
の位置番号は「1」、「5」、「22」、「55」であり、該4つの位置番号が単語表600に保存される(図5を参照)。図5に示したように、単語表600の単語間において位置番号は重ならない。
判断モジュール230は、全ての単語が取得されたかどうかを判断する。つまり、各単語の状態信号が変更されると、単語は取得されたことを意味する。
変換モジュール260は、位置番号が保存された単語表600によって、文書を変換する。具体的には、変換モジュール260は、文書中における各単語の位置番号を検索し、文書中の単語を単語表600から該単語と対応する変換単語に変換して、文書の簡単字を対応する繁体字に変換する。漢字
Figure 2014120178
を例に挙げて説明すると、変換モジュール260は、位置番号が保存された単語表600から単語
Figure 2014120178
の4つの位置番号、つまり、簡体字の漢字
Figure 2014120178
に対応する繁体字の漢字
Figure 2014120178
を探し出し、文書の4つ位置番号にある漢字
Figure 2014120178
を漢字
Figure 2014120178
に変換する。
図3に示したように、繁体字と簡体字との変換方法は、以下のステップ(S10〜S70)を備える。ステップS10において、取得モジュール210は、単語表600中、長い単語から短い単語の順で1つの単語を取得する。取得モジュール210は、先ず、単語表600から、最も長い単語を取得する。例えば、図4に示したように、4つの単語において、単語
Figure 2014120178
の長さが最も長いので、取得モジュール210は、先ず、単語
Figure 2014120178
を取得し、次に単語
Figure 2014120178
を取得し、取得モジュール210は、長さが同じ単語については、ランダムに取得する。また、ユーザは、予め各単語に優先番号を付けることができる。この際、取得モジュール210はこの優先番号に基づいて単語を取得する。例えば、単語
Figure 2014120178
の優先番号はAであり、単語「数据」の優先番号はBであり、漢字
Figure 2014120178
の優先番号はCであり、漢字「数」の優先番号はDであり、優先順が最も高い順からA、B、C、D、とする。取得モジュール210は、先ず、優先番号Aの単語
Figure 2014120178
を取得し、次に優先番号Bの単語「数据」を取得し、次に優先番号Cの漢字
Figure 2014120178
を取得し、最後に優先番号Dの漢字「数」を取得する。本実施形態において、取得モジュール210は各単語を一度しか取得しない。具体的には、各単語には、1つの状態信号を有し、ある1つの単語が取得モジュール210に取得された際、その単語の状態信号は変更され、取得モジュール210は単語の状態信号によって、その単語が取得されたかどうかを判断する。例えば、漢字
Figure 2014120178
が取得される前の状態信号が01である場合、漢字
Figure 2014120178
が取得された後、状態信号は00に変更される。取得モジュール210が漢字
Figure 2014120178
の状態信号00を読み取ると、漢字
Figure 2014120178
は既に読み取られたと判断し、漢字
Figure 2014120178
は取得しない。
ステップS20において、検索モジュール220は、各様式の文書に記載された文字全てに番号がつけられており、この番号の順に並べられている。文書の各文字には、それぞれ1つずつ対応する位置番号がつけられている。この位置番号は数字であり、小さい数字から大きい数字の順に番号がつけられており、位置番号によって文書中における文字の具体的な位置を検索することができる。一般文書において、位置番号を検索する関数が提供されることによって、ユーザが書いた文字の位置番号を検索することができる。例えば、WORD文書中で、位置番号を検索する際の関数は、mAppNO.Index()であり、検索モジュール220は、該関数を利用して、文書における各単語の位置番号を検索する。単語は、複数の文字が組み合わさって形成され、文書中において、各文字に一つ一つ対応する位置番号がある。従って、各単語は、1つ或いは複数の位置番号を備える。例えば、単語
Figure 2014120178
は、4つの文字を備える。これにより、単語
Figure 2014120178
は4つの位置番号を備える。各単語の文字の数は決まっているので、単語中の1つの位置番号がわかれば、他の文字の位置番号も計算することができる。従って、ユーザは、単語中の1つの位置番号を該単語の位置番号と設定する。これによりメモリの記憶容量を減らすことができ、且つ計算の効率を向上することができる。本実施形態において、選択された単語の第一文字の番号を該単語の番号と設定する。例えば、単語
Figure 2014120178
の4つの文字の位置番号がそれぞれ「67」、「68」、「69」、「70」である場合、位置番号「67」を選択して、該単語の位置番号と設定する。文書中における単語が対応する位置番号を有さない場合、文書にこの単語は記載されていないことを意味する。単語が文書中において、1回或いは複数回記載された際、この単語は、1つ或いは複数の位置番号を備える。図5に示したように、単語表600中において、各単語は複数の位置番号を備え、各単語の位置番号は、単語の第一文字が文書における位置番号である。
ステップS30において、判断モジュール230は、取得された前記単語の位置番号が、この取得された単語より長さが長い別の単語の位置番号と重なるかどうかを判断する。取得された単語の位置番号が、該取得された単語より長さが長い別の単語の位置番号と重なった場合、取得された単語の位置番号と、長さが長い別の単語の位置番号には、同じ位置番号が存在することを意味する。具体的には、単語
Figure 2014120178
が文書中に3回記載されており、位置番号はそれぞれ「67」、「75」、「86」であり、単語
Figure 2014120178
は文書中で長さが最も長いので、判断モジュール230は、該単語の位置番号は、該単語より長さが長い別の単語の位置番号と重ならないと判断する。漢字
Figure 2014120178
の場合、文書中に7回記載されており、その位置番号はそれぞれ、「1」、「5」、「22」、「55」、「67」、「75」、「86」であり、漢字
Figure 2014120178
より長さが長い別の単語は、単語
Figure 2014120178
、単語「数据」であり、単語
Figure 2014120178
の位置番号は、漢字
Figure 2014120178
の位置番号と重なり、その重なった位置番号は「67」、「75」、「86」である。この場合、ステップS40に進む。
ステップS40において、削除モジュール240は、単語が獲得した位置番号中において重なっている番号を削除する。具体的には、漢字
Figure 2014120178
は文書中において7回記載されており、位置番号はそれぞれ「1」、「5」、「22」、「55」、「67」、「75」、「86」である。この中で、重なっている位置番号は、「67」、「75」、「86」である。この際、削除モジュール240は重なった位置番号を削除するので、漢字
Figure 2014120178
の位置番号は「1」、「5」、「22」、「55」である。
ステップS50において、保存モジュール250は、前記単語の重なっている位置番号を削除した後の位置番号を単語表600に保存する。具体的には、漢字
Figure 2014120178
の位置番号は「1」、「5」、「22」、「55」であり、該4つの位置番号が単語表600に保存される。図5に示しているように、単語表600の単語間において、位置番号は重なっていない。
ステップS60において、判断モジュール230は、全ての単語が取得されたかどうかを判断する。単語が取得されたと判断された場合、ステップS70に進む、単語が取得されていないと判断された場合、ステップS10に戻る。
ステップS70において、変換モジュール260は、位置番号が保存された単語表600によって、文書を変換する。具体的には、変換モジュール260は、文書中における各単語の位置番号を検索し、文書中の該単語を単語表600からこの単語と対応する変換単語に変換して、文書の簡単字を対応する繁体字に変換する。漢字
Figure 2014120178
を例に挙げて説明すると、変換モジュール260は、位置番号が保存された単語表600から漢字
Figure 2014120178
の4つの位置番号、つまり、簡体字の漢字
Figure 2014120178
に対応する繁体字の漢字
Figure 2014120178
を探し出し、文書の4つ位置番号にある漢字
Figure 2014120178
を漢字
Figure 2014120178
に変換する。
1 ディスプレイ
2 パソコン
3 キーボード
4 マウス
5 データベース
20 中国語の繁体字と簡体字との変換システム
210 取得モジュール
220 検索モジュール
230 判断モジュール
240 削除モジュール
250 保存モジュール
260 変換モジュール
270 メモリ
280 プロセッサ
600 単語表


Claims (10)

  1. 中国語の繁体字と簡体字との変換システムにおいて、
    単語表において、長い単語から短い単語の順で1つの単語を取得する取得モジュールと、
    文書における単語の位置番号を検索する検索モジュールと、
    取得された該単語の位置番号が、該単語より長さが長い別の単語の位置番号と重なるかどうかを判断する判断モジュールと、単語が獲得した位置番号において重なっている番号を削除する削除モジュールと、
    前記単語の重なった位置番号を削除した後の位置番号を単語表に保存する保存モジュールと、
    位置番号が保存された単語表によって、文書を変換する変換モジュールと、
    を備えることを特徴とする中国語の繁体字と簡体字との変換システム。
  2. 前記単語表は、中国語の簡体字と繁体字との間に互いに変換するための対応する単語を備えることを特徴とする請求項1に記載の中国語の繁体字と簡体字との変換システム。
  3. 前記位置番号はであり、小さい数字から大きい数字の順に番号がつけられており、位置番号によって文書中における文字の具体的な位置を検索することを特徴とする請求項1に記載の中国語の繁体字と簡体字との変換システム。
  4. 前記単語は、いずれか1つの文字の位置番号を該単語の位置番号に設定することを特徴とする請求項1から3のいずれか1項に記載の中国語の繁体字と簡体字との変換システム。
  5. 取得された単語の位置番号が、該取得された単語より長さが長い別の単語の位置番号と重なった場合、取得された単語の位置番号と、長さが長い別の単語の位置番号には、同じ位置番号が存在することを意味することを特徴とする請求項1から3のいずれか1項に記載の中国語の繁体字と簡体字との変換システム。
  6. 中国語の繁体字と簡体字との変換方法において、
    単語表において、長い単語から短い単語の順で1つの単語を取得するステップと、
    文書において単語の位置番号を検索するステップと、
    取得された前記単語の位置番号が、該単語より長さが長い別の単語の位置番号と重なるかどうかを判断するステップと、
    単語が獲得した位置番号において重なっている番号を削除するステップと、
    該単語の重なっている位置番号を削除した後の位置番号を単語表に保存するステップと、
    全ての単語が取得された際、位置番号が保存された単語表によって、文書を変換するステップと、
    を備えることを特徴とする中国語の繁体字と簡体字との変換方法。
  7. 前記単語表は、中国語の簡体字と繁体字との間に互いに変換するための対応する単語を備えることを特徴とする請求項6に記載の中国語の繁体字と簡体字との変換方法。
  8. 前記位置番号は数字によって、小さい数字から大きい数字の順に番号がつけられ、位置番号によって文書中における文字の具体的な位置を検索することを特徴とする請求項6に記載の中国語の繁体字と簡体字との変換方法。
  9. 前記単語は、いずれか1つの文字の位置番号を該単語の位置番号に設定することを特徴とする請求項6から8のいずれか1項に記載の中国語の繁体字と簡体字との変換方法。
  10. 取出された該単語の位置番号が、該単語より長さが長い別の単語の位置番号と重なり、取得した単語の位置番号と、該単語より長さが長い別の単語の位置番号とには、同じ位置番号が存在することを特徴とする請求項6から8のいずれか1項に記載の中国語の繁体字と簡体字との変換方法。
JP2013259986A 2012-12-17 2013-12-17 中国語の繁体字と簡体字との変換システム及び中国語の繁体字と簡体字との変換方法 Pending JP2014120178A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201210548121.0 2012-12-17
CN201210548121.0A CN103870442A (zh) 2012-12-17 2012-12-17 中文简繁体转换系统及方法

Publications (1)

Publication Number Publication Date
JP2014120178A true JP2014120178A (ja) 2014-06-30

Family

ID=50908986

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013259986A Pending JP2014120178A (ja) 2012-12-17 2013-12-17 中国語の繁体字と簡体字との変換システム及び中国語の繁体字と簡体字との変換方法

Country Status (4)

Country Link
US (1) US9208148B2 (ja)
JP (1) JP2014120178A (ja)
CN (1) CN103870442A (ja)
TW (1) TW201430592A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108108337A (zh) * 2016-11-25 2018-06-01 北大方正集团有限公司 简繁互转方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006252164A (ja) * 2005-03-10 2006-09-21 Fuji Xerox Co Ltd 中国語文書処理装置
JP2008052720A (ja) * 2006-08-21 2008-03-06 Fuji Xerox Co Ltd 簡体字と繁体字とを相互変換する方法及びその変換装置

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5268840A (en) * 1992-04-30 1993-12-07 Industrial Technology Research Institute Method and system for morphologizing text
JPH08263478A (ja) * 1995-03-24 1996-10-11 Matsushita Electric Ind Co Ltd 中国語簡繁体字文書変換装置
JP3566111B2 (ja) * 1998-11-30 2004-09-15 松下電器産業株式会社 記号辞書作成方法及び記号辞書検索方法
CN1143232C (zh) * 1998-11-30 2004-03-24 皇家菲利浦电子有限公司 正文的自动分割
CN1192302C (zh) * 1999-09-22 2005-03-09 微软公司 简繁体汉字输入系统及其方法
CA2362416C (en) * 2000-01-05 2009-08-04 Mitsubishi Denki Kabushiki Kaisha Keyword extracting device
CN1271546C (zh) * 2000-10-13 2006-08-23 财团法人资讯工业策进会 中文繁体字与简体字的即时互换方法
CN1369833A (zh) * 2001-02-16 2002-09-18 意蓝科技股份有限公司 词汇式繁体中文与简体中文的转换系统及转换方法
JP2008287406A (ja) * 2007-05-16 2008-11-27 Sony Corp 情報処理装置および情報処理方法、プログラム、並びに、記録媒体
CN101303692B (zh) * 2008-06-19 2012-08-29 徐文和 一种供机器语言翻译的通用数码语义库
US8326809B2 (en) * 2008-10-27 2012-12-04 Sas Institute Inc. Systems and methods for defining and processing text segmentation rules
US8447588B2 (en) * 2008-12-18 2013-05-21 Palo Alto Research Center Incorporated Region-matching transducers for natural language processing
US9104244B2 (en) * 2009-06-05 2015-08-11 Yahoo! Inc. All-in-one Chinese character input method
TWM423854U (en) * 2011-10-20 2012-03-01 Ipxnase Technology Ltd Document analyzing apparatus

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006252164A (ja) * 2005-03-10 2006-09-21 Fuji Xerox Co Ltd 中国語文書処理装置
JP2008052720A (ja) * 2006-08-21 2008-03-06 Fuji Xerox Co Ltd 簡体字と繁体字とを相互変換する方法及びその変換装置

Also Published As

Publication number Publication date
CN103870442A (zh) 2014-06-18
US9208148B2 (en) 2015-12-08
TW201430592A (zh) 2014-08-01
US20140172410A1 (en) 2014-06-19

Similar Documents

Publication Publication Date Title
US10810356B2 (en) Visual searching and navigation
JP6381002B2 (ja) 検索推奨方法及び装置
CN107622080B (zh) 一种数据处理方法及设备
US10579616B2 (en) Data search system, data search method, and program product
CN106648569B (zh) 目标序列化实现方法和装置
CN103970751A (zh) 多国语言网页转换系统及方法
US20190171773A1 (en) Multi-index method and apparatus, cloud system and computer-readable storage medium
JP2005107597A (ja) 類似文検索装置、類似文検索方法、およびプログラム
CN108846069B (zh) 一种基于标记语言的文档执行方法及装置
US20140067853A1 (en) Data search method, information system, and recording medium storing data search program
KR20160100322A (ko) 시멘틱상으로 의미있는 텍스트 선택들의 식별
CN110795920B (zh) 一种文档生成方法及设备
US20140280050A1 (en) Term searching based on context
JP2014120178A (ja) 中国語の繁体字と簡体字との変換システム及び中国語の繁体字と簡体字との変換方法
US8302045B2 (en) Electronic device and method for inspecting electrical rules of circuit boards
CN111142871A (zh) 一种前端页面开发系统、方法、设备、介质
US10942934B2 (en) Non-transitory computer-readable recording medium, encoded data searching method, and encoded data searching apparatus
WO2015075920A1 (ja) 入力支援装置、入力支援方法及び記録媒体
KR101224128B1 (ko) 회의록 문서 생성 및 검색 시스템
WO2014170965A1 (ja) 文書処理方法、文書処理装置および文書処理プログラム
JP2009199164A (ja) 文書管理装置、文書管理方法及び記録媒体
US9990420B2 (en) Method of searching and generating a relevant search string
JP2014146324A (ja) 多国言語で表示されたウェブページ間で切り換えることができるシステム及びその切り換え方法
US20230409620A1 (en) Non-transitory computer-readable recording medium storing information processing program, information processing method, information processing device, and information processing system
JP2009301511A (ja) 索引情報作成装置、索引情報作成方法及びプログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20141017

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20150323