JP2008052720A - 簡体字と繁体字とを相互変換する方法及びその変換装置 - Google Patents
簡体字と繁体字とを相互変換する方法及びその変換装置 Download PDFInfo
- Publication number
- JP2008052720A JP2008052720A JP2007187850A JP2007187850A JP2008052720A JP 2008052720 A JP2008052720 A JP 2008052720A JP 2007187850 A JP2007187850 A JP 2007187850A JP 2007187850 A JP2007187850 A JP 2007187850A JP 2008052720 A JP2008052720 A JP 2008052720A
- Authority
- JP
- Japan
- Prior art keywords
- simplified
- traditional
- word
- term
- terms
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】変換される簡体/繁体漢字の文字列を単語/用語に分割する。各単語/用語を、漢字表記が繁体/簡体漢字の単語/用語と同じ、または同じではないが所定の対応関係を有する、第1種類の単語/用語と、漢字表記が繁体/簡体漢字の単語/用語と異なり、かつ所定の対応関係を有しない、第2種類の単語/用語に、それぞれ鑑別・定義する。マッピングテーブルを用いて、第1種類の単語/用語を入力された簡体/繁体漢字の単語/用語と唯一対応する繁体/簡体漢字の単語/用語に直接マッピングする。統計分類法により、第2種類の単語/用語を入力された簡体/繁体漢字の単語/用語と適正に対応する繁体/簡体漢字の単語/用語に変換する。変換された繁体/簡体漢字の単語/用語を結合して出力する。
【選択図】図1
Description
入力された簡体/繁体漢字の文字列をいくつかの単語/用語に分割する単語/用語分割部と、
前記入力された簡体/繁体漢字の文字列における各単語/用語を鑑別・定義し、そのうちの、漢字表現が簡体/繁体漢字の単語/用語と同じ、または同じではないが所定の対応関係を有する簡体/繁体漢字の単語/用語を第1種類の単語/用語に定義すると共に、漢字表記が簡体/繁体漢字の単語/用語と異なり、かつ所定の対応関係を有しない簡体/繁体漢字の単語/用語を第2種類の単語/用語に定義する鑑別・定義部と、
マッピングテーブルを用いて、前記第1種類の単語/用語を入力された簡体/繁体漢字の単語/用語と唯一対応する繁体/簡体漢字の単語/用語に直接マッピングするマッピング変換部と、
統計分類法により、第2種類の単語/用語を入力された簡体/繁体漢字の単語/用語と適正に対応する繁体/簡体漢字の単語/用語に変換する統計変換部と、
マッピングテーブルを用いて前記第1種類の単語/用語を直接マッピングして得られた、入力された簡体/繁体漢字の単語/用語と唯一対応する繁体/簡体漢字の単語/用語と、統計分類法により第2種類の単語/用語を変換して得られた、入力された簡体/繁体漢字の単語/用語と適正に対応する繁体/簡体漢字の単語/用語とを結合することで、入力された簡体/繁体漢字の文字列に対応する繁体/簡体漢字の文字列を形成して出力する結合出力部と、を含む。
入力部が、変換対象である簡体/繁体漢字の文字列を入力するステップと、
単語/用語分割部が、入力された簡体/繁体漢字の文字列をいくつかの単語/用語に分割するステップと、
鑑別・定義部が、前記入力された簡体/繁体漢字の文字列における各単語/用語を鑑別・定義し、そのうちの、漢字表記が簡体/繁体漢字の単語/用語と同じ、または同じではないが所定の対応関係を有する簡体/繁体漢字の単語/用語を第1種類の単語/用語に定義すると共に、漢字表記が簡体/繁体漢字の単語/用語と異なり、かつ所定の対応関係を有しない簡体/繁体漢字の単語/用語を第2種類の単語/用語に定義するステップと、
マッピング変換部が、マッピングテーブルを用いて、前記第1種類の単語/用語を入力された簡体/繁体漢字の単語/用語と唯一対応する繁体/簡体漢字の単語/用語に直接マッピングするステップと、
統計変換部が、統計分類法により、第2種類の単語/用語を入力された簡体/繁体漢字の単語/用語と適正に対応する繁体/簡体漢字の単語/用語に変換するステップと、
結合出力部が、マッピングテーブルを用いて前記第1種類の単語/用語を直接マッピングして得られた、入力された簡体/繁体漢字の単語/用語と唯一対応する繁体/簡体漢字の単語/用語と、統計分類法により第2種類の単語/用語を変換して得られた、入力された簡体/繁体漢字の単語/用語と適正に対応する繁体/簡体漢字の単語/用語とを結合することで、入力された簡体/繁体漢字の文字列に対応する繁体/簡体漢字の文字列を形成して出力するステップと、を含む。
変換対象である簡体字の文字列を入力する入力部と、
入力された簡体字の文字列をいくつかの単語/用語に分割する単語/用語分割部と、
前記入力された簡体字の文字列における各単語/用語を鑑別・定義し、そのうちの、漢字表記が繁体字の単語/用語と同じ、または同じではないが所定の対応関係を有する簡体字の単語/用語を第1種類の単語/用語に定義すると共に、漢字表記が繁体字の単語/用語と異なり、かつ所定の対応関係を有しない簡体字の単語/用語を第2種類の単語/用語に定義する鑑別・定義部と、
マッピングテーブルを用いて、前記第1種類の単語/用語を入力された簡体字の単語/用語と唯一対応する繁体字の単語/用語に直接マッピングするマッピング変換部と、
統計分類法により、第2種類の単語/用語を入力された簡体字の単語/用語と適正に対応する繁体字の単語/用語に変換する統計変換部と、
マッピングテーブルを用いて前記第1種類の単語/用語を直接マッピングして得られた、入力された簡体字の単語/用語と唯一対応する繁体字の単語/用語と、統計分類法により第2種類の単語/用語を変換して得られた、入力された簡体字の単語/用語と適正に対応する繁体字の単語/用語とを結合することで、入力された簡体字の文字列に対応する繁体字の文字列を形成して出力する結合出力部と、を含む。
入力部が、変換対象である簡体字の文字列を入力するステップと、
単語/用語分割が、入力された簡体字の文字列をいくつかの単語/用語に分割するステップと、
鑑別・定義部が、前記入力された簡体字の文字列における各単語/用語を鑑別・定義し、そのうちの、漢字表記が繁体字の単語/用語と同じ、または同じではないが所定の対応関係を有する簡体字の単語/用語を第1種類の単語/用語に定義すると共に、漢字表記が繁体字の単語/用語と異なり、かつ所定の対応関係を有しない簡体字の単語/用語を第2種類の単語/用語に定義するステップと、
マッピング変換部が、マッピングテーブルを用いて、前記第1種類の単語/用語を入力された簡体字の単語/用語と唯一対応する繁体字の単語/用語に直接マッピングするステップと、
統計変換部が、統計分類法により、第2種類の単語/用語を入力された簡体字の単語/用語と適正に対応する繁体字の単語/用語に変換するステップと、
結合出力部が、マッピングテーブルを用いて前記第1種類の単語/用語を直接マッピングして得られた、入力された簡体字の単語/用語と唯一対応する繁体字の単語/用語と、統計分類法により第2種類の単語/用語を変換して得られた、入力された簡体字の単語/用語と適正に対応する繁体字の単語/用語とを結合することで、入力された簡体字の文字列に対応する繁体字の文字列を形成して出力するステップと、を含む。
変換対象である繁体字の文字列を入力する、
単語/用語分割部は、入力された繁体字の文字列をいくつかの単語/用語に分割する入力部と、
前記入力された繁体字の文字列における各単語/用語を鑑別・定義し、そのうちの、書き方が簡体字の単語/用語と共通、または共通ではないが所定の対応関係を有する繁体字の単語/用語を第1種類の単語/用語に定義すると共に、書き方が簡体字の単語/用語と共通ではなく、かつ所定の対応関係を有しない繁体字の単語/用語を第2種類の単語/用語に定義する鑑別・定義部と、
マッピングテーブルを用いて、前記第1種類の単語/用語を入力された繁体字の単語/用語と唯一対応する簡体字の単語/用語に直接マッピングするマッピング変換部と、
統計分類法により、第2種類の単語/用語を入力された繁体字の単語/用語と適正に対応する簡体字の単語/用語に変換する統計変換部と、
マッピングテーブルを用いて前記第1種類の単語/用語を直接マッピングして得られた、入力された繁体字の単語/用語と唯一対応する簡体字の単語/用語と、統計分類法により第2種類の単語/用語を変換して得られた、入力された繁体字の単語/用語と適正に対応する簡体字の単語/用語とを結合することで、変換される繁体字の文字列に対応する簡体字の文字列を形成して出力する結合出力部と、を含む。
入力部が、変換対象である繁体字の文字列を入力するステップと、
単語/用語分割部が、入力された繁体字の文字列をいくつかの単語/用語に分割するステップと、
鑑別・定義部が、前記入力された繁体字の文字列における各単語/用語を鑑別・定義し、そのうちの、漢字表記が簡体字の単語/用語と同じ、または同じではないが所定の対応関係を有する繁体字の単語/用語を第1種類の単語/用語に定義すると共に、漢字表記が簡体字の単語/用語と異なり、かつ所定の対応関係を有しない繁体字の単語/用語を第2種類の単語/用語に定義するステップと、
マッピング変換部が、マッピングテーブルを用いて、前記第1種類の単語/用語を入力された繁体字の単語/用語と唯一対応する簡体字の単語/用語に直接マッピングするステップと、
統計変換部が、統計分類法により、第2種類の単語/用語を入力された繁体字の単語/用語と適正に対応する簡体字の単語/用語に変換するステップと、
結合出力部が、マッピングテーブルを用いて前記第1種類の単語/用語を直接マッピングして得られた、入力された繁体字の単語/用語と唯一対応する簡体字の単語/用語と、統計分類法により第2種類の単語/用語を変換して得られた、入力された繁体字の単語/用語と適正に対応する簡体字の単語/用語とを結合することで、入力された繁体字の文字列に対応する簡体字の文字列を形成して出力するステップと、を含む。
2)簡体字の子文字列Siをマッピングテーブルにおける全記録の「簡体字の単語/用語」の欄と比較して、簡体字の子文字列Siの接頭語(c1c2…cs、s≦n)はこのマッピングテーブルに存在すれば、この記録の「繁体字の単語/用語」の欄の内容を取り出して、上記簡体c1c2…cs(s≦n)の子文字列の変換結果(簡体のSCコード)として出力する。3)に移る。存在しなければ、この処理を終了する。
3)S=S−c1c2…cs
4)上記の2)に移る。
そのうち、簡体→繁体の一対多の単字マッピングテーブル211は次の表2に例示した構成を有してもよい:
2.記号‘$’:対応する1つの繁体字の情報を表す。記号‘$’の後にある漢字は対応する1つのTC繁体字である。記号‘$’の記録の次続く記録は記号‘$’の後にある繁体字の単語を含む情報である。この記録は複数個であってもよい。
3.記号‘$’によるデータ記録グループは複数個である。
4.記号‘@’:1組の「一対多の単語表データ」の終了を表す。
数式3による簡易ベイズ分類器のアルゴリズムを用いて、簡体字から繁体字への変換処理における一対多の問題を解決する際に、簡体字のコーパスCorpus_SC及びそれに対応する繁体字のコーパスCorpus_TCという2つのコーパスを必要とする。この2つのコーパスは、本発明を実施するコンピュータの所定の記憶エリアの位置に格納されている。具体的に実施する場合には下記の2つの方式が適用される。
1.Corpus_SCにおける全ての簡体字を収集する Vocaculary← Corpus_SCにおける全ての簡体字の集合
2.所要の確率項目P(Tj)とP(Si|Tj)を計算する
Tの各目標値Tjに対して、j∈{1,2,…,k}
nj←Corpus_SCにおいてTjが出現した回数、
nT←Corpus_SCにおいてT1,T2,…,Tkが出現した合計回数、
P(Tj) = nj/nT
Vocaculary中のSiについて、i= {−1,1}
nj←簡体字SがTjに変換された場合、Corpus_SCにおいてSiが出現した回数、
P(Si|Tj) = (ni + m/|Vocaculary| ) / (nj+m)、ここでm−で見積もる、ただしm=1
2)繁体字の子文字列Siをマッピングテーブルにおける全ての記録の「繁体字の単語/用語」の欄と比較して、繁体字の子文字列Siの接頭語(c1c2…cs、s≦n)はこのマッピングテーブルに存在すれば、この記録の「簡体字の単語/用語」の欄の内容を取り出して、上記繁体c1c2…cs(s≦n)の子文字列の変換結果(繁体のSCコード)として出力する。3)に移る。存在しなければ、この処理を終了する。
3)S=S−c1c2…cs
4)上記の2)に移る。
表3には7つの記録が示されており、各記録は4文字からなる。例えば、6行目記録の第1の文字は繁体字の「餘」である。繁体字の「餘」は簡体字にないものであるので、第2の文字の位置に文字はない。第3と第4の文字の位置にはそれぞれ簡体字における繁体字の「餘」に対応する2つの選択可能な簡体字の「余」と
2.記号‘$’:対応する1つの簡体字の情報を表す。記号‘$’の後にある漢字は対応する1つのTC簡体字である。記号‘$’の記録の次に続く記録は記号‘$’の後にある簡体字の単語を含む情報である。この記録は複数個であってもよい。
3.記号‘$’によるデータ記録グループは複数個である。
4.記号‘@’: 1組の「一対多の単語表データ」の終了を表す。
#乾 繁体字の「乾」の「一対多の単語表データ」の開始
$干 繁体字の「乾」は簡体字の「干」に対応している
乾杯 上記のように対応する場合の単語表
$乾 繁体字の「乾」は簡体字の「乾」に対応している
乾坤 上記のように対応する場合の単語表
乾造
乾宅
@ 繁体字の「乾」の「一対多の単語表データ」の終了
第1ステップ:BIG5繁体コード→GBK簡体コード変換部407はBIG5→GBKコード変換テーブル411を用いて、繁体字の「乾」をBIG5コードからGBKコードに変換する。(ISN:B0AE→C7AC)
第2ステップ:GBK繁体コード→ GBK簡体コード変換部408は繁体→簡体の一対多の単字マッピングテーブル413を検索することで、「乾」が一対多の漢字であるとわかる。簡易ベイズ分類法により、単語たる「乾杯」のうちの「乾」が簡体字の「干」に対応することがわかる。(ISN:C7AC→B8C9)
第1ステップ:BIG5繁体コード→GBK簡体コード変換部407はBIG5→GBKコード変換テーブル411を用いて、繁体字の「乾」をBIG5コードからGBKコードに変換する。(ISN:B0AE→C7AC)
第2ステップ:GBK繁体コード→ GBK簡体コード変換部408は繁体→簡体の一対多の単字マッピングテーブル413を検索することで、「乾」が一対多の漢字であるとわかる。簡易ベイズ分類法により、単語たる「乾坤」のうちの「乾」が簡体字の「乾」に対応することがわかる。(ISN:C7AC→ C7AC)
第1ステップ:BIG5繁体コード→GBK簡体コード変換部407はBIG5→GBKコード変換テーブル411を用いて、繁体字の「乾」をBIG5コードからGBKコードに変換する。(ISN:B0AE→C7AC)
第2ステップ:GBK繁体コード→ GBK簡体コード変換部408は繁体→簡体の一対多の漢字マッピングテーブル413を検索することで、「乾」が一対多の漢字であるとわかる。「服」と「了」が「乾」の左右にあるケースがいずれもコーパスから統計で見付けられなかったため、簡易ベイズ分類法を適用することができない。
「乾」がその前の「服」と混合型単語「服乾」を構成すると同時に、その後の「了」と混合型単語「乾了」を構成する。繁体→簡体の一対多の単語マッピングテーブル415を検索した結果、「服乾」と「乾了」が何れも単語表にない。この場合、本発明の変換装置は「乾」をデフォルトの簡体字「干」に変換する。(ISN:C7AC→ B8C9)
第1ステップ:BIG5繁体コード→GBK繁体コード変換部407はBIG5→GBKコード変換テーブル411を用いて、繁体字の「荳」をBIG5コードからGBKコードに変換する。(ISN:D75E→C757)
第2ステップ:GBK繁体コード→ GBK簡体コード変換部408は繁体→簡体の一対多の単字マッピングテーブル413を検索することで、「荳」が一対多の漢字ではないとわかる。そして、異体字マッピングテーブル414を検索することで、「荳」が異体字であり、簡体字の「豆」に対応しているとわかる。(ISN:C757→B6B9)
第1ステップ:BIG5繁体コード→GBK簡体コード変換部407はBIG5→GBKコード変換テーブル411を用いて、繁体字の「國」をBIG5コードからGBKコードに変換する(ISN:B0EA→87F8)。
第2ステップ:GBK繁体コード→ GBK簡体コード変換部408は繁体→簡体の一対多の単字マッピングテーブル413を検索することで、「國」が一対多の漢字ではないとわかる。そして、異体字マッピングテーブル414を検索することで、「國」が異体字でもないとわかる。更に、繁体→簡体_ GBK漢字マッピングテーブル416を検索することで、「國」が簡体字の「国」に対応しているとわかる。(ISN:87F8→B9FA)
GBK繁体コード→ GBK簡体コード変換部408から出力された簡体字と、繁体→簡体の単語/用語変換部406から出力された簡体字とを組合わせてから、変換結果として出力部403から出力する。
繁体の各単語/用語を受け取ると、鑑別・定義部405はそれらを鑑別・定義することで、第1種類の単語/用語、即ち漢字表記が簡体字の単語/用語と同じ、または同じではないが所定の対応関係を有する繁体の単語/用語であるか否かを判断する(ステップS530)。「YES」であれば、この繁体の単語/用語を変換部401における繁体→簡体の単語/用語変換部406に入力し、繁体→簡体の単語/用語変換部406は当該ユーザ用の繁体→簡体の単語/用語マッピングテーブル409とシステム用の繁体→簡体の単語/用語マッピングテーブル410を用いて、この第1種類の繁体字の文字列を対応した簡体字の文字列に変換する(ステップS540)。
Claims (27)
- 簡体字と繁体字との相互変換を行う変換装置であって、当該変換装置は、
変換対象である簡体/繁体漢字の文字列を入力する入力部と、
入力された簡体/繁体漢字の文字列をいくつかの単語/用語に分割する単語/用語分割部と、
当該入力された簡体/繁体漢字の文字列における各単語/用語を鑑別・定義し、そのうちの、漢字表記が繁体/簡体漢字の単語/用語と同じ、または同じではないが所定の対応関係を有する簡体/繁体漢字の単語/用語を第1種類の単語/用語に定義すると共に、漢字表記が繁体/簡体漢字の単語/用語と異なり、かつ所定の対応関係を有しない簡体/繁体漢字の単語/用語を第2種類の単語/用語に定義する鑑別・定義部と、
マッピングテーブルを用いて、当該第1種類の単語/用語を入力された簡体/繁体漢字の単語/用語と唯一対応する繁体/簡体漢字の単語/用語に直接マッピングするマッピング変換部と、
統計分類法により、第2種類の単語/用語を入力された簡体/繁体漢字の単語/用語と適正に対応する繁体/簡体漢字の単語/用語に変換する統計変換部と、
マッピングテーブルを用いて前記第1種類の単語/用語を直接マッピングして得られた、入力された簡体/繁体漢字の単語/用語と唯一対応する繁体/簡体漢字の単語/用語と、統計分類法により第2種類の単語/用語を変換して得られた、入力された簡体/繁体漢字の単語/用語と適正に対応する繁体/簡体漢字の単語/用語とを結合することで、変換される簡体/繁体漢字の文字列に対応する繁体/簡体漢字の文字列を形成して出力する結合出力部と、を含むことを特徴とする上記変換装置。 - 前記単語/用語は一つの漢字又は複数の漢字からなる単語/用語を含む請求項1に記載の変換装置。
- 前記使用されるマッピングテーブルは、ユーザ用の簡体/繁体漢字→繁体/簡体漢字の単語/用語マッピングテーブルと、システム用の簡体/繁体漢字→繁体/簡体漢字の単語/用語マッピングテーブルと、簡体/繁体漢字→繁体/簡体漢字の一対一マッピングテーブルと、簡体/繁体漢字→繁体/簡体漢字の一対多マッピングテーブルとを含む請求項1に記載の変換装置。
- 前記採用される統計方法は簡易ベイズ統計法である請求項1に記載の変換装置。
- 簡体字と繁体字との相互変換を行う変換方法であって、当該変換方法は、
入力部が、変換対象である簡体/繁体漢字の文字列を入力するステップと、
単語/用語分割部が、入力された簡体/繁体漢字の文字列をいくつかの単語/用語に分割するステップと、
鑑別・定義部が、前記入力された簡体/繁体漢字の文字列における各単語/用語を鑑別・定義し、そのうちの、漢字表記が繁体/簡体漢字の単語/用語と同じ、または同じではないが所定の対応関係を有する簡体/繁体漢字の単語/用語を第1種類の単語/用語に定義すると共に、漢字表記が繁体/簡体漢字の単語/用語と異なり、かつ所定の対応関係を有しない簡体/繁体漢字の単語/用語を第2種類の単語/用語に定義するステップと、
マッピング変換部が、マッピングテーブルを用いて、前記第1種類の単語/用語を入力された簡体/繁体漢字の単語/用語と唯一対応する繁体/簡体漢字の単語/用語に直接マッピングするステップと、
統計変換部が、統計分類法により、第2種類の単語/用語を入力された簡体/繁体漢字の単語/用語と適正に対応する繁体/簡体漢字の単語/用語に変換するステップと、
結合出力部が、マッピングテーブルを用いて前記第1種類の単語/用語を直接マッピングして得られた、入力された簡体/繁体漢字の単語/用語と唯一対応する繁体/簡体漢字の単語/用語と、統計分類法により第2種類の単語/用語を変換して得られた、入力された簡体/繁体漢字の単語/用語と適正に対応する繁体/簡体漢字の単語/用語とを結合することで、入力された簡体/繁体漢字の文字列に対応する繁体/簡体漢字の文字列を形成して出力するステップと、を含むことを特徴とする上記変換方法。 - 前記単語/用語は単一の漢字又は複数の漢字からなる単語/用語を含む請求項5に記載の変換方法。
- 前記使用されるマッピングテーブルは、ユーザ用の単語/用語マッピングテーブルと、システム用の単語/用語マッピングテーブルと、簡体/繁体漢字→繁体/簡体漢字の一対一マッピングテーブルと、簡体/繁体漢字→繁体/簡体漢字の一対多マッピングテーブルとを含む請求項5に記載の変換方法。
- 前記採用される統計方法は簡易ベイズ統計法である請求項5に記載の変換方法。
- 簡体字を繁体字に変換する変換装置であって、当該変換装置は、
変換対象である簡体字の文字列を入力する入力部と、
入力された簡体字の文字列をいくつかの単語/用語に分割する単語/用語分割部と、
前記入力された簡体字の文字列における各単語/用語を鑑別・定義し、そのうちの、漢字表記が繁体字の単語/用語と同じ、または同じではないが所定の対応関係を有する簡体字の単語/用語を第1種類の単語/用語に定義すると共に、漢字表記が繁体字の単語/用語と異なり、かつ所定の対応関係を有しない簡体漢字の単語/用語を第2種類の単語/用語に定義する鑑別・定義部と、
マッピングテーブルを用いて、前記第1種類の単語/用語を入力された簡体字の単語/用語と唯一対応する繁体字の単語/用語に直接マッピングするマッピング変換部と、
統計分類法により、第2種類の単語/用語を入力された簡体字の単語/用語と適正に対応する繁体字の単語/用語に変換する統計変換部と、
マッピングテーブルを用いて前記第1種類の単語/用語を直接マッピングして得られた、入力された簡体字の単語/用語と唯一対応する繁体字の単語/用語と、統計分類法により第2種類の単語/用語を変換して得られた、入力された簡体字の単語/用語と適正に対応する繁体字の単語/用語とを結合することで、変換される簡体字の文字列に対応する繁体字の文字列を形成して出力する結合出力部と、を含むことを特徴とする上記変換装置。 - 前記単語/用語は単一の漢字又は複数の漢字からなる単語/用語を含む請求項9に記載の変換装置。
- 前記使用されるマッピングテーブルは、ユーザ用の簡体→繁体の単語/用語マッピングテーブルと、システム用の簡体→繁体の単語/用語マッピングテーブルと、簡体→繁体漢字の一対一マッピングテーブルと、簡体→繁体漢字の一対多マッピングテーブルとを含む請求項9に記載の変換装置。
- 前記採用される統計方法は簡易ベイズ統計法である請求項9に記載の変換装置。
- 簡体字を繁体字に変換する変換方法であって、当該変換方法は、
入力部が、変換対象である簡体字の文字列を入力するステップと、
単語/用語分割部が、入力された簡体字の文字列をいくつかの単語/用語に分割するステップと、
鑑別・定義部が、前記入力された簡体字の文字列における各単語/用語を鑑別・定義し、そのうちの、漢字表記が繁体字の単語/用語と同じ、または同じではないが所定の対応関係を有する簡体字の単語/用語を第1種類の単語/用語に定義すると共に、漢字表記が繁体字の単語/用語と異なり、かつ所定の対応関係を有しない簡体字の単語/用語を第2種類の単語/用語に定義するステップと、
マッピング変換部が、マッピングテーブルを用いて、前記第1種類の単語/用語を入力された簡体字の単語/用語と唯一対応する繁体字の単語/用語に直接マッピングするステップと、
統計変換部が、統計分類法により、第2種類の単語/用語を入力された簡体字の単語/用語と適正に対応する繁体字の単語/用語に変換するステップと、
結合出力部が、マッピングテーブルを用いて前記第1種類の単語/用語を直接マッピングして得られた、入力された簡体字の単語/用語と唯一対応する繁体字の単語/用語と、統計分類法により第2種類の単語/用語を変換して得られた、入力された簡体字の単語/用語と適正に対応する繁体字の単語/用語とを結合することで、入力された簡体字の文字列に対応する繁体字の文字列を形成して出力するステップと、を含むことを特徴とする上記変換方法。 - 前記単語/用語は単一の漢字又は複数の漢字からなる単語/用語を含む請求項13に記載の変換方法。
- 前記使用されたマッピングテーブルは、ユーザ用の簡体→繁体の単語/用語マッピングテーブルと、システム用の簡体→繁体の単語/用語マッピングテーブルと、簡体→繁体漢字の一対一マッピングテーブルと、簡体→繁体漢字の一対多マッピングテーブルとを含む請求項13に記載の変換方法。
- 前記採用された統計方法は簡易ベイズ統計法である請求項13に記載の変換方法。
- 繁体字を簡体字に変換する変換装置であって、当該変換装置は、
変換対象である繁体字の文字列を入力する入力部と、
入力された繁体字の文字列をいくつかの単語/用語に分割する単語/用語分割部と、
前記入力された繁体字の文字列における各単語/用語を鑑別・定義し、そのうちの、漢字表記が簡体字の単語/用語と同じ、または同じではないが所定の対応関係を有する繁体字の単語/用語を第1種類の単語/用語に定義すると共に、書き方が簡体字の単語/用語と異なり、かつ所定の対応関係を有しない繁体字の単語/用語を第2種類の単語/用語に定義する鑑別・定義部と、
マッピングテーブルを用いて、前記第1種類の単語/用語を入力された繁体字の単語/用語と唯一対応する簡体字の単語/用語に直接マッピングするマッピング変換部と、
統計分類法により、第2種類の単語/用語を入力された繁体字の単語/用語と適正に対応する簡体字の単語/用語に変換する統計変換部と、
マッピングテーブルを用いて前記第1種類の単語/用語を直接マッピングして得られた、入力された繁体字の単語/用語と唯一対応する簡体字の単語/用語と、統計分類法により第2種類の単語/用語を変換して得られた、入力された繁体字の単語/用語と適正に対応する簡体字の単語/用語とを結合することで、入力された繁体字の文字列に対応する簡体字の文字列を形成して出力する結合出力部と、を含むことを特徴とする上記変換装置。 - 前記単語/用語は単一の漢字又は複数の漢字からなる単語/用語を含む請求項17に記載の変換装置。
- 前記使用されたマッピングテーブルは、ユーザ用の繁体→簡体の単語/用語マッピングテーブルと、システム用の繁体→簡体の単語/用語マッピングテーブルと、繁体→簡体漢字の一対一マッピングテーブルと、繁体→簡体漢字の一対多マッピングテーブル及び異体字マッピングテーブルとを含む請求項17に記載の変換装置。
- 前記採用された統計方法は簡易ベイズ統計法である請求項17に記載の変換装置。
- 繁体字を簡体字に変換する変換方法であって、当該変換方法は、
入力部が、変換対象である繁体字の文字列を入力するステップと、
単語/用語分割部が、入力された繁体字の文字列をいくつかの単語/用語に分割するステップと、
鑑別・定義部が、前記入力された繁体字の文字列における各単語/用語を鑑別・定義し、そのうちの、漢字表記が簡体字の単語/用語と同じ、または同じではないが所定の対応関係を有する繁体字の単語/用語を第1種類の単語/用語に定義すると共に、漢字表記が簡体字の単語/用語と異なり、かつ所定の対応関係を有しない繁体字の単語/用語を第2種類の単語/用語に定義するステップと、
マッピング変換部が、マッピングテーブルを用いて、前記第1種類の単語/用語を入力された繁体字の単語/用語と唯一対応する簡体字の単語/用語に直接マッピングするステップと、
統計変換部が、統計分類法により、第2種類の単語/用語を入力された繁体字の単語/用語と適正に対応する簡体字の単語/用語に変換するステップと、
結合出力部が、マッピングテーブルを用いて前記第1種類の単語/用語を直接マッピングして得られた、入力された繁体字の単語/用語と唯一対応する簡体字の単語/用語と、統計分類法により第2種類の単語/用語を変換して得られた、入力された繁体字の単語/用語と適正に対応する簡体字の単語/用語とを結合することで、入力された繁体字の文字列に対応する簡体字の文字列を形成して出力するステップと、を含むことを特徴とする上記変換方法。 - 前記単語/用語は単一の漢字又は複数の漢字からなる単語/用語を含む請求項21に記載の変換方法。
- 前記使用されたマッピングテーブルは、ユーザ用の繁体→簡体の単語/用語マッピングテーブルと、システム用の繁体→簡体の単語/用語マッピングテーブルと、繁体→簡体漢字の一対一マッピングテーブルと、繁体→簡体漢字の一対多マッピングテーブル及び異体字マッピングテーブルとを含む請求項21に記載の変換方法。
- 前記採用された統計方法は簡易ベイズ統計法である請求項21に記載の変換方法。
- 簡体字と繁体字との相互変換を行うためのコンピュータプラグラムであって、
コンピュータを、
変換対象である簡体/繁体漢字の文字列を入力する入力部、
入力された簡体/繁体漢字の文字列をいくつかの単語/用語に分割する単語/用語分割部、
当該入力された簡体/繁体漢字の文字列における各単語/用語を鑑別・定義し、そのうちの、漢字表記が繁体/簡体漢字の単語/用語と同じ、または同じではないが所定の対応関係を有する簡体/繁体漢字の単語/用語を第1種類の単語/用語に定義すると共に、漢字表記が繁体/簡体漢字の単語/用語と異なり、かつ所定の対応関係を有しない簡体/繁体漢字の単語/用語を第2種類の単語/用語に定義する鑑別・定義部、
マッピングテーブルを用いて、当該第1種類の単語/用語を入力された簡体/繁体漢字の単語/用語と唯一対応する繁体/簡体漢字の単語/用語に直接マッピングするマッピング変換部、
統計分類法により、第2種類の単語/用語を入力された簡体/繁体漢字の単語/用語と適正に対応する繁体/簡体漢字の単語/用語に変換する統計変換部、
マッピングテーブルを用いて前記第1種類の単語/用語を直接マッピングして得られた、入力された簡体/繁体漢字の単語/用語と唯一対応する繁体/簡体漢字の単語/用語と、統計分類法により第2種類の単語/用語を変換して得られた、入力された簡体/繁体漢字の単語/用語と適正に対応する繁体/簡体漢字の単語/用語とを結合することで、変換される簡体/繁体漢字の文字列に対応する繁体/簡体漢字の文字列を形成して出力する結合出力部、
として機能させることを特徴とする上記コンピュータプログラム。 - 簡体字を繁体字に変換するためのコンピュータプログラムであって、
コンピュータを、
変換対象である簡体字の文字列を入力する入力部、
入力された簡体字の文字列をいくつかの単語/用語に分割する単語/用語分割部、
前記入力された簡体字の文字列における各単語/用語を鑑別・定義し、そのうちの、漢字表記が繁体字の単語/用語と同じ、または同じではないが所定の対応関係を有する簡体字の単語/用語を第1種類の単語/用語に定義すると共に、書き方が繁体字の単語/用語と異なり、かつ所定の対応関係を有しない簡体漢字の単語/用語を第2種類の単語/用語に定義する鑑別・定義部、
マッピングテーブルを用いて、前記第1種類の単語/用語を入力された簡体字の単語/用語と唯一対応する繁体字の単語/用語に直接マッピングするマッピング変換部、
統計分類法により、第2種類の単語/用語を入力された簡体字の単語/用語と適正に対応する繁体字の単語/用語に変換する統計変換部、
マッピングテーブルを用いて前記第1種類の単語/用語を直接マッピングして得られた、入力された簡体字の単語/用語と唯一対応する繁体字の単語/用語と、統計分類法により第2種類の単語/用語を変換して得られた、入力された簡体字の単語/用語と適正に対応する繁体字の単語/用語とを結合することで、入力された簡体字の文字列に対応する繁体字の文字列を形成して出力する結合出力部、
として機能させることを特徴とする上記コンピュータプログラム。 - 繁体字を簡体字に変換するためのコンピュータプログラムであって、
コンピュータを、
変換対象である繁体字の文字列を入力する入力部、
入力された繁体字の文字列をいくつかの単語/用語に分割する単語/用語分割部、
前記入力された繁体字の文字列における各単語/用語を鑑別・定義し、そのうちの、漢字表記が簡体字の単語/用語と同じ、または同じではないが所定の対応関係を有する繁体字の単語/用語を第1種類の単語/用語に定義すると共に、書き方が簡体字の単語/用語と異なり、かつ所定の対応関係を有しない繁体字の単語/用語を第2種類の単語/用語に定義する鑑別・定義部、
マッピングテーブルを用いて、前記第1種類の単語/用語を入力された繁体字の単語/用語と唯一対応する簡体字の単語/用語に直接マッピングするマッピング変換部、
統計分類法により、第2種類の単語/用語を入力された繁体字の単語/用語と適正に対応する簡体字の単語/用語に変換する統計変換部、
マッピングテーブルを用いて前記第1種類の単語/用語を直接マッピングして得られた、入力された繁体字の単語/用語と唯一対応する簡体字の単語/用語と、統計分類法により第2種類の単語/用語を変換して得られた、入力された繁体字の単語/用語と適正に対応する簡体字の単語/用語とを結合することで、変換される繁体字の文字列に対応する簡体字の文字列を形成して出力する結合出力部、
として機能させることを特徴とする上記コンピュータプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2006101115101A CN101131690B (zh) | 2006-08-21 | 2006-08-21 | 简体汉字和繁体汉字相互转换方法及其系统 |
CN200610111510.1 | 2006-08-21 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008052720A true JP2008052720A (ja) | 2008-03-06 |
JP5167711B2 JP5167711B2 (ja) | 2013-03-21 |
Family
ID=39128960
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007187850A Expired - Fee Related JP5167711B2 (ja) | 2006-08-21 | 2007-07-19 | 簡体字と繁体字とを相互変換する方法及びその変換装置 |
Country Status (3)
Country | Link |
---|---|
JP (1) | JP5167711B2 (ja) |
CN (1) | CN101131690B (ja) |
TW (1) | TW200811673A (ja) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010065226A1 (en) * | 2008-12-03 | 2010-06-10 | Microsoft Corporation | Viewing messages and message attachments in different languages |
KR101384139B1 (ko) | 2012-11-23 | 2014-04-10 | 박선정 | 간체자 학습을 위한 변환 방법, 그를 이용한 학습 방법, 기록매체, 저장매체 및 저장매체를 포함하는 이동통신 단말기 |
JP2014120178A (ja) * | 2012-12-17 | 2014-06-30 | Kofukin Seimitsu Kogyo (Shenzhen) Yugenkoshi | 中国語の繁体字と簡体字との変換システム及び中国語の繁体字と簡体字との変換方法 |
JP2014123379A (ja) * | 2012-12-24 | 2014-07-03 | Kofukin Seimitsu Kogyo (Shenzhen) Yugenkoshi | 中国語の特許出願のファイル変換システム及びその変換方法 |
CN112199576A (zh) * | 2020-10-20 | 2021-01-08 | 山东浪潮商用系统有限公司 | 一种中文拼音搜索的实现方法和系统 |
CN117252154A (zh) * | 2023-11-20 | 2023-12-19 | 北京语言大学 | 一种基于预训练语言模型的中文简繁字符转换方法及系统 |
CN112949283B (zh) * | 2021-04-26 | 2024-01-23 | 合肥工业大学 | 文本处理方法、装置、非易失性存储介质及处理器 |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102222419A (zh) * | 2011-06-27 | 2011-10-19 | 陈宇慧 | 一种电子文本的显示方法 |
CN103514152B (zh) * | 2012-06-21 | 2017-01-18 | 香港城市大学 | 简繁中文转换中的标识追踪方法及装置 |
CN102929852B (zh) * | 2012-10-15 | 2016-05-04 | 福建榕基软件股份有限公司 | 一种在富文本编辑器内实现简繁体字互转的方法及系统 |
CN103778110B (zh) * | 2012-10-25 | 2016-08-31 | 三星电子(中国)研发中心 | 简繁体汉字的转换方法及系统 |
CN103853706B (zh) * | 2012-12-06 | 2017-04-12 | 富士通株式会社 | 用于将简体汉语句子转换为繁体汉语句子的方法和设备 |
CN103559178A (zh) * | 2013-05-31 | 2014-02-05 | 武汉中文百科网络有限公司 | 互联网中文简繁字转换系统及方法 |
CN108108337A (zh) * | 2016-11-25 | 2018-06-01 | 北大方正集团有限公司 | 简繁互转方法及装置 |
CN107145244A (zh) * | 2017-04-26 | 2017-09-08 | 北京汉王数字科技有限公司 | 一种异形字符输入方法、装置及电子设备 |
CN108427671B (zh) * | 2018-01-25 | 2021-06-25 | 腾讯科技(深圳)有限公司 | 信息转换方法和装置、存储介质及电子装置 |
CN109145297B (zh) * | 2018-08-13 | 2022-06-10 | 华东计算技术研究所(中国电子科技集团公司第三十二研究所) | 基于hash存储的网络词汇语义分析方法和系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59172032A (ja) * | 1983-03-18 | 1984-09-28 | Photo Composing Mach Mfg Co Ltd | 文字入力装置 |
JPH08263478A (ja) * | 1995-03-24 | 1996-10-11 | Matsushita Electric Ind Co Ltd | 中国語簡繁体字文書変換装置 |
JPH08287046A (ja) * | 1995-04-14 | 1996-11-01 | Sharp Corp | 情報処理装置 |
CN1369833A (zh) * | 2001-02-16 | 2002-09-18 | 意蓝科技股份有限公司 | 词汇式繁体中文与简体中文的转换系统及转换方法 |
JP2003527676A (ja) * | 1999-11-05 | 2003-09-16 | マイクロソフト コーポレイション | モードレス入力で一方のテキスト形式を他方のテキスト形式に変換する言語入力アーキテクチャ |
CN1462966A (zh) * | 2002-05-29 | 2003-12-24 | 明日工作室股份有限公司 | 简繁体中文内码转换方法以及系统 |
JP2005004626A (ja) * | 2003-06-13 | 2005-01-06 | Ricoh Co Ltd | 異表記正規化処理装置、異表記正規化処理プログラム、これを記憶する記憶媒体、文書検索装置、文書検索プログラム及びこれを記憶する記憶媒体 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1192302C (zh) * | 1999-09-22 | 2005-03-09 | 微软公司 | 简繁体汉字输入系统及其方法 |
US6393445B1 (en) * | 2001-01-04 | 2002-05-21 | Institute For Information Industry | System for transforming Chinese character forms in real-time between a traditional character form and a simplified character form |
-
2006
- 2006-08-21 CN CN2006101115101A patent/CN101131690B/zh active Active
- 2006-08-31 TW TW095132203A patent/TW200811673A/zh unknown
-
2007
- 2007-07-19 JP JP2007187850A patent/JP5167711B2/ja not_active Expired - Fee Related
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59172032A (ja) * | 1983-03-18 | 1984-09-28 | Photo Composing Mach Mfg Co Ltd | 文字入力装置 |
JPH08263478A (ja) * | 1995-03-24 | 1996-10-11 | Matsushita Electric Ind Co Ltd | 中国語簡繁体字文書変換装置 |
JPH08287046A (ja) * | 1995-04-14 | 1996-11-01 | Sharp Corp | 情報処理装置 |
JP2003527676A (ja) * | 1999-11-05 | 2003-09-16 | マイクロソフト コーポレイション | モードレス入力で一方のテキスト形式を他方のテキスト形式に変換する言語入力アーキテクチャ |
CN1369833A (zh) * | 2001-02-16 | 2002-09-18 | 意蓝科技股份有限公司 | 词汇式繁体中文与简体中文的转换系统及转换方法 |
CN1462966A (zh) * | 2002-05-29 | 2003-12-24 | 明日工作室股份有限公司 | 简繁体中文内码转换方法以及系统 |
JP2005004626A (ja) * | 2003-06-13 | 2005-01-06 | Ricoh Co Ltd | 異表記正規化処理装置、異表記正規化処理プログラム、これを記憶する記憶媒体、文書検索装置、文書検索プログラム及びこれを記憶する記憶媒体 |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010065226A1 (en) * | 2008-12-03 | 2010-06-10 | Microsoft Corporation | Viewing messages and message attachments in different languages |
JP2012510680A (ja) * | 2008-12-03 | 2012-05-10 | マイクロソフト コーポレーション | 異なる言語によるメッセージおよび添付ファイルの表示 |
US9824071B2 (en) | 2008-12-03 | 2017-11-21 | Microsoft Technology Licensing, Llc | Viewing messages and message attachments in different languages |
KR101384139B1 (ko) | 2012-11-23 | 2014-04-10 | 박선정 | 간체자 학습을 위한 변환 방법, 그를 이용한 학습 방법, 기록매체, 저장매체 및 저장매체를 포함하는 이동통신 단말기 |
WO2014081238A1 (ko) * | 2012-11-23 | 2014-05-30 | Park Sun-Jung | 간체자 학습을 위한 변환 방법, 그를 이용한 학습 방법, 기록매체, 저장매체 및 저장매체를 포함하는 이동통신 단말기 |
JP2014120178A (ja) * | 2012-12-17 | 2014-06-30 | Kofukin Seimitsu Kogyo (Shenzhen) Yugenkoshi | 中国語の繁体字と簡体字との変換システム及び中国語の繁体字と簡体字との変換方法 |
JP2014123379A (ja) * | 2012-12-24 | 2014-07-03 | Kofukin Seimitsu Kogyo (Shenzhen) Yugenkoshi | 中国語の特許出願のファイル変換システム及びその変換方法 |
CN112199576A (zh) * | 2020-10-20 | 2021-01-08 | 山东浪潮商用系统有限公司 | 一种中文拼音搜索的实现方法和系统 |
CN112949283B (zh) * | 2021-04-26 | 2024-01-23 | 合肥工业大学 | 文本处理方法、装置、非易失性存储介质及处理器 |
CN117252154A (zh) * | 2023-11-20 | 2023-12-19 | 北京语言大学 | 一种基于预训练语言模型的中文简繁字符转换方法及系统 |
CN117252154B (zh) * | 2023-11-20 | 2024-01-23 | 北京语言大学 | 一种基于预训练语言模型的中文简繁字符转换方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
TWI328174B (ja) | 2010-08-01 |
CN101131690B (zh) | 2012-07-25 |
CN101131690A (zh) | 2008-02-27 |
JP5167711B2 (ja) | 2013-03-21 |
TW200811673A (en) | 2008-03-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5167711B2 (ja) | 簡体字と繁体字とを相互変換する方法及びその変換装置 | |
US11150875B2 (en) | Automated content editor | |
JP5128629B2 (ja) | 品詞タグ付けシステム、品詞タグ付けモデルのトレーニング装置および方法 | |
KR102199835B1 (ko) | 언어 교정 시스템 및 그 방법과, 그 시스템에서의 언어 교정 모델 학습 방법 | |
CN110770735B (zh) | 具有嵌入式数学表达式的文档的编码转换 | |
JP2020035019A (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP2009140466A (ja) | 使用者製作問答データに基づいた会話辞書サービスの提供方法及びシステム | |
Baró et al. | Towards a generic unsupervised method for transcription of encoded manuscripts | |
US20220284185A1 (en) | Storage medium, information processing method, and information processing device | |
Jain et al. | “UTTAM” An Efficient Spelling Correction System for Hindi Language Based on Supervised Learning | |
US20230123328A1 (en) | Generating cascaded text formatting for electronic documents and displays | |
Udayana et al. | Balinese Latin Text Becomes Aksara Bali Using Rule Base Method | |
JP2021101375A (ja) | 辞書構築装置、辞書の生産方法、およびプログラム | |
Reiter et al. | Exploring text recombination for automatic narrative level detection | |
Stokes | Modelling Multigraphism: the digital representation of multiple scripts and alphabets | |
Hossain et al. | Bangla braille adaptation | |
Wang et al. | Transition-based chinese semantic dependency graph parsing | |
Sapargali et al. | Determining the Relationship Between the Letters in the Voynich Manuscript Splitting the Text into Parts | |
US20230205910A1 (en) | Information processing device, confidentiality level determination program, and method | |
WO2021065058A1 (ja) | 概念構造抽出装置、記憶媒体及び方法 | |
US11170182B2 (en) | Braille editing method using error output function, recording medium storing program for executing same, and computer program stored in recording medium for executing same | |
US10970583B2 (en) | Information processing apparatus, and non-transitory computer readable medium | |
Balbudhe et al. | DESIGN APPROCH OF IMAGE RETRIEVAL MECHANISM BASED ON REGIONAL NLP | |
JP2006031198A (ja) | テキストマイニング装置及びそれに用いるテキストマイニング方法並びにそのプログラム | |
Singh et al. | Hybrid CNN-LSTM Architecture for Bilingual Next-Word Prediction in Punjabi-English Social Media Texts |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100622 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120605 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120806 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120904 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121030 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121127 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121210 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5167711 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |