JP2011505040A - 漢字系文字および文字構成要素の分類ならびに読み出しのためのシステムと方法 - Google Patents
漢字系文字および文字構成要素の分類ならびに読み出しのためのシステムと方法 Download PDFInfo
- Publication number
- JP2011505040A JP2011505040A JP2010535116A JP2010535116A JP2011505040A JP 2011505040 A JP2011505040 A JP 2011505040A JP 2010535116 A JP2010535116 A JP 2010535116A JP 2010535116 A JP2010535116 A JP 2010535116A JP 2011505040 A JP2011505040 A JP 2011505040A
- Authority
- JP
- Japan
- Prior art keywords
- character
- frequent
- component
- characters
- stroke
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/126—Character encoding
- G06F40/129—Handling non-Latin characters, e.g. kana-to-kanji conversion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/53—Querying
- G06F16/532—Query formulation, e.g. graphical querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Library & Information Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Document Processing Apparatus (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Input From Keyboards Or The Like (AREA)
- User Interface Of Digital Computer (AREA)
- Character Discrimination (AREA)
Abstract
Description
a.前記CJKV表記体系において既知のすべての文字、
b.各種ユニコード、シフトJIS、Big−5、中国国家標準文字群(GuoBiao)、およびその他の中国語、韓国語、または日本語のコード体系等のコンピュータ化された各種文字セットにより識別される文字、
c.一つまたはそれ以上の辞書で使用されている文字、
d.一つまたはそれ以上の言語資料で使用されている文字、および
e.教育上の目的を含むがこれに限定されない具体的な目的で使用されている選択された特定の文字を含む。
1) 文字全体が頻用構成要素である場合、この文字全体は主要構成要素である(表1、一行目)
2) 文字が2つの頻用構成要素からなるものであったり、これらの要素のうちの一方が部首で他方が非部首である場合、その主要構成要素はその文字の非部首部分である(表1、2行目)。
3) 文字が2つの構成要素を有し、その両者が部首として知られる要素のセットに含まれる場合、その主要構成要素は、
a.一方が他方よりも頻用構成要素としてはかなり低い頻度で使用される場合、その2つの要素のうちの低い頻度で使用されるものであり(表1、3行目)、
b.両者が等しく、またはほぼ等しい頻度で頻用構成要素として使用されている場合、その要素は音声的に機能するものとして考えられる(表1、4行目)
4) その文字が2つ以上の要素を有する場合、頻用構成要素に関する定義に従うものとして、それらの構成要素のうち最も低い頻度で存在するものが主要構成要素とみなされる(表1、5行目)。
5) 文字の書記素的構成要素のすべてが、まったく固有であり、その文字を共通の書記素を共有する文字族にグループ分けするのが不可能である場合、その文字全体がそれ自身の主要構成要素である(表1、6行目)。
主要構成要素を便利にアクセスする手段を提供する。紙ベースのフォーマットでは、アクセス手段は、主要構成要素が筆画−端点順に列挙されている本発明の実施形態にしたがって作成された表からなる。電子フォーマットでは、このアクセス手段は、画数と端点値を入力するためのインターフェースを提供することによって実現される。当該インタフェースでは、主要構成要素とそれらの関連筆画−端点値を含む記録テーブルがアクセスされ、対応する候補結果セットが表示される。インターフェースとして、グラフィカル・ユーザ・インターフェス(GUI)、テキストベースのインターフェース、別の種類の英数字インターフェース、入力装置インターフェース(キーボード、マウス、タッチペン等)、音声(例:マイクロフォン)/視覚(例:ビデオカメラ)インターフェース等が挙げられる。本方法に好適な装置は、図8を参照して以下に詳しく述べられる。
1.構成要素はそれらが有する画数と自由端点の数(筆画−端点値対)により分類できる。この明細書の目的のための値の組み合わせは{画数、端点}(略して{s、e})として示す。したがって、例えば、{s、e}表示が{2,3}であれば、画数2、端点数3の要素を示す。例えば[2.3]、[2−3]、(2−3)、(2、3)、{2−3}等の同じ情報を伝えるその他の表示を使用することができる。これらはすべて筆画−端点値対を表すことを意図している。
2.定義から当然に、すべての単一画数要素は、開始点と終点の2つの端点を有する(表3)。したがって、これらは{1.2}として表示される。
3.すべての点様筆画は慣例として短い筆画を構成するとして数えられる。したがって、ルール1にしたがって、これらは開始点と終点の見分けがつかない場合でも2つの自由端点を有すると考えられる。
4.すべての端点が自由端点である場合、自由端点の数はその画数の2倍に等しい(表4)。
5.筆画が別の筆画にぶつかることで、その筆画から端点が「消失」する(表5)。筆画同士のぶつかりが見られる場合、自由端の数は、その画数値の2倍から筆画のぶつかっている箇所の数を差し引くことでわかる。
6.構成要素のすべての筆画が末端同士でつながっている場合、その結果は自由端のない要素となる(表6)。
7.すぐ近くにある2つの別個の構成要素がほとんどぶつかっているように見える場合、そのような「見かけ上のぶつかり」0101〜0103は無視されることになる(図1a)。意図的かつ従来つながっている別個の構成要素は「真のぶつかり」0104を有するものとして扱われる(図1b)。
[0100] 既述の本発明の実施形態のように、関係の記録と様々なリストおよびアクセス手段は、紙ベースおよび電子フォーマットの両者で実現することができる。さらにまた、本実施形態は、具体的に主要構成要素にアクセスする手段または部首により文字にアクセスする手段等の機能を含んでいてもよい。しかしながら、明瞭化のため、および本発明を実現するこの特定のアプローチを区別するため、これらの追加的で任意の工程は上述の説明において列挙されていない。この実施形態の意図する用途に応じて、一つまたはそれ以上の実施形態の様々な特徴の適切な組み合わせを含むことができる。
[0101] 本実施形態は、ユーザが、より馴染みがあり、少なくともその{s.e}値からより簡単に見つけられるより単純な要素に基づいては知ることのできない複合主要構成要素を見つけることを可能にする。このことは、電子フォーマットにおいて実現される場合に特に効果的となりうる。
[0102] 操作の際には、上述の実施形態は、ユーザが単純な要素の使用により複雑な(複合)要素を探し当てることを可能にする。例えば、「加」という要素を探しだすには、{2.4}にある「力」または{3.0}にある「口」を探す。もちろん、この実施形態では既述の実施形態の特徴をさらに含むことができ、「加」自身が主要構成要素であるので、{5.4}として直接その複合要素「加」を探すこともできる。
[0103] 図12を参照して記載する本発明の別の実施形態は、電子または非電子フォーマットで実現化される。各実施形態において、上述した特徴および機能性のあらゆる組み合わせに加え、筆画−端点値対を文字そのものに適用することができる。このことは、中間検索工程として部首やその他の主要基本要素を使用することなく、その{s.e}値に直接したがって文字を検索することができることを意味する。電子フォーマットにおいては、入力および出力フィールドが表示およびデータ入力出力目的のために必要に応じて提供される。この実施形態は、紙ベースの検索方法にも使用できる。
[0104] 上述の好ましい機能性を実現するのに必要な各種工程に加え、本実施形態の方法は以下の工程を含むことができる。本発明が適用される文字のドメインに含まれる文字の画数と端点数を計算することができる。本方法は、それらの画数と端点数を介して文字にアクセスする手段を提供することを含んでもよい。
[0105] 本実施形態は、文字の部首や主要構成要素を決定するのが難しい場合に特に効果的となる。さらに、画数が数画の単純な文字の場合、部首または主要構成要素をキーとして用いる中間的な工程なしに、それらの{s.e}値により直接それらの文字を見つけることがより効率的になると期待される。
[0106] この方法を用いるときは、その文字の画数および自由端点の数を数え、部首や頻用構成要素の中間段階無しに、直接文字を探すことができる。例として、「事」という一般的な文字を考える。「事」は、従来の解析において検索用部首とされる4つ以上の候補要素(「一」、「口」、「亅」、および「ヨ」)を有する。「事」については、明らかに最も重要と考えられる要素もなければ、どの要素が一番一般的でないかを知るはっきりした方法があるわけでもない。「事」の画数と端点を数えることで、{s.e}値対が{8.7}であることがわかる。紙ベースのフォーマットでは、続いて{8.7}に列挙されている文字を検索する。そして電子フォーマットについては、この{s.e}値を、ユーザ・インターフェースが備えている様々な機能を利用してこの文字を検索し、その目標とする文字に対する結果セットをチェックする。後者の場合においては、筆画および端点値を入力する手段が出力表示手段と共に必要である。入力手段として、キーボード、マウス、タッチペン、音声入力装置、視覚的入力装置、ジェスチャーベースの入力装置、信号入力装置等がある。出力表示手段として、映像スクリーン、印刷、触覚出力装置、音声出力装置、信号出力装置、および/または結果を人または別のコンピュータあるいは電子システムに出力するのに適した出力装置が挙げられる。
[0107] 本実施形態は、文字が単純(画数が少ない)で、文字のどの部分が部首または主要構成要素 であるかを決めることが難しい場合に特に効果的となりうる。
[0108] 表13および14を参照して、別の実施形態について述べる。従来の部首および文字の画数の数え方は、何年もの辞書編纂で確立されてきた。残念なことに、この従来の画数を数える方法が、通常展開されている画数を数える原理と食い違うような場合が時々ある。この実施形態の方法は、表13に示すように、別の画数値をこのような場合と関連付けることができる。この表では、対象とする行に示す要素と関連付けられた{s.e}値が、列に示されている。{s.e}#1で示す列は、2つの可能な画数値の一番目のものを示し、{s.e}#2で示す列は別の画数値を示す。これらの場合では、各{s.e}対についての「s」(最初の)値の違いを見ることになる。
[0109] 同様に、端点数は、文字または要素が書かれる正確な様式により変わるように思われる。このため、異なるフォントが異なる端点数を示すこともある。本実施形態は、別の端点値を対象とする文字または要素と関連付けることで、このような曖昧さを解決することができる。
[0110] 別の端点数を介して曖昧さを解決する例を表14に示す。この表では、各行が特定の要素に対応している。{s.e}#2および{s.e}#3で示す列は、別の端点数を示す。これらの場合では、各{s.e}値対について「e」(2番目の)値の違いを見ることになる。
Claims (25)
- 複数の頻用文字構成要素を有する文字のドメインにおけるコンピュータ化分類および文字検索のための方法であって、
文字のドメインを有するデータベースを提供する工程と、
文字のドメイン内で複数の頻用文字構成要素を識別する工程と、
前記頻用文字構成要素それぞれの画数を識別する工程と、
前記頻用文字構成要素それぞれの端点数を識別する工程と、
前記頻用文字構成要素それぞれを、その頻用文字構成要素に対して決定された筆画−端点値対に従って分類する工程であって、前記筆画−端点値対はその頻用文字構成要素に対して特定される画数および端点に基づくものである工程と、
複数の関係エントリをデータベースに保存することでデータベースに特定された関係を記録する工程であり、各関係エントリ頻用文字構成要素とそれぞれの関係文字との双方向関連に応じているものである工程と、
ユーザインターフェースを介して入力筆画−端点値対を受け取り、この受け取った筆画−端点値対を、データベースにアクセスして、その受け取った筆画−端点値対に対応する頻用文字構成要素の一つまたはそれ以上からなるグループを読み出すために用いる工程と、
前記受け取った筆画−端点値対に対応する一つまたはそれ以上の頻用文字構成要素からなるグループを生成する工程と、
前記ユーザインターフェースを介して、その受け取った筆画−端点値対に対応する頻用文字構成要素のグループから選択した目標頻用文字構成要素の提示を受け取る工程と、
目標頻用文字構成要素との関係を有するデータベースにおける文字を読み出す工程と、
前記目標頻用文字構成要素に基づく文字の一覧を作成し、その文字の一覧を出力としてユーザインターフェースに提供する工程とを含む方法。 - 前記頻用構成要素は部首を構成するものである、請求項1記載の方法。
- 前記頻用構成要素は主要構成要素を構成するものである、請求項1記載の方法。
- 前記頻用構成要素は、部首、主要構成要素、およびその他識別可能な頻用構成要素を包含するものである、請求項1記載の方法。
- 前記方法は、
文字のドメインにおける文字のそれぞれについて画数および端点値を決定する工程と、
筆画−端点値対をその文字のドメイン内で各文字に関連付ける工程とをさらに含むものである、請求項4記載の方法。 - 前記ユーザインターフェースは、筆画−端点値対および選択表示等の入力をユーザから受け取るのに適合した入力装置と、文字、筆画−端点値対、および頻用構成要素を表示するのに適合した表示装置とを有するものである、請求項1記載の方法。
- 前記ユーザインターフェースは、別のコンピュータが前記データベースからの検索および読み出しを許容するのに適合したソフトウェアインターフェースを含むものである、請求項1記載の方法。
- 前記文字アクセス手段は、その文字に対して入力された筆画−端点値対のみを用いて、直接文字にアクセスする手段を含むものである、請求項5記載の方法。
- 前記方法は、頻用構成要素を参照および表示するために文字暗号化を作成し、すでに有している文字暗号化を補足する工程をさらに含むものである、請求項1記載の方法。
- 前記方法は、
複数の筆画−端点値対を有すると解釈されがちな特徴を有する頻用構成要素に対して、別の筆画−端点値対を識別し記録する工程をさらに有するものである、請求項1記載の方法。 - 前記方法は、
各頻用構成要素の語源的意味を識別する工程と、
各頻用構成要素に名前を関連付ける工程であり、前記名前は語源的意味に基づくものである工程と、
ユーザインターフェースを介して入力された名前に基づいて頻用構成要素を読み出すために前記データベースにアクセスするための名前に基づくアクセス手段を提供する工程とをさらに有するものである、請求項1記載の方法。 - 前記方法は、
互いの異形と考えられる複数の頻用構成要素間の関係を識別し記録する工程と、
その関連する異形書記素バージョンの一つに基づいて、頻用構成要素にアクセスにアクセスする手段を提供する工程とをさらに有するものである、請求項11記載の方法。 - 前記方法は、
頻用構成要素を検索目的文字と共有する文字を自由にかつ直接的に入力する手段を提供する工程と、
前記文字の構成頻用構成要素のリストを作成する手段を提供する工程と、
前記構成頻用構成要素を含む文字のリストを作成する手段を提供する工程と、
前記構成頻用構成要素の一つを選択する手段を提供する工程と、
前記選択された構成頻用構成要素を含む文字のリストを作成する工程とをさらに有するものである、請求項11記載の方法。 - 頻用構成要素を有する文字のドメインにおける文字の索引を作成する方法において、前記方法は、
文字のドメインを提供する工程と、
前記文字のドメイン内に存在する頻用構成要素を識別する工程と、
各頻用構成要素について画数を決定する工程と、
各頻用構成要素について端点数を決定する工程と、
その頻用構成要素について決定した画数および端点数に対応する筆画−端点値対にしたがって、複数の頻用構成要素のそれぞれを分類する工程と、
各頻用構成要素と一つまたはそれ以上の文字との間の関係を特定する工程であり、その関係は文字がその頻用構成要素を含む場合に特定されるものである工程と、
頻用構成要素とそれらのそれぞれ関連する文字との関連を示すデータベースに複数の関係入力を保存することによりそのデータベースに特定した関係を記録する工程と、
各筆画−端点値対について、データベースにアクセスし、その筆画−端点値対に対応する一つまたはそれ以上の頻用構成要素のグループを読み出し、その筆画−端点値対に関連する頻用構成要素の各々に関連する文字の一覧を作成する工程と、
筆画−端点値対にしたがって並べられ、複数の項目を含む索引を作成する工程であり、各項目は前記筆画−端点値対の一つに基づいており、その筆画−端点値対に関連する頻用構成要素に基づくサブ項目を有し、各頻用構成要素はさらにその頻用構成要素に関連した文字のリストをさらに有するものである工程とを含む方法。 - 前記頻用構成要素は部首を構成するものである、請求項14記載の方法。
- 前記頻用構成要素は主要構成要素を構成するものである、請求項14記載の方法。
- 前記頻用構成要素は、部首および主要構成要素を包含するものである、請求項14記載の方法。
- 前記方法は、
文字のドメインにおける各文字について画数および端点値を決定する工程と、
筆画−端点値対を対応する文字に関連づける工程と、
筆画−端点値対にしたがって並べられた文字の索引で複数の項目を含むものを作成する工程であり、各項目は前記筆画−端点値対に対応する文字を列挙するものである、請求項14記載の方法。 - 請求項14乃至18のいずれかにしたがって作成される索引。
- 請求項14に記載の方法に従って並べられた辞書において、前記辞書は、
複数の第一のセクションマーキングであり、各第一のセクションマーキングはそのセクションの主要構成要素についての画数に関連するセクションに対応するものである複数の第一つのセクションマーキングと、
複数のサブセクションマーキングであり、各サブセクションマーキングはそのセクションに対する画数を有する主要構成要素に対する端点値に対応するものである複数のサブセクションマーキングとを有するものであり、
各サブセクションは、主要構成要素と、そのセクションの画数値とそのサブセクションの端点値を含む関連語彙データとを有するものである辞書。 - 各サブセクションの初めにある、そのサブセクションに頻用構成要素を列挙する表と、
辞書の余白に位置し、前記セクションとサブセクションの筆画−端点値にしたがって配列された頻用構成要素の整理された一覧とをさらに有し、
そのページに見つけられる頻用構成要素は、ハイライトされており、前のページに見つけられる頻用構成要素はハイライトされた頻用構成要素の前に列挙されており、続くページに見つけられる頻用構成要素はハイライトされた頻用構成要素の後に列挙されているものである、請求項20記載の辞書。 - 各サブセクション内の文字は、残りの画数または従来の部首にしたがってさらに順に並べられているものである、請求項20記載の辞書。
- 電子辞書において、
プロセッサ、
前記プロセッサに接続されており、複数の文字記録、各々が主要な筆画−端点値対を有する複数の頻用構成要素記録と、頻用構成要素を一つまたはそれ以上の文字記録と関連させる複数の関係入力とを含むデータベースがその中に保存されているメモリと、
前記プロセッサに接続されている表示装置と、
前記プロセッサに接続されている入力装置とを有し、
前記メモリは、実行時に前記プロセッサに一連の工程を実行させる命令を有するものであり、前記一連の工程は、
前記入力装置を介して入力された筆画−端点値対を受けとり、その受け取った筆画−端点値対を、データベースへのアクセスし、その受け取った筆画−端点値対に対応する頻用構成要素の一つまたはそれ以上のグループを読み出すのに用いる工程と、
頻用構成要素のそのグループを表示装置に表示する工程と、
前記入力装置を介して、頻用構成要素の表示されたグループから、選択された目的とする頻用構成要素を示すものを受け取る工程と、
目的とする頻用構成要素と関係のあるデータベースから文字を読み出す工程と、
その読み出した文字を表示する工程とを含むものである、電子辞書。 - 前記入力装置および表示装置は、コンピュータネットワークを介して接続されたものである、請求項23記載のシステム。
- 前記電子辞書は携帯式の電子辞書である、請求項23記載のシステム。
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US99012307P | 2007-11-26 | 2007-11-26 | |
US99016607P | 2007-11-26 | 2007-11-26 | |
US60/990,166 | 2007-11-26 | ||
US60/990,123 | 2007-11-26 | ||
US99101007P | 2007-11-29 | 2007-11-29 | |
US60/991,010 | 2007-11-29 | ||
PCT/US2008/084750 WO2009070615A1 (en) | 2007-11-26 | 2008-11-25 | System and method for classification and retrieval of chinese-type characters and character components |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011505040A true JP2011505040A (ja) | 2011-02-17 |
JP5666307B2 JP5666307B2 (ja) | 2015-02-12 |
Family
ID=40678958
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010535116A Expired - Fee Related JP5666307B2 (ja) | 2007-11-26 | 2008-11-25 | 漢字系文字および文字構成要素の分類ならびに読み出しのためのシステムと方法 |
JP2010535118A Pending JP2011509442A (ja) | 2007-11-26 | 2008-11-25 | 中国語、日本語、および韓国語の言語データを電子的形態で管理するためのモジュラーシステムと方法 |
JP2014048371A Pending JP2014142951A (ja) | 2007-11-26 | 2014-03-12 | 中国語、日本語、および韓国語の言語データを電子的形態で管理するためのモジュラーシステムと方法 |
JP2016124051A Pending JP2016186805A (ja) | 2007-11-26 | 2016-06-23 | 中国語、日本語、および韓国語の言語データを電子的形態で管理するためのモジュラーシステムと方法 |
Family Applications After (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010535118A Pending JP2011509442A (ja) | 2007-11-26 | 2008-11-25 | 中国語、日本語、および韓国語の言語データを電子的形態で管理するためのモジュラーシステムと方法 |
JP2014048371A Pending JP2014142951A (ja) | 2007-11-26 | 2014-03-12 | 中国語、日本語、および韓国語の言語データを電子的形態で管理するためのモジュラーシステムと方法 |
JP2016124051A Pending JP2016186805A (ja) | 2007-11-26 | 2016-06-23 | 中国語、日本語、および韓国語の言語データを電子的形態で管理するためのモジュラーシステムと方法 |
Country Status (6)
Country | Link |
---|---|
US (2) | US8521738B2 (ja) |
JP (4) | JP5666307B2 (ja) |
CN (2) | CN102016837B (ja) |
HK (2) | HK1156710A1 (ja) |
TW (2) | TWI468954B (ja) |
WO (2) | WO2009070619A1 (ja) |
Families Citing this family (43)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8564544B2 (en) | 2006-09-06 | 2013-10-22 | Apple Inc. | Touch screen device, method, and graphical user interface for customizing display of content category icons |
GB0624571D0 (en) * | 2006-12-08 | 2007-01-17 | Cambridge Silicon Radio Ltd | Authenticating Devices for Communications |
US8689132B2 (en) | 2007-01-07 | 2014-04-01 | Apple Inc. | Portable electronic device, method, and graphical user interface for displaying electronic documents and lists |
CN101286094A (zh) * | 2007-04-10 | 2008-10-15 | 谷歌股份有限公司 | 多模式输入法编辑器 |
US8266514B2 (en) * | 2008-06-26 | 2012-09-11 | Microsoft Corporation | Map service |
US9824071B2 (en) * | 2008-12-03 | 2017-11-21 | Microsoft Technology Licensing, Llc | Viewing messages and message attachments in different languages |
US20120010870A1 (en) * | 2010-07-09 | 2012-01-12 | Vladimir Selegey | Electronic dictionary and dictionary writing system |
US20120038652A1 (en) * | 2010-08-12 | 2012-02-16 | Palm, Inc. | Accepting motion-based character input on mobile computing devices |
JP2012079252A (ja) * | 2010-10-06 | 2012-04-19 | Fujitsu Ltd | 情報端末装置、文字入力方法および文字入力プログラム |
US8914743B2 (en) * | 2010-11-12 | 2014-12-16 | Apple Inc. | Device, method, and graphical user interface for navigating a list of identifiers |
US20120156658A1 (en) * | 2010-12-16 | 2012-06-21 | Nicholas Fuzzell | Methods for teaching and/or learning chinese, and related systems |
WO2012174703A1 (en) * | 2011-06-20 | 2012-12-27 | Microsoft Corporation | Hover translation of search result captions |
JP2013041350A (ja) * | 2011-08-12 | 2013-02-28 | Panasonic Corp | タッチテーブルシステム |
KR101870729B1 (ko) * | 2011-09-01 | 2018-07-20 | 삼성전자주식회사 | 휴대용 단말기의 번역 트리구조를 이용한 번역장치 및 방법 |
KR20130080515A (ko) * | 2012-01-05 | 2013-07-15 | 삼성전자주식회사 | 디스플레이 장치 및 그 디스플레이 장치에 표시된 문자 편집 방법. |
WO2013138503A1 (en) * | 2012-03-13 | 2013-09-19 | Stieglitz Avi | Language learning platform using relevant and contextual content |
TWI449000B (zh) * | 2012-03-23 | 2014-08-11 | Chinese Foundation For Digitization Technology | Multimedia Chinese Character Learning Method |
US9274609B2 (en) | 2012-07-23 | 2016-03-01 | Mingyan Xie | Inputting radical on touch screen device |
US20140344670A1 (en) * | 2013-05-14 | 2014-11-20 | Pandaworks Inc. Dba Contentpanda | Method and system for on-demand delivery of predefined in-context web content |
KR20150028627A (ko) * | 2013-09-06 | 2015-03-16 | 삼성전자주식회사 | 사용자 필기를 텍스트 정보로 변환하는 방법 및 이를 수행하기 위한 전자 기기 |
JP2015060095A (ja) * | 2013-09-19 | 2015-03-30 | 株式会社東芝 | 音声翻訳装置、音声翻訳方法およびプログラム |
WO2015112250A1 (en) * | 2014-01-22 | 2015-07-30 | Speak Agent, Inc. | Visual-kinesthetic language construction |
CN104808806B (zh) * | 2014-01-28 | 2019-10-25 | 北京三星通信技术研究有限公司 | 根据不确定性信息实现汉字输入的方法和装置 |
TW201530357A (zh) * | 2014-01-29 | 2015-08-01 | Chiu-Huei Teng | 用於電子裝置之中文輸入法 |
RU2640322C2 (ru) * | 2014-01-30 | 2017-12-27 | Общество с ограниченной ответственностью "Аби Девелопмент" | Способы и системы эффективного автоматического распознавания символов |
WO2015167556A1 (en) * | 2014-04-30 | 2015-11-05 | Hewlett-Packard Development Company, L.P. | Generating color similarity measures |
WO2016029045A2 (en) * | 2014-08-21 | 2016-02-25 | Jobu Productions | Lexical dialect analysis system |
JP6466138B2 (ja) * | 2014-11-04 | 2019-02-06 | 株式会社東芝 | 外国語文作成支援装置、方法及びプログラム |
US20160147741A1 (en) * | 2014-11-26 | 2016-05-26 | Adobe Systems Incorporated | Techniques for providing a user interface incorporating sign language |
US9740684B2 (en) * | 2015-02-18 | 2017-08-22 | Lenovo (Singapore) Pte. Ltd. | Determining homonyms of logogram input |
CN106997245A (zh) * | 2016-01-24 | 2017-08-01 | 杨文韬 | 一种根据中文语言模型构建输入法词库的方法 |
US10031949B2 (en) * | 2016-03-03 | 2018-07-24 | Tic Talking Holdings Inc. | Interest based content distribution |
US10176623B2 (en) | 2016-05-02 | 2019-01-08 | Tic Talking Holdings Inc. | Facilitation of depiction of geographic relationships via a user interface |
CN108346426B (zh) * | 2018-02-01 | 2020-12-08 | 威盛电子(深圳)有限公司 | 语音识别装置以及语音识别方法 |
TWI659411B (zh) * | 2018-03-01 | 2019-05-11 | 大陸商芋頭科技(杭州)有限公司 | 一種多語言混合語音識別方法 |
CN109147784B (zh) * | 2018-09-10 | 2021-06-08 | 百度在线网络技术(北京)有限公司 | 语音交互方法、设备以及存储介质 |
US11017771B2 (en) * | 2019-01-18 | 2021-05-25 | Adobe Inc. | Voice command matching during testing of voice-assisted application prototypes for languages with non-phonetic alphabets |
US10964322B2 (en) | 2019-01-23 | 2021-03-30 | Adobe Inc. | Voice interaction tool for voice-assisted application prototypes |
TWI725608B (zh) * | 2019-11-11 | 2021-04-21 | 財團法人資訊工業策進會 | 語音合成系統、方法及非暫態電腦可讀取媒體 |
CN111753556B (zh) * | 2020-06-24 | 2022-01-04 | 掌阅科技股份有限公司 | 双语对照阅读的方法、终端及计算机存储介质 |
CN113536005B (zh) * | 2021-09-17 | 2021-12-24 | 网娱互动科技(北京)股份有限公司 | 一种相似图片或字体查找方法和系统 |
WO2023146416A1 (en) * | 2022-01-28 | 2023-08-03 | John Chu | Character retrieval method and apparatus, electronic device and medium |
CN116738966A (zh) * | 2022-03-01 | 2023-09-12 | 衍利行资产有限公司 | 一种分析包括中文字文本的方法和系统 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001357046A (ja) * | 2000-05-11 | 2001-12-26 | Matsushita Electric Ind Co Ltd | 電子画像化装置、キーワード付与システムおよびキーワード付与方法 |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01114976A (ja) * | 1987-10-28 | 1989-05-08 | Sharp Corp | 文書処理装置の辞書構造 |
JPH0540747A (ja) * | 1991-08-07 | 1993-02-19 | Matsushita Electric Ind Co Ltd | ワードプロセツサー |
JPH05151197A (ja) * | 1991-11-14 | 1993-06-18 | Chinka Oka | コンピユータに漢字を入力する方法 |
US5257938A (en) * | 1992-01-30 | 1993-11-02 | Tien Hsin C | Game for encoding of ideographic characters simulating english alphabetic letters |
CN1144354A (zh) * | 1995-04-25 | 1997-03-05 | 齐兰发展股份有限公司 | 增强的字符录入系统 |
US5923778A (en) * | 1996-06-12 | 1999-07-13 | Industrial Technology Research Institute | Hierarchical representation of reference database for an on-line Chinese character recognition system |
JP2000163418A (ja) * | 1997-12-26 | 2000-06-16 | Canon Inc | 自然言語処理装置及びその方法、及びそのプログラムを格納した記憶媒体 |
US7257528B1 (en) * | 1998-02-13 | 2007-08-14 | Zi Corporation Of Canada, Inc. | Method and apparatus for Chinese character text input |
CN1145872C (zh) * | 1999-01-13 | 2004-04-14 | 国际商业机器公司 | 手写汉字自动分割和识别方法以及使用该方法的系统 |
JP3838857B2 (ja) * | 2000-09-19 | 2006-10-25 | 沖電気工業株式会社 | 辞書装置 |
US20060139315A1 (en) * | 2001-01-17 | 2006-06-29 | Kim Min-Kyum | Apparatus and method for inputting alphabet characters on keypad |
CN1403960A (zh) * | 2001-08-27 | 2003-03-19 | 无敌科技股份有限公司 | 通过电脑拼字的方法 |
US7136805B2 (en) * | 2002-06-11 | 2006-11-14 | Fuji Xerox Co., Ltd. | System for distinguishing names of organizations in Asian writing systems |
US7680649B2 (en) * | 2002-06-17 | 2010-03-16 | International Business Machines Corporation | System, method, program product, and networking use for recognizing words and their parts of speech in one or more natural languages |
US8137105B2 (en) * | 2003-07-31 | 2012-03-20 | International Business Machines Corporation | Chinese/English vocabulary learning tool |
JP2005157472A (ja) * | 2003-11-20 | 2005-06-16 | Sharp Corp | 文字入力装置および文字入力方法 |
TW200527226A (en) * | 2004-02-11 | 2005-08-16 | Cheng-Fu Lee | Chinese system for sorting and searching |
KR20050092999A (ko) * | 2004-03-17 | 2005-09-23 | 샤프전자(주) | 전자사전에서의 한자검색방법 |
WO2005124599A2 (en) * | 2004-06-12 | 2005-12-29 | Getty Images, Inc. | Content search in complex language, such as japanese |
US20070052868A1 (en) * | 2005-09-02 | 2007-03-08 | Charisma Communications, Inc. | Multimedia accessible universal input device |
JP2007087216A (ja) * | 2005-09-22 | 2007-04-05 | Toshiba Corp | 階層型辞書作成装置、プログラムおよび階層型辞書作成方法 |
-
2008
- 2008-11-25 TW TW97145512A patent/TWI468954B/zh not_active IP Right Cessation
- 2008-11-25 US US12/744,809 patent/US8521738B2/en active Active
- 2008-11-25 CN CN200880125478.XA patent/CN102016837B/zh active Active
- 2008-11-25 JP JP2010535116A patent/JP5666307B2/ja not_active Expired - Fee Related
- 2008-11-25 TW TW097145519A patent/TWI496012B/zh not_active IP Right Cessation
- 2008-11-25 JP JP2010535118A patent/JP2011509442A/ja active Pending
- 2008-11-25 CN CN2008801254775A patent/CN102016836B/zh not_active Expired - Fee Related
- 2008-11-25 WO PCT/US2008/084755 patent/WO2009070619A1/en active Application Filing
- 2008-11-25 WO PCT/US2008/084750 patent/WO2009070615A1/en active Application Filing
- 2008-11-25 US US12/744,801 patent/US8433709B2/en active Active
-
2011
- 2011-10-11 HK HK11110766.8A patent/HK1156710A1/xx unknown
- 2011-10-11 HK HK11110767.7A patent/HK1156418A1/xx unknown
-
2014
- 2014-03-12 JP JP2014048371A patent/JP2014142951A/ja active Pending
-
2016
- 2016-06-23 JP JP2016124051A patent/JP2016186805A/ja active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001357046A (ja) * | 2000-05-11 | 2001-12-26 | Matsushita Electric Ind Co Ltd | 電子画像化装置、キーワード付与システムおよびキーワード付与方法 |
Also Published As
Publication number | Publication date |
---|---|
US20110320468A1 (en) | 2011-12-29 |
JP5666307B2 (ja) | 2015-02-12 |
TWI496012B (zh) | 2015-08-11 |
WO2009070615A1 (en) | 2009-06-04 |
CN102016836B (zh) | 2013-03-13 |
US8433709B2 (en) | 2013-04-30 |
JP2011509442A (ja) | 2011-03-24 |
CN102016836A (zh) | 2011-04-13 |
CN102016837B (zh) | 2014-08-20 |
TW200945065A (en) | 2009-11-01 |
TW200945066A (en) | 2009-11-01 |
HK1156418A1 (en) | 2012-06-08 |
JP2014142951A (ja) | 2014-08-07 |
JP2016186805A (ja) | 2016-10-27 |
US20100257173A1 (en) | 2010-10-07 |
TWI468954B (zh) | 2015-01-11 |
CN102016837A (zh) | 2011-04-13 |
US8521738B2 (en) | 2013-08-27 |
WO2009070619A1 (en) | 2009-06-04 |
HK1156710A1 (en) | 2012-06-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5666307B2 (ja) | 漢字系文字および文字構成要素の分類ならびに読み出しのためのシステムと方法 | |
US7257528B1 (en) | Method and apparatus for Chinese character text input | |
Anthony | AntConc: design and development of a freeware corpus analysis toolkit for the technical writing classroom | |
Anthony | of Software Tools for Corpus Studies: The Case for Collaboration | |
JP2016186805A5 (ja) | ||
TWI603214B (zh) | 網頁查詢中線上手寫辨識系統與方法 | |
US6604878B1 (en) | Keyboard input devices, methods and systems | |
Yen et al. | WriteAhead: Mining grammar patterns in corpora for assisted writing | |
JPS61234465A (ja) | 言語文字の選択方法およびその再生方法 | |
WO2016197265A1 (zh) | 一种输入生僻字的方法 | |
TWI698794B (zh) | 專利文件的圖形資料之導覽內容的自動化得出顯示設備 | |
WO2006122361A1 (en) | A personal learning system | |
WO2000043861A1 (en) | Method and apparatus for chinese character text input | |
US9563282B2 (en) | Brahmi phonemics based keyboard for providing textual inputs in indian languages | |
JP4004060B1 (ja) | 文字検索方法 | |
JP3803253B2 (ja) | 漢字入力のための方法および装置 | |
JP5233424B2 (ja) | 検索装置およびプログラム | |
Nelson et al. | A short history and demonstration of the dynamic table of contexts | |
Love | CHAPTER 10 APP-BASED AND ONLINE DICTIONARIES | |
WO2018228101A1 (zh) | 基于汉语含义的汉语编码方法及系统和介质设备 | |
JP2024000757A (ja) | 電子機器、電子機器の制御方法およびプログラム | |
CN108228540A (zh) | 利用笔迹手势编辑手写输入 | |
Ojha | Computing in Indian Languages for Knowledge Management: Technology Perspectives and Linguistic Issues | |
TW201518960A (zh) | 電腦字典輔助裝置以及方法 | |
Hoek | Breaking up the Kanji |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20111125 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121122 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130702 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130926 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131029 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140127 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140708 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140911 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141111 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141210 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5666307 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |