JP2010529569A - 辞書の単語及び熟語の判定 - Google Patents
辞書の単語及び熟語の判定 Download PDFInfo
- Publication number
- JP2010529569A JP2010529569A JP2010511470A JP2010511470A JP2010529569A JP 2010529569 A JP2010529569 A JP 2010529569A JP 2010511470 A JP2010511470 A JP 2010511470A JP 2010511470 A JP2010511470 A JP 2010511470A JP 2010529569 A JP2010529569 A JP 2010529569A
- Authority
- JP
- Japan
- Prior art keywords
- word
- total number
- candidate
- words
- dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 claims abstract description 164
- 238000012545 processing Methods 0.000 claims description 70
- 230000008569 process Effects 0.000 description 43
- 239000002131 composite material Substances 0.000 description 18
- 238000013515 script Methods 0.000 description 16
- 238000004590 computer program Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 8
- 230000011218 segmentation Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 235000013399 edible fruits Nutrition 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- LZDYZEGISBDSDP-UHFFFAOYSA-N 2-(1-ethylaziridin-1-ium-1-yl)ethanol Chemical compound OCC[N+]1(CC)CC1 LZDYZEGISBDSDP-UHFFFAOYSA-N 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 235000002492 Rungia klossii Nutrition 0.000 description 1
- 244000117054 Rungia klossii Species 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 210000001072 colon Anatomy 0.000 description 1
- 238000013479 data entry Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3338—Query expansion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/53—Processing of non-Latin text
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
Description
(1)文書発生合計数が第1のしきい値より小さい、
(2)ユーザセグメント化合計数が照会合計数以上である、もしくは、
(3)照会合計数が第2のしきい値未満である、
候補収録語802を削除する。残っている候補収録語802は、IME辞書124に加えられる。いくつかの具体化において、エンジン406及びエンジン408は、直接IME辞書124に書き込むことができると共に、辞書124において、収録語128を加え得るか、もしくは収録語128を更新し得るか、もしくは収録語128をフィルタ処理し得る。
101 インプットメソッドエディタコード
102 処理装置
103 インプットメソッドエディタインスタンス
104 第1のデータストア
105 アプリケーションソフトウェア
106 第2のデータストア
107 アプリケーションインスタンス
108 入力装置
110 出力装置
112 ネットワークインタフェース
114 バスシステム
116 ネットワーク
118 遠隔計算システム
120 実例インプットメソッドエディタシステム
122 インプットメソッドエディタエンジン
124 辞書
126 合成入力テーブル
128 収録語
300 実例インプットメソッドエディタ環境
302 候補選択肢
304 ピンイン入力
308 選択インジケータ
400 単語及び熟語判定エンジン
402 文書コーパス
404 検索照会ログ
406 文脈信号ベースの判定エンジン
408 検索照会ベースの判定エンジン
410 第1の辞書
412 第2の辞書
414 併合エンジン
416 (候補)辞書収録語
418 検索照会
420 文書
422 (候補)辞書収録語
800 辞書
802 候補収録語
Claims (21)
- コンピュータで実行される方法であって、
検索照会における候補単語を特定する段階と、
各候補単語に関して、前記候補単語が前記検索照会における唯一の単語である回数を示す第1の合計数を決定すると共に、前記候補単語及び1つ以上の他の単語が前記検索照会のそれぞれに含まれる回数を示す第2の合計数を決定する段階と、
前記第1の合計数と前記第2の合計数との間の関係に基づいて、インプットメソッドエディタ辞書に前記候補単語の内の1つ以上を加える段階とを含み、
各候補単語が、1つ以上の連続した文字を含む
ことを特徴とする方法。 - 前記インプットメソッドエディタ辞書に前記候補単語の内の1つ以上を加える段階が、
前記第1の合計数が前記第2の合計数より大きいとき、候補単語を前記インプットメソッドエディタ辞書に加える段階を含む
ことを特徴とする請求項1に記載の方法。 - 前記インプットメソッドエディタ辞書に前記候補単語の内の1つ以上を加える段階が、
前記第1の合計数が前記第2の合計数より大きいと共に、前記第1の合計数がしきい値より大きいとき、候補単語を前記インプットメソッドエディタ辞書に加える段階を含む
ことを特徴とする請求項1に記載の方法。 - 前記第2の合計数を決定する段階が、
前記候補単語及び1つ以上の他の単語をそれぞれが含む検索照会の数を計数する段階を含み、
前記検索照会において、前記候補単語及び前記1つ以上の他の単語が、前記検索照会を提示したユーザによって入力された1つ以上の空白または句読点によって分割されている
ことを特徴とする請求項1に記載の方法。 - 検索ログから前記検索照会を獲得する段階を含む
ことを特徴とする請求項1に記載の方法。 - 前記検索ログが、検索サービスのユーザによって提示された検索照会を含む
ことを特徴とする請求項5に記載の方法。 - 検索照会を格納するためのデータストアと、
前記検索照会における候補単語を特定し、各候補単語に関して、前記候補単語が前記検索照会における唯一の単語である回数を示す第1の合計数を決定すると共に、前記候補単語及び1つ以上の他の単語が前記検索照会のそれぞれに含まれる回数を示す第2の合計数を決定し、前記第1の合計数と前記第2の合計数との間の関係に基づいて、インプットメソッドエディタ辞書に前記候補単語の内の1つ以上を加えるための処理装置とを備え、
各候補単語が、1つ以上の連続した文字を含む
ことを特徴とするシステム。 - 前記処理装置が、前記第1の合計数が前記第2の合計数より大きいとき、候補単語を前記インプットメソッドエディタ辞書に加えることになっている
ことを特徴とする請求項7に記載のシステム。 - 前記処理装置が、前記第1の合計数が前記第2の合計数より大きいと共に、前記第1の合計数がしきい値より大きいとき、候補単語を前記インプットメソッドエディタ辞書に加えることになっている
ことを特徴とする請求項7に記載のシステム。 - 前記処理装置が、前記候補単語及び1つ以上の他の単語をそれぞれが含む検索照会の数を計数することになっていると共に、
前記検索照会において、前記候補単語及び前記1つ以上の他の単語が、前記検索照会を提示したユーザによって入力された1つ以上の空白または句読点によって分割されている
ことを特徴とする請求項7に記載のシステム。 - 検索照会を格納するためのデータストアと、
コンピュータ読み取り可能な媒体に格納されると共に、処理装置によって実行可能であり、そのような実行によって前記処理装置に、前記検索照会における候補単語を特定させ、各候補単語に関して、前記候補単語が前記検索照会における唯一の単語である回数を示す第1の合計数を決定させると共に、前記候補単語及び1つ以上の他の単語が前記検索照会のそれぞれに含まれる回数を示す第2の合計数を決定させ、前記第1の合計数と前記第2の合計数との間の関係に基づいて、インプットメソッドエディタ辞書に前記候補単語の内の1つ以上を加えさせる命令を有する処理エンジンとを備え、
各候補単語が、1つ以上の連続した文字を含む
ことを特徴とするシステム。 - 前記処理エンジンが、前記処理装置によって実行可能であり、そのような実行によって前記処理装置に、前記第1の合計数が前記第2の合計数より大きいとき、候補単語を前記インプットメソッドエディタ辞書に加えさせる命令を有する
ことを特徴とする請求項11に記載のシステム。 - 前記処理エンジンが、前記処理装置によって実行可能であり、そのような実行によって前記処理装置に、前記第1の合計数が前記第2の合計数より大きいと共に、前記第1の合計数がしきい値より大きいとき、候補単語を前記インプットメソッドエディタ辞書に加えさせる命令を有する
ことを特徴とする請求項11に記載のシステム。 - 前記処理エンジンが、前記処理装置によって実行可能であり、そのような実行によって前記処理装置に、前記候補単語及び1つ以上の他の単語をそれぞれが含む検索照会の数を計数させる命令を有し、
前記検索照会において、前記候補単語及び前記1つ以上の他の単語が、前記検索照会を提示したユーザによって入力された1つ以上の空白または句読点によって分割されている
ことを特徴とする請求項11に記載のシステム。 - 単語が検索照会における唯一の単語である回数を示す第1の合計数と前記単語及び1つ以上の他の単語が前記検索照会のそれぞれに存在する回数を示す第2の合計数とに基づいて特定される前記単語を有する辞書と、
前記辞書の中から単語を選択するように構成されたインプットメソッドエディタと
を備えることを特徴とする装置。 - 前記インプットメソッドエディタが、中国語のインプットメソッドエディタを含む
ことを特徴とする請求項15に記載の装置。 - 前記単語が、“Hanzi”文字を含む
ことを特徴とする請求項15に記載の装置。 - 単語が検索照会における唯一の単語である回数を示す第1の合計数と前記単語及び1つ以上の他の単語が前記検索照会のそれぞれに含まれる回数を示す第2の合計数とに基づいて特定される前記単語を含む辞書を格納するためのデータストアと、
コンピュータ読み取り可能な媒体に格納されると共に、処理装置によって実行可能であり、ユーザが前記辞書の中から単語を選択することを可能にするために、そのような実行によって前記処理装置にインプットメソッドエディタを提供させる命令を有する処理エンジンと
を備えることを特徴とするシステム。 - 単語が検索照会における唯一の単語である回数を示す第1の合計数と前記単語及び1つ以上の他の単語が前記検索照会のそれぞれに含まれる回数を示す第2の合計数とに基づいて特定される前記単語を含む辞書を格納するためのデータストアと、
ユーザが前記辞書の中から単語を選択することを可能にするために、インプットメソッドエディタを提供する処理装置と
を備えることを特徴とするシステム。 - 検索照会における候補単語を特定するための手段と、
前記候補単語が前記検索照会における唯一の単語である回数を示す第1の合計数を決定すると共に、前記候補単語及び1つ以上の他の単語が前記検索照会のそれぞれに含まれる回数を示す第2の合計数を決定することによって、各候補単語を処理するための手段と、
前記第1の合計数と前記第2の合計数との間の関係に基づいて、インプットメソッドエディタ辞書に前記候補単語の内の1つ以上を加えるための手段とを備え、
各候補単語が、1つ以上の連続した文字を含む
ことを特徴とするシステム。 - 候補単語を、前記単語が検索照会における唯一の単語である回数を示す第1の合計数と前記単語及び1つ以上の他の単語が前記検索照会のそれぞれに含まれる回数を示す第2の合計数とに基づいて特定するための手段と、
インプットメソッドエディタ辞書に前記候補単語の内の1つ以上を加えるための手段と
を備えることを特徴とするシステム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2007/001870 WO2008151465A1 (en) | 2007-06-14 | 2007-06-14 | Dictionary word and phrase determination |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010529569A true JP2010529569A (ja) | 2010-08-26 |
JP5241828B2 JP5241828B2 (ja) | 2013-07-17 |
Family
ID=40129200
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010511470A Active JP5241828B2 (ja) | 2007-06-14 | 2007-06-14 | 辞書の単語及び熟語の判定 |
Country Status (5)
Country | Link |
---|---|
US (1) | US8010344B2 (ja) |
JP (1) | JP5241828B2 (ja) |
KR (1) | KR101465769B1 (ja) |
CN (1) | CN102124459B (ja) |
WO (1) | WO2008151465A1 (ja) |
Families Citing this family (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101779200B (zh) | 2007-06-14 | 2013-03-20 | 谷歌股份有限公司 | 词典词和短语确定方法和设备 |
US8521516B2 (en) * | 2008-03-26 | 2013-08-27 | Google Inc. | Linguistic key normalization |
US8862989B2 (en) * | 2008-06-25 | 2014-10-14 | Microsoft Corporation | Extensible input method editor dictionary |
US20100185644A1 (en) * | 2009-01-21 | 2010-07-22 | Microsoft Corporatoin | Automatic search suggestions from client-side, browser, history cache |
GB0917753D0 (en) | 2009-10-09 | 2009-11-25 | Touchtype Ltd | System and method for inputting text into electronic devices |
GB0905457D0 (en) * | 2009-03-30 | 2009-05-13 | Touchtype Ltd | System and method for inputting text into electronic devices |
US9424246B2 (en) | 2009-03-30 | 2016-08-23 | Touchtype Ltd. | System and method for inputting text into electronic devices |
US10191654B2 (en) | 2009-03-30 | 2019-01-29 | Touchtype Limited | System and method for inputting text into electronic devices |
US9189472B2 (en) | 2009-03-30 | 2015-11-17 | Touchtype Limited | System and method for inputting text into small screen devices |
US11416214B2 (en) | 2009-12-23 | 2022-08-16 | Google Llc | Multi-modal input on an electronic device |
EP2339576B1 (en) | 2009-12-23 | 2019-08-07 | Google LLC | Multi-modal input on an electronic device |
US20110184723A1 (en) * | 2010-01-25 | 2011-07-28 | Microsoft Corporation | Phonetic suggestion engine |
US8150859B2 (en) * | 2010-02-05 | 2012-04-03 | Microsoft Corporation | Semantic table of contents for search results |
CN102411563B (zh) * | 2010-09-26 | 2015-06-17 | 阿里巴巴集团控股有限公司 | 一种识别目标词的方法、装置及系统 |
CN101986309A (zh) * | 2010-11-16 | 2011-03-16 | 无敌科技(西安)有限公司 | 查询题库的方法及装置 |
US8892584B1 (en) * | 2011-03-28 | 2014-11-18 | Symantec Corporation | Systems and methods for identifying new words from a meta tag |
WO2012159245A1 (en) * | 2011-05-20 | 2012-11-29 | Microsoft Corporation | Displaying key pinyins |
US9348479B2 (en) | 2011-12-08 | 2016-05-24 | Microsoft Technology Licensing, Llc | Sentiment aware user interface customization |
US9378290B2 (en) | 2011-12-20 | 2016-06-28 | Microsoft Technology Licensing, Llc | Scenario-adaptive input method editor |
US9275636B2 (en) * | 2012-05-03 | 2016-03-01 | International Business Machines Corporation | Automatic accuracy estimation for audio transcriptions |
CN110488991A (zh) | 2012-06-25 | 2019-11-22 | 微软技术许可有限责任公司 | 输入法编辑器应用平台 |
US8959109B2 (en) | 2012-08-06 | 2015-02-17 | Microsoft Corporation | Business intelligent in-document suggestions |
KR101911999B1 (ko) | 2012-08-30 | 2018-10-25 | 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 | 피처 기반 후보 선택 기법 |
EP2891043A4 (en) | 2012-08-31 | 2015-10-14 | Microsoft Technology Licensing Llc | PERSONAL LANGUAGE MODEL FOR AN INPUT PROCESSOR EDITOR |
CN103279565A (zh) * | 2013-06-14 | 2013-09-04 | 北京艾德思奇科技有限公司 | 广告投放追踪方法及系统 |
CN105580004A (zh) | 2013-08-09 | 2016-05-11 | 微软技术许可有限责任公司 | 提供语言帮助的输入方法编辑器 |
US9336195B2 (en) * | 2013-08-27 | 2016-05-10 | Nuance Communications, Inc. | Method and system for dictionary noise removal |
US20150088493A1 (en) * | 2013-09-20 | 2015-03-26 | Amazon Technologies, Inc. | Providing descriptive information associated with objects |
CN105814557A (zh) * | 2013-12-09 | 2016-07-27 | 谷歌公司 | 用于提供文本的基于上下文的定义和翻译的系统和方法 |
GB201610984D0 (en) | 2016-06-23 | 2016-08-10 | Microsoft Technology Licensing Llc | Suppression of input images |
CN107179838B (zh) * | 2017-05-25 | 2019-07-26 | 维沃移动通信有限公司 | 一种候选词的显示方法及移动终端 |
US10572586B2 (en) * | 2018-02-27 | 2020-02-25 | International Business Machines Corporation | Technique for automatically splitting words |
KR102392385B1 (ko) * | 2019-07-15 | 2022-04-29 | 주식회사 산엔지니어링 | 방송 또는 영화의 대본을 위한 참여 구조의 창작 시스템 및 그에 의한 대본의 공모 방법 |
US12001529B1 (en) * | 2021-11-05 | 2024-06-04 | Validate Me LLC | Counting machine for manufacturing and validating event-relevant identities via an ensemble network |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10320419A (ja) * | 1997-05-22 | 1998-12-04 | Nippon Telegr & Teleph Corp <Ntt> | 情報関連づけ装置およびその方法 |
JP2000331032A (ja) * | 1996-10-31 | 2000-11-30 | Fuji Xerox Co Ltd | 文書処理装置、単語抽出装置及び単語抽出方法 |
Family Cites Families (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5111398A (en) * | 1988-11-21 | 1992-05-05 | Xerox Corporation | Processing natural language text using autonomous punctuational structure |
JP3270783B2 (ja) * | 1992-09-29 | 2002-04-02 | ゼロックス・コーポレーション | 複数の文書検索方法 |
US5548507A (en) | 1994-03-14 | 1996-08-20 | International Business Machines Corporation | Language identification process using coded language words |
US5724571A (en) * | 1995-07-07 | 1998-03-03 | Sun Microsystems, Inc. | Method and apparatus for generating query responses in a computer-based document retrieval system |
US5893133A (en) * | 1995-08-16 | 1999-04-06 | International Business Machines Corporation | Keyboard for a system and method for processing Chinese language text |
US5819265A (en) * | 1996-07-12 | 1998-10-06 | International Business Machines Corporation | Processing names in a text |
US6009382A (en) * | 1996-08-19 | 1999-12-28 | International Business Machines Corporation | Word storage table for natural language determination |
JP3556425B2 (ja) * | 1997-03-18 | 2004-08-18 | 株式会社東芝 | 共有辞書更新方法および辞書サーバ |
US6546383B1 (en) * | 1999-06-09 | 2003-04-08 | Ricoh Company, Ltd. | Method and device for document retrieval |
JP3426176B2 (ja) * | 1999-12-27 | 2003-07-14 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 音声認識装置、方法、コンピュータ・システム及び記憶媒体 |
US6687689B1 (en) * | 2000-06-16 | 2004-02-03 | Nusuara Technologies Sdn. Bhd. | System and methods for document retrieval using natural language-based queries |
US6964014B1 (en) * | 2001-02-15 | 2005-11-08 | Networks Associates Technology, Inc. | Method and system for localizing Web pages |
JP2003178260A (ja) | 2001-12-10 | 2003-06-27 | Canon Inc | データ処理方法 |
JP4558482B2 (ja) * | 2002-06-05 | 2010-10-06 | ス、ロンビン | 各国語文字情報の最適化デジタル操作的コード化及び入力の方法、そして、その情報処理システム |
US7158930B2 (en) * | 2002-08-15 | 2007-01-02 | Microsoft Corporation | Method and apparatus for expanding dictionaries during parsing |
US7315982B2 (en) * | 2003-02-26 | 2008-01-01 | Xerox Corporation | User-tailorable romanized Chinese text input systems and methods |
TWI270792B (en) * | 2003-03-28 | 2007-01-11 | Lin-Shan Lee | Speech-based information retrieval |
CN100429648C (zh) * | 2003-05-28 | 2008-10-29 | 洛昆多股份公司 | 一种文本自动分块的方法、分块器和文本到语言合成系统 |
CN1303564C (zh) | 2003-06-12 | 2007-03-07 | 摩托罗拉公司 | 改进的电子设备中字符输入的识别方法 |
US20050071148A1 (en) * | 2003-09-15 | 2005-03-31 | Microsoft Corporation | Chinese word segmentation |
JP4120550B2 (ja) * | 2003-09-29 | 2008-07-16 | 富士通株式会社 | 利用者辞書登録プログラム、装置、および方法 |
US7421386B2 (en) * | 2003-10-23 | 2008-09-02 | Microsoft Corporation | Full-form lexicon with tagged data and methods of constructing and using the same |
US7424421B2 (en) * | 2004-03-03 | 2008-09-09 | Microsoft Corporation | Word collection method and system for use in word-breaking |
CN100487027C (zh) * | 2004-03-09 | 2009-05-13 | 三菱化学株式会社 | 聚对苯二甲酸丁二醇酯颗粒、其复合制品和成型品及它们的制造方法 |
US7584175B2 (en) * | 2004-07-26 | 2009-09-01 | Google Inc. | Phrase-based generation of document descriptions |
KR100682897B1 (ko) * | 2004-11-09 | 2007-02-15 | 삼성전자주식회사 | 사전 업데이트 방법 및 그 장치 |
CN100405371C (zh) * | 2006-07-25 | 2008-07-23 | 北京搜狗科技发展有限公司 | 一种提取新词的方法和系统 |
-
2007
- 2007-06-14 CN CN2007801002271A patent/CN102124459B/zh active Active
- 2007-06-14 JP JP2010511470A patent/JP5241828B2/ja active Active
- 2007-06-14 WO PCT/CN2007/001870 patent/WO2008151465A1/en active Application Filing
- 2007-06-14 KR KR1020107000784A patent/KR101465769B1/ko active IP Right Grant
- 2007-10-10 US US11/870,074 patent/US8010344B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000331032A (ja) * | 1996-10-31 | 2000-11-30 | Fuji Xerox Co Ltd | 文書処理装置、単語抽出装置及び単語抽出方法 |
JPH10320419A (ja) * | 1997-05-22 | 1998-12-04 | Nippon Telegr & Teleph Corp <Ntt> | 情報関連づけ装置およびその方法 |
Non-Patent Citations (2)
Title |
---|
CSND200001153019; 山口 哲弘: 'パソコン新技術大系 第8回 キーボードからの日本語入力とかな漢字変換の仕組み' 日経バイト 第193号, 19990722, pp.160-166, 日経BP社 * |
JPN6012027313; 山口 哲弘: 'パソコン新技術大系 第8回 キーボードからの日本語入力とかな漢字変換の仕組み' 日経バイト 第193号, 19990722, pp.160-166, 日経BP社 * |
Also Published As
Publication number | Publication date |
---|---|
US20080312910A1 (en) | 2008-12-18 |
KR101465769B1 (ko) | 2014-11-27 |
US8010344B2 (en) | 2011-08-30 |
KR20100047221A (ko) | 2010-05-07 |
CN102124459A (zh) | 2011-07-13 |
CN102124459B (zh) | 2013-06-12 |
WO2008151465A1 (en) | 2008-12-18 |
JP5241828B2 (ja) | 2013-07-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5241828B2 (ja) | 辞書の単語及び熟語の判定 | |
Hill et al. | Quantifying the impact of dirty OCR on historical text analysis: Eighteenth Century Collections Online as a case study | |
US8412517B2 (en) | Dictionary word and phrase determination | |
US8812300B2 (en) | Identifying related names | |
US8386240B2 (en) | Domain dictionary creation by detection of new topic words using divergence value comparison | |
US8463598B2 (en) | Word detection | |
KR101465770B1 (ko) | 단어 확률 결정 | |
US8731901B2 (en) | Context aware back-transliteration and translation of names and common phrases using web resources | |
JP5379138B2 (ja) | 領域辞書の作成 | |
WO2015084759A1 (en) | Systems and methods for in-memory database search | |
US20020083045A1 (en) | Information retrieval processing apparatus and method, and recording medium recording information retrieval processing program | |
KR20070098252A (ko) | 자동완성 추천어를 정정하여 노출하는 자동완성 추천어제공 방법 및 시스템 | |
US10242033B2 (en) | Extrapolative search techniques | |
TW200422874A (en) | Graphical feedback for semantic interpretation of text and images | |
Alexander et al. | Metaphor, popular science, and semantic tagging: Distant reading with the Historical Thesaurus of English | |
JP4631795B2 (ja) | 情報検索支援システム、情報検索支援方法および情報検索支援プログラム | |
Freihat et al. | Towards an optimal solution to lemmatization in Arabic | |
Camps et al. | Handling heavily abbreviated manuscripts: Htr engines vs text normalisation approaches | |
JP2005063185A (ja) | 文書検索システム、質問応答システム、文書検索方法 | |
JP2007011973A (ja) | 情報検索装置及び情報検索プログラム | |
Efremova et al. | A geo-tagging framework for address extraction from web pages | |
CN104516941A (zh) | 相关文档检索装置、方法及程序 | |
JP2000339342A (ja) | 文書検索方法および文書検索装置 | |
Alam et al. | Improving accessibility of archived raster dictionaries of complex script languages | |
Olsen et al. | A proofreading tool using brute force techniques |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100610 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120529 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120823 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130305 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130402 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160412 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 5241828 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |