JP2012194674A - 文字変換用辞書の更新方法および文字変換用辞書の更新情報作成システム - Google Patents
文字変換用辞書の更新方法および文字変換用辞書の更新情報作成システム Download PDFInfo
- Publication number
- JP2012194674A JP2012194674A JP2011056823A JP2011056823A JP2012194674A JP 2012194674 A JP2012194674 A JP 2012194674A JP 2011056823 A JP2011056823 A JP 2011056823A JP 2011056823 A JP2011056823 A JP 2011056823A JP 2012194674 A JP2012194674 A JP 2012194674A
- Authority
- JP
- Japan
- Prior art keywords
- dictionary
- update
- word
- words
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
【解決手段】文字入力システム10を有する携帯端末1から、学習辞書100や利用頻度テーブル104など文字変換処理での単語の利用状況を示す情報を送信する。アップデート処理システム2には推定処理部202により携帯端末1から送信された情報を用いて文字変換処理での単語の利用状況を分析することによって、様々な分野別に設定された分野別辞書群21の各分野の中から携帯端末1のユーザが志向する分野を推定する。アップデート辞書作成部203は、携帯端末1の可変辞書103を対象に、推定された分野に属する単語が増加し、推定されなかった分野に属する単語が削減された内容のアップデート辞書を作成する。アップデート辞書は携帯端末1に送信され、更新処理部12によって可変辞書103に置き換えられる。
【選択図】図1
Description
たとえば特許文献1には、個々の端末装置から文字入力履歴の送信を受け付けて、各受信情報を用いて新語リストを生成し、この新語リストが追加された辞書を各端末装置に送信することが記載されている。
また携帯型の端末装置では、メモリ容量に制限があるために辞書のサイズにも上限が設けられている場合が多いが、特許文献2には辞書データを追加することしか記載されておらず、不要な辞書データを削除するという思想が認められない。
この情報の送信を受けたコンピュータシステムでは、当該情報を用いて前記端末装置における文字変換処理での単語の利用状況を分析することによって、端末装置のユーザが志向する分野を推定する。そして管理情報と比べてユーザが志向すると推定された分野につき単語登録手段に登録されている単語が増える一方で、ユーザが志向すると推定されなかった分野に属する単語が削減された内容の更新用の辞書の辞書データを作成し、作成された辞書データを端末装置に送信するためにコンピュータネットワークに出力する。また端末装置では、コンピュータネットワークを介して更新用の辞書データの送信を受け付けたことに応じて、自装置の変換用辞書のうちの更新の対象とされる部分を受信したデータに基づき更新する。
さらにこの実施形態では、利用頻度テーブルが更新用辞書に適合し、かつ各利用単語に推定手段により判別された当該単語の利用頻度が適用された内容になるように、利用頻度テーブルの更新情報を作成する利用頻度テーブル更新手段が含まれる。出力手段は、更新用辞書の辞書データと共に利用頻度テーブルの更新情報を出力する。
なお、基本辞書102および可変辞書103における単語番号の設定範囲は、両者の間で単語番号が重複することがないように分離されている。これに応じて利用頻度テーブル104も、基本辞書102内の単語の利用頻度を管理するパート(基本辞書用パート)と、可変辞書103の単語の利用頻度を管理するパート(可変辞書用パート)とに分かれている。
なお、分野別辞書と登録単語との関係は一対一にする必要はなく、複数の分野別辞書に重複登録される単語があってもよい。
先に述べたように、可変辞書103の単語単位の辞書データには、単語番号、読み、表記、品詞情報、初期頻度の各情報が含まれ、利用頻度テーブル104には単語番号と利用頻度との組み合わせが格納される。この例では、便宜上、可変辞書103内の各単語に、1から順に単語番号が割り当てられるものとする。
なお、利用単語リストは、アップデート辞書の作成に使用されるもので、ユーザ別データベース20のユーザ専用エリアに保存される。
アップデート前の可変辞書103に含まれていた「浅草橋」や「足利」は削除されているが、「鮎」は利用されているので残されている。
特に、趣味に関する分野やユーザが関心を持つ分野に関して追加された単語は、利用される可能性がかなり高いと思われる。
このフローチャートのステップQ1からQ4までは、ステップQを細分化したものである。まずステップQ1では、携帯端末1から送信された分析用データ中の利用頻度テーブルと、既にユーザ専用エリアに登録されていたバックアップ辞書とを使用する。なお、バックアップ辞書には、登録処理時に携帯端末1から送信された基本辞書と一段階前のアップデート処理で作成されたアップデート辞書が含まれるが、今回が初めてのアップデート処理である場合には、アップデート処理システム1にあらかじめ登録されている可変辞書103の初期データがバックアップ辞書に含められる。すなわちバックアップ辞書は現在の携帯端末1に格納されている基本辞書102および可変辞書103と同じ内容のものであり、利用頻度テーブルもこれらに対応するものである。
なお、適合分野が設定されていない場合には、ステップS2はスキップされる。
なお、ここで抽出される新語は、アップデート処理システム2の運営者が分野別辞書群21の内容を見直すことにより登録されたものである。また抽出対象となる単語には、容易に見分けられるように、識別用のフラグなどが設定されている。
ステップS5およびS6の処理によれば、適合分野に属さない分野やアップデート処理システム2に新規に設定された分野からもある程度の数の単語を抽出して、これらの単語をアップデート辞書に含めることができる。しかし、特に評価値がゼロまたはゼロに近い分野(ユーザに利用されていない分野)については、ステップS5でかなりの数の単語が選択される上に、次に述べる間引き処理の対象にもなるので、アップデート前の辞書より単語数が削減される。
なお、エントリ領域内の情報は送信が終了するまで保持される。またステップS9では前回のアップデート辞書を上書きするが、これに限らず、毎回のアップデート辞書を残すようにしてもよい。
まずステップT1において、着目する単語を特定するためのカウンタnに単語番号の初期値(図3の例によれば「1」)を設定する。ステップT2では、アップデート辞書のエントリ領域から単語番号がnの単語を読み出し、この単語により利用単語リストを照合する。
これらの処理により、携帯端末1における文字入力の利便性が大幅に高められ、ユーザは効率の良い文字入力を行うことが可能になる。
たとえば、あらかじめアップデートを行うまでの送信の回数を定め、その回数に達するまでは、携帯端末1から学習辞書100のみを送信し、その間、アップデート処理システム2において、送信された学習辞書100をユーザ別データベースのユーザ専用エリアに格納する。定められた回数の通信が行われると、次の送信では、携帯端末1から学習辞書100と共にユーザ辞書101および利用頻度テーブル104を送信する。アップデート処理システム2の推定処理部202は、この分析用データと先に蓄積された学習辞書100とをまとめて分析処理を実行する。
なお、アップデート処理を行わない間に送信された学習辞書100を蓄積する処理は、図1に示した分析用データ転送サーバ3に担当させてもよい。
2 アップデート処理システム
11 分析用データ送信部
12 更新処理部
20 ユーザ別データベース
21 分野別辞書群
100 学習辞書
101 ユーザ辞書
102 基本辞書
103 可変辞書
104 利用頻度テーブル
201 分析用データ入力部
202 推定処理部
203 アップデート辞書作成部
204 利用頻度テーブル作成部
205 送信処理部
Claims (5)
- 文字変換機能を有する端末装置で使用される文字変換用辞書を更新するための方法であって、
前記端末装置に組み込まれている文字変換用の辞書のうち更新の対象となる部分と同内容の辞書データを含む管理情報が保存される管理情報保存手段と、複数種の分野別に単語が分類されて登録された単語登録手段とを具備するコンピュータシステムを構築し、このコンピュータシステムに、前記端末装置における文字変換処理で変換後の単語として利用された単語の利用状況を示す情報をコンピュータネットワークを介して送信し、
前記情報の送信を受けたコンピュータシステムにおいて、当該情報を用いて前記端末装置における文字変換処理での単語の利用状況を分析することによって、前記端末装置のユーザが志向する分野を推定するステップと、管理情報と比べてユーザが志向すると推定された分野につき単語登録手段に登録されている単語が増える一方で、ユーザが志向すると推定されなかった分野に属する単語が削減された内容の更新用の辞書の辞書データを作成するステップと、作成された辞書データを前記端末装置に送信するためにコンピュータネットワークに出力するステップとを実行し、
前記端末装置は、コンピュータネットワークを介して前記更新用の辞書データの送信を受け付けたことに応じて、自装置の変換用辞書のうちの更新の対象とされる部分を受信したデータに基づき更新する、
ことを特徴とする文字変換用辞書の更新方法。 - 文字変換機能を有する端末装置で使用される文字変換用辞書の更新用の情報を作成するシステムであって、
前記端末装置に組み込まれている文字変換用の辞書のうち更新の対象となる部分と同内容の辞書データを含む管理情報が保存される管理情報保存手段と、
複数種の分野別に単語が分類されて登録された単語登録手段と、
前記端末装置における文字変換処理で変換後の単語として利用された単語の利用状況を示す情報をコンピュータネットワークを介して受け付ける入力手段と、
入力手段により受け付けられた情報を用いて端末装置における文字変換処理での単語の利用状況を分析することによって、前記端末装置のユーザが志向する分野を推定する推定手段と、
前記推定手段による推定結果に基づいて更新用の辞書の辞書データを作成する更新用辞書作成手段と、
更新用辞書作成手段により作成された辞書データを前記端末装置に送信するためにコンピュータネットワークに出力する出力手段とを具備し、
前記更新用辞書作成手段は、前記管理情報と比べて前記推定手段によりユーザが志向すると推定された分野につき前記単語登録手段に登録されている単語が増える一方で、ユーザが志向すると推定されなかった分野に属する単語が削減された内容の更新用辞書を形成するための辞書データを作成する、文字変換用辞書の更新情報作成システム。 - 前記更新用辞書作成手段は、更新後の辞書のサイズをあらかじめ定められた上限値以内にすること、および変換後の単語として利用された単語を更新後の辞書から削除しないことを条件に、更新用辞書に含める単語を選択する、請求項2に記載された文字変換用辞書の更新情報作成システム。
- 前記入力手段が受け付ける情報には、前記端末装置の文字変換用辞書に登録されている各単語の利用頻度が格納された利用頻度テーブルの情報が含まれており、
前記利用頻度テーブルが前記更新用辞書に適合する内容になるように利用頻度テーブルの更新情報を作成する利用頻度テーブル更新手段をさらに具備し、
前記出力手段は、更新用辞書の辞書データと共に利用頻度テーブルの更新情報を出力する、
請求項2または3に記載された文字変換用辞書の更新情報作成システム。 - 前記入力手段が受け付ける情報には、前記端末装置の文字変換用辞書に登録されている各単語の利用頻度が格納された利用頻度テーブルの情報と、端末装置の文字変換処理で変換後の単語として選択された単語が蓄積された学習辞書の辞書データとが含まれており、
前記推定手段は、前記入力手段により入力された情報を用いて変換後の単語として利用された単語およびその利用頻度を判別し、判別された各単語と前記複数種の分野との関係に基づいてユーザが志向する分野を推定し、
前記更新用辞書作成手段は、前記推定手段により判別された利用単語を全て含む更新用辞書の辞書データを作成し、
前記利用頻度テーブルが更新用辞書に適合し、かつ各利用単語に前記推定手段により判別された当該単語の利用頻度が適用された内容になるように、前記利用頻度テーブルの更新情報を作成する利用頻度テーブル更新手段をさらに具備し、
前記出力手段は、更新用辞書の辞書データと共に利用頻度テーブルの更新情報を出力する、請求項2または3に記載された文字変換用辞書の更新情報作成システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011056823A JP2012194674A (ja) | 2011-03-15 | 2011-03-15 | 文字変換用辞書の更新方法および文字変換用辞書の更新情報作成システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011056823A JP2012194674A (ja) | 2011-03-15 | 2011-03-15 | 文字変換用辞書の更新方法および文字変換用辞書の更新情報作成システム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2012194674A true JP2012194674A (ja) | 2012-10-11 |
Family
ID=47086524
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011056823A Pending JP2012194674A (ja) | 2011-03-15 | 2011-03-15 | 文字変換用辞書の更新方法および文字変換用辞書の更新情報作成システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2012194674A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106557178A (zh) * | 2016-11-29 | 2017-04-05 | 百度国际科技(深圳)有限公司 | 用于更新输入法词条的方法及装置 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02144763A (ja) * | 1988-11-28 | 1990-06-04 | Ricoh Co Ltd | 仮名漢字変換装置 |
JPH1125084A (ja) * | 1997-06-27 | 1999-01-29 | Casio Comput Co Ltd | 文字列変換装置およびそのプログラム記録媒体 |
JP2000163413A (ja) * | 1998-11-27 | 2000-06-16 | Nec Home Electronics Ltd | 日本語変換装置 |
JP2003150589A (ja) * | 2001-11-19 | 2003-05-23 | Sharp Corp | 辞書データ配信システム |
JP2004206307A (ja) * | 2002-12-24 | 2004-07-22 | Internatl Business Mach Corp <Ibm> | 辞書更新システム、更新処理サーバ、端末、制御方法、プログラム及び記録媒体 |
JP2006155322A (ja) * | 2004-11-30 | 2006-06-15 | Nec Fielding Ltd | 入力予測辞書システムおよび入力予測方法 |
JP2010039847A (ja) * | 2008-08-06 | 2010-02-18 | Toshiba Corp | 文字入力装置 |
-
2011
- 2011-03-15 JP JP2011056823A patent/JP2012194674A/ja active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02144763A (ja) * | 1988-11-28 | 1990-06-04 | Ricoh Co Ltd | 仮名漢字変換装置 |
JPH1125084A (ja) * | 1997-06-27 | 1999-01-29 | Casio Comput Co Ltd | 文字列変換装置およびそのプログラム記録媒体 |
JP2000163413A (ja) * | 1998-11-27 | 2000-06-16 | Nec Home Electronics Ltd | 日本語変換装置 |
JP2003150589A (ja) * | 2001-11-19 | 2003-05-23 | Sharp Corp | 辞書データ配信システム |
JP2004206307A (ja) * | 2002-12-24 | 2004-07-22 | Internatl Business Mach Corp <Ibm> | 辞書更新システム、更新処理サーバ、端末、制御方法、プログラム及び記録媒体 |
JP2006155322A (ja) * | 2004-11-30 | 2006-06-15 | Nec Fielding Ltd | 入力予測辞書システムおよび入力予測方法 |
JP2010039847A (ja) * | 2008-08-06 | 2010-02-18 | Toshiba Corp | 文字入力装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106557178A (zh) * | 2016-11-29 | 2017-04-05 | 百度国际科技(深圳)有限公司 | 用于更新输入法词条的方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108875055B (zh) | 一种答案提供方法及设备 | |
CN106845644B (zh) | 一种通过相互关系学习用户及移动应用的联系的异构网络 | |
CN104794145B (zh) | 基于内容和关系距离来连接人们 | |
JP6612450B2 (ja) | データ処理フロー管理システムおよび方法 | |
CN109710739B (zh) | 一种信息处理方法及装置、存储介质 | |
JP6123143B1 (ja) | 特許要件適否予測装置および特許要件適否予測プログラム | |
CN110209809B (zh) | 文本聚类方法和装置、存储介质及电子装置 | |
JP2019191975A (ja) | 人材選定装置、人材選定システム、人材選定方法及びプログラム | |
KR20100020587A (ko) | 네트워크를 이용한 구인/구직 매칭 서비스 시스템 및 그방법 | |
CN108604248B (zh) | 利用基于人工智能的相关性计算的笔记提供方法及装置 | |
KR101450453B1 (ko) | 컨텐츠 추천 방법 및 장치 | |
CN109885834A (zh) | 一种用户年龄性别的预测方法及装置 | |
EP2613275B1 (en) | Search device, search method, search program, and computer-readable memory medium for recording search program | |
CN109582967A (zh) | 舆情摘要提取方法、装置、设备及计算机可读存储介质 | |
CN106557178B (zh) | 用于更新输入法词条的方法及装置 | |
CN110929014B (zh) | 信息处理方法、装置、电子设备及存储介质 | |
KR101650888B1 (ko) | 컨텐츠 수집, 추천 시스템 및 방법 | |
JP2012194674A (ja) | 文字変換用辞書の更新方法および文字変換用辞書の更新情報作成システム | |
CN109712613A (zh) | 语义分析库更新方法、装置及电子设备 | |
CN109408679A (zh) | 智能管理应用程序的方法、装置、电子设备及存储介质 | |
JP2020135673A (ja) | 投稿評価システム及び方法 | |
JP6141378B2 (ja) | 人材検索サーバ | |
CN114741594A (zh) | 一种信息推送方法、装置、计算机设备及存储介质 | |
JP6750838B1 (ja) | 業務自動処理の手順定義装置、及び業務自動処理の手順定義システム | |
CN112579944A (zh) | 一种页面跳转处理方法、装置以及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130919 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140206 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140218 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140418 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20141028 |