JP6085067B2 - ユーザデータ更新方法、装置、プログラム、及び記録媒体 - Google Patents

ユーザデータ更新方法、装置、プログラム、及び記録媒体 Download PDF

Info

Publication number
JP6085067B2
JP6085067B2 JP2016526447A JP2016526447A JP6085067B2 JP 6085067 B2 JP6085067 B2 JP 6085067B2 JP 2016526447 A JP2016526447 A JP 2016526447A JP 2016526447 A JP2016526447 A JP 2016526447A JP 6085067 B2 JP6085067 B2 JP 6085067B2
Authority
JP
Japan
Prior art keywords
matching
sentence
user data
text string
sentences
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016526447A
Other languages
English (en)
Other versions
JP2016526246A (ja
Inventor
磊 ▲張▼
磊 ▲張▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiaomi Inc
Original Assignee
Xiaomi Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiaomi Inc filed Critical Xiaomi Inc
Publication of JP2016526246A publication Critical patent/JP2016526246A/ja
Application granted granted Critical
Publication of JP6085067B2 publication Critical patent/JP6085067B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/197Version control
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • G06F16/90344Query processing by using string matching techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/418Document matching, e.g. of document images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/169Annotation, e.g. comment data or footnotes

Description

本願は出願番号が201410260916.0であり、出願日が2014年6月12日である中国特許出願に基づくものであり、当該中国特許出願の優先権を主張する。当該中国特許出願の全ての内容は参照として本願に引用される。
本発明は電子出版物分野に関する。特にユーザデータ更新方法装置、プログラム、及び記録媒体に関するものである。
電子出版物には改訂周期が短く、改訂コストが低いというメリットがあり、益々人々に受け入れられている。ユーザは、電子出版物を閲読する際、例えばしおり、注釈及び要約などのユーザデータを作成することができる。これらのユーザデータは、引用内容及び該引用内容に対するユーザ閲読情報を含む。
ユーザデータにおける引用内容は、通常物理オフセット量で表示される。即ち、一つの引用内容は、位置と長さで表示することができ、ここで「位置」は、引用内容が一冊の電子出版物における本文のオフセット位置を表し、「長さ」は引用内容の本文の長さを表す。例えば、一つの注釈を、「引用内容(120305個目の文字、全部で32個の文字)、注釈内容(この段落はとてもよく書けている)」に表示することができる。しかしながら、電子出版物は複数回改訂する可能性があり、電子出版物の内容を添削した後、物理オフセット量で示した引用内容は変化する可能性が高い。従って、関連技術は、電子出版物に改訂が生じたとき、パッチファイルに類似する方法で各バージョンの詳細な改訂記録を記録し、該改訂記録を通じてユーザデータにおける引用内容を新たに計算する、ユーザデータ更新方法を提供している。
発明者は、本発明を実現する過程において、上述した方法には少なくとも以下のような問題が存在することに気がついた。パッチファイルは作成時の計算コストがとても高く、且つ単独でメンテナンスする必要があるため、上述したユーザデータ更新方法は大範囲での使用に不適である。
本発明の実施例は、関連技術における、パッチファイルは作成時の計算コストがとても高く、且つ単独でメンテナンスする必要があるため、上述したユーザデータ更新方法は大範囲での使用に不適であるという問題を解決するために、ユーザデータ更新方法、装置、プログラム、及び記録媒体を提供する。前記技術案は以下の通りである。
本発明の実施例の第一の態様によれば、提供されたユーザデータ更新方法は、
ユーザデータにおける引用内容が改訂前の電子出版物において対応する原文文字列を取得し、
改訂後の該電子出版物において、該原文文字列に対しマッチングを行い、
マッチングが成功した時、マッチング結果に基づいて該ユーザデータにおける引用内容を更新し、更新された該ユーザデータを得ることを含む。
一つの実施例において、前記改訂後の該電子出版物において、該原文文字列に対しマッチングを行うことは、
改訂後の該電子出版物において、該原文文字列に対し直接マッチングを行い、又は、
該原文の文字列を分割し、順に排列されたn個(nは正整数であり)の文を獲得し、改訂後の該電子出版物において順に該n個の文に対しマッチングを行い、又は、
改訂後の該電子出版物において、該原文文字列に対し直接マッチングを行い、直接マッチングが成功しなかったとき、該原文文字列を分割し、順に排列されたn個(nは正整数であり)の文を獲得し、改訂後の該電子出版物において順に該n個の文に対しマッチングを行うことを含む。
また、一つの実施例において、改訂後の該電子出版物において、順に該n個の文に対しマッチングを行うことは、
サーチ開始位置からi(1≦i≦nであり)個目の文に対しマッチングを行い、i=1の場合、該サーチ開始位置は該原文文字列が属する章節の開始位置であり、
該i個目の文に対するマッチングが成功したとき、該サーチ開始位置を該i個目の文のマッチング内容の終了位置に更新し、更新後の該サーチ開始位置からi+1(i+1≦n)個目の文に対しマッチングを行い、
該i個目の文に対するマッチングが成功しなかったとき、該i個目の文に対応するサーチ位置からi+1個目の文に対しマッチングを行い、
該n個の文のすべてに対するマッチングを行った後、該n個の文と完全マッチングするマッチング内容が存在する、又は該n個の文と部分マッチングするが、マッチング程度が所定のマッチング範囲内であるマッチング内容が存在する場合、分割マッチングの成功を確定することを含む。
また、一つの実施例において、該方法は更に、
該n個の文においてマッチング成功した最初の文が1個目の文でない場合、該1個目の文から該マッチング成功した最初の文の前の全ての文を単語に分割し、順に排列されたm(mは正整数であり)個の単語を獲得し、
該マッチング成功した最初の文のマッチング内容の開始位置から開始し、逆順に該m個の単語に対しマッチングを行い、
マッチング成功した最後の単語のマッチング内容の開始位置を、該原文文字列が改訂後の該電子出版物において対応する開始位置とすることを含む。
また、一つの実施例において、該方法は更に、
該n個の文においてマッチング成功した最後の文がn個目の文でない場合、該マッチング成功した最後の文の後から該n個目までの全ての文を単語に分割し、順に排列されたq(qは正整数であり)個の単語を獲得し、
該マッチング成功した最後の文のマッチング内容の終了位置から開始し、順に該q個の単語に対しマッチングを行い、
マッチング成功した最後の単語のマッチング内容の終了位置を、該原文文字列が改訂後の該電子出版物において対応する終了位置とすることを含む。
本発明の実施例の第二の態様によれば、ユーザデータ更新装置であって、前記装置は、
ユーザデータにおける引用内容が改訂前の電子出版物において対応する原文文字列を取得する取得モジュールと、
改訂後の該電子出版物において、該原文文字列に対しマッチングを行うマッチングモジュールと、
マッチングが成功した時、マッチング結果に基づいて該ユーザデータにおける引用内容を更新し、更新された該ユーザデータを得る更新モジュールとを備えるユーザデータ更新装置が提供される。
一つの実施例において、該マッチングモジュールは、改訂後の該電子出版物において、該原文文字列に対し直接マッチングを行うように配置され、又は、
該マッチングモジュールは、該原文文字列を分割し、順に排列されたn個(nは正整数であり)の文を獲得し、改訂後の該電子出版物において順に該n個の文に対しマッチングを行うように配置され、又は、
該マッチングモジュールは、改訂後の該電子出版物において該原文文字列に対し直接マッチングを行い、直接マッチングが成功しなかったとき、該原文文字列を分割し、順に排列されたn個(nは正整数であり)の文を獲得し、改訂後の該電子出版物において順に該n個の文に対しマッチングを行うように配置されている。
また、一つの実施例において、該マッチングモジュールは、マッチングユニットと、位置更新ユニットと、継続マッチングユニットと、確定ユニットとを備える。
マッチングユニットは、サーチ開始位置からi個目の文に対しマッチングを行うように配置され、ここで1≦i≦nであり、i=1の場合、該サーチ開始位置は該原文文字列が属する章節の開始位置であり、
位置更新ユニットは、該i個目の文に対するマッチングが成功した時、該サーチ開始位置を該i個目の文のマッチング内容の終了位置に更新し、更新後の該サーチ開始位置からi+1個目の文に対しマッチングを行うように配置され、ここで、i+1≦nであり、
継続マッチングユニットは、該i個目の文に対するマッチングが成功しなかったとき、該i個目の文に対応するサーチ位置からi+1個目の文に対しマッチングを行うように配置され、
確定ユニットは、該n個の文のすべてに対するマッチングを行った後、該n個の文と完全マッチングするマッチング内容が存在する、又は該n個の文と部分マッチングするが、マッチング程度が所定のマッチング範囲内であるマッチング内容が存在するとき、分割マッチングの成功を確定するように配置されている。
また、一つの実施例において、該装置は更に、第一の単語分割ユニットと、単語マッチングユニットと、開始確定ユニットとを備える。第一の単語分割ユニットは、該n個の文においてマッチング成功した最初の文が1個目の文でない場合、該1個目の文から該マッチング成功した最初の文の前までの全ての文を単語に分割し、順に排列されたm個の単語を得るように配置され、ここでmは正整数であり、
単語マッチングユニットは、該マッチング成功した最初の文のマッチング内容の開始位置から開始し、逆順に該m個の単語に対しマッチングを行うように配置され、
開始確定ユニットは、マッチング成功した最後の単語のマッチング内容の開始位置を、原文文字列が改訂後の該電子出版物において対応する開始位置とするように配置されている。
また、一つの実施例において、
第二単語分割ユニットは、該n個の文においてマッチング成功した最後の文がn個目の文でない場合、該マッチング成功した最後の文の後から該n個目までの全ての文を単語に分割し、順に排列されたq個の単語を得るように配置され、ここでqは正整数であり、
単語マッチングユニットは、該マッチング成功した最後の文のマッチング内容の終了位置から開始し、順に該m個の単語に対しマッチングを行うように配置され、
終了確定ユニットは、マッチング成功した最後の単語のマッチング内容の終了位置を、該原文文字列が改訂後の該電子出版物において対応する終了位置とするように配置されている。
本発明の実施例の第三の態様によれば、ユーザデータ更新の装置であって、前記装置は、
プロセッサと、
プロセッサが実行可能なコマンドを記憶するためのメモリとを備えるユーザデータ更新装置が提供され、
ここで、前記プロセッサは、
ユーザデータにおける引用内容が改訂前の電子出版物において対応する原文文字列を取得し、
改訂後の該電子出版物において、該原文文字列に対しマッチングを行い、
マッチングが成功した時、マッチング結果に基づいて該ユーザデータにおける引用内容を更新し、更新された該ユーザデータを得るように配置される。
本発明の実施例の第四の態様によれば、プロセッサに実行されることにより、前記のユーザデータ更新方法を実現するプログラムを提供する。
本発明の実施例の第五の態様によれば、前記のプログラムが記録された記録媒体を提供する。
本発明の実施例が提供する技術案は下記のような有益な効果を含むことができる。
ユーザデータにおける引用内容が改訂前の電子出版物において対応する原文文字列を取得することを通じて、改訂後の該電子出版物において、該原文文字列に対しマッチングを行い、マッチングが成功した時、マッチング結果に基づいて該ユーザデータにおける引用内容を更新し、更新された該ユーザデータを得る。本発明の実施例が提供するユーザデータ更新方法を採用することで、パッチファイルを作成する計算コストを節約し、且つ本発明の実施例が提供するユーザデータ更新方法は単独でメンテナンスする必要がなく、比較的広範囲に使用できる。
また、一般的な説明及び以下の詳細な説明は単なる例示及び解釈に過ぎず、本発明を限定するものではないことを理解すべきである。
本願の図面は明細書に取り込まれて明細書の一部を構成し、本発明に合致する実施例を示し、また、明細書と共に本発明の原理の解釈に用いられる。
本発明の各実施例が提供するユーザデータ更新方法に関わる実施環境の構造の模式図である。 一つの例示的な実施例にかかるユーザデータ更新方法の方法フローチャートである。 他の一つの例示的な実施例にかかるユーザデータ更新方法の方法フローチャートである。 本発明の実施例が提供する、改訂前の電子出版物の一つの章節と改訂後の電子出版物において対応する章節の模式図である。 他の一つの例示的な実施例にかかるユーザデータ更新方法の方法フローチャートである。 本発明の実施例が提供する、改訂前の電子出版物の一つの章節と改訂後の電子出版物において対応する章節の模式図である。 他の一つの例示的な実施例にかかるユーザデータ更新方法の方法フローチャートである。 本発明の実施例が提供する、改訂前の電子出版物の一つの章節と改訂後の電子出版物において対応する章節の模式図である。 一つの例示的な実施例にかかるユーザデータ更新装置のブロック図である。 一つの例示的な実施例にかかる、ユーザデータ更新に使われる装置のブロック図である。 一つの例示的な実施例にかかる、ユーザデータ更新に使われる装置のブロック図である。
上記の図面を通じて、既に本発明の明確な実施例を示しているが、以下において更に詳細に説明する。これらの図面と文字による説明は、如何なる方式によっても本発明の思想の範囲を限定するためのものでなく、特定の実施例を参考することで当業者に対し本発明の概念を説明するためのものである。
ここでは例示的な実施例について詳細な説明を行う。このような例示は図面に表される。以下における説明が図面に関わるとき、特に示さない限り、異なる図面における同じ数字は同じ又は類似の要素を表す。以下の例示的な実施例において説明される実施形態は本発明と一致する全ての実施形態を代表するものではない。これらは特許請求の範囲において詳述した、本発明の一部と一致する装置と方法の例等に過ぎない。
本発明の実施例に対し詳細な解釈と説明を行う前に、本発明が関わるユーザデータについて説明する。本発明の実施例において、ユーザデータには、引用内容及び該引用内容に対するユーザ閲読情報が含まれる。該ユーザデータはしおり、要約又は注釈のいずれか一つの種類であってもよい。
例えば、しおりは「120305個目の文字、3個目のしおり」であってもよく、引用内容「120305個目の文字」はユーザが前回、120305個目の文字の位置まで閲読したことを表すためのものであり、ユーザ閲読情報「3個目のしおり」は当該本における3個目のしおりであることを表すためのものである。
また例えば、要約は「120305個目の文字、全部で32個の文字、第1の要約」であってもよく、引用内容「120305個目の文字、全部で32個の文字」は該ユーザデータが120305個目の文字の位置から始まり、全部で32個の文字の長さであることを表すためのものであり、ユーザ閲読情報「1個目のしおり」は、これが当該本における1個目のしおりであることを表すためのものであり、又は、引用内容は更に「120305個目の文字、120337個目の文字」であってもよく、該ユーザデータは120305個目の文字の位置から始まり、120337個目の文字の位置で終了することを表す。
また例えば、注釈は「120305個目の文字、全部で32個の文字、この段落はとてもよく書けている」であってもよく、引用内容「120305個目の文字、全部で32個の文字」は、該注釈の引用内容が120305個目の文字の位置から始まり、全部で32個の文字の長さであることを表すためのものであり、ユーザ閲読情報「この段落はとてもよく書けている」は、該引用内容に対するユーザの注釈内容であり、又は、引用内容は更に「120305個目の文字、120337個目の文字」であってもよく、該注釈の引用内容は120305個目の文字の位置から始まり、120337個目の文字の位置で終了することを表す。
図1は本発明の各実施例が提供するユーザデータ更新方法に関わる実施環境の構造模式図である。該実施環境には少なくとも一つの端末120及び少なくとも一つのサーバ140が含まれる。
端末120は、閲読機能を有する電子デバイスであってもよく、該電子デバイスはスマートフォン、タブレットPC、スマートテレビ又は電子書籍リーダーなど等であってもよい。
端末120とサーバ140の間は無線ネットワークを通じて連結可能である。
サーバ140は、一台のサーバ、又は数台のサーバから組成されたサーバファーム、又は一つのクラウドサーバであってもよい。該サーバ140は、端末120にユーザデータを更新するサービスを提供することができるサーバである。
図2は一つの例示的な実施例にかかるユーザデータ更新方法のフローチャートである。図2に示すように、本実施例は該方法を図1に示すような端末に応用することを例として説明を行う。該方法のプロセスは以下のようなステップを含む。
ステップ201において、ユーザデータにおける引用内容が改訂前の電子出版物において対応する原文文字列を取得する。
ステップ202において、改訂後の該電子出版物において、該原文文字列に対しマッチングを行う。
ステップ203において、マッチングが成功した時、マッチング結果に基づいて該ユーザデータにおける引用内容を更新し、更新された該ユーザデータを得る。
本発明の実施例が提供するユーザデータ更新方法は、ユーザデータにおける引用内容が改訂前の電子出版物において対応する原文文字列を取得し、改訂後の該電子出版物において、該原文文字列に対しマッチングを行い、マッチングが成功した時、マッチング結果に基づいて該ユーザデータにおける引用内容を更新し、更新された該ユーザデータを得る。本発明の実施例が提供するユーザデータ更新方法を採用することで、パッチファイルを作成する計算コストを節約し、且つ本発明の実施例が提供するユーザデータ更新方法は単独でメンテナンスする必要がなく、比較的広範囲に使用可能である。
上述したステップ202は、以下の3つの実現方法がある。
一つ目は、改訂後の電子出版物において、原文文字列に対し直接マッチングを行う、直接マッチング方法であり、
2つ目は、原文文字列を分割し、順に排列されたn個(nは正整数であり)の文を獲得し、改訂後の電子出版物において順にn個の文に対しマッチングを行う単語分割マッチング方法であり、
3つ目は、直接マッチング方法と単語分割マッチング方法の組み合わせである。
3つ目の方法では、改訂後の電子出版物において原文文字列に対し直接マッチングを行い、直接のマッチングが成功しなかったとき、原文文字列を分割し、順に排列されたn(nは正整数であり)個の文を獲得し、改訂後の電子出版物において順にn個の文に対しマッチングを行う。
以下では、三つの異なる実施例を採用して上述した3種類の方法それぞれについて説明を行う。
図3aは他の一つの例示的な実施例にかかるユーザデータ更新方法のフローチャートである。図3aに示すように、本実施例は該方法を図1に示すような端末に応用し、端末は直接マッチング方法を採用することを例として説明を行う。該方法のプロセスは以下のようなステップを含む。
ステップ3a01において、ユーザデータにおける引用内容が改訂前の電子出版物において対応する原文文字列を取得する。
本実施例において、端末が取得したユーザデータにおける引用内容に対応する原文文字列はしおり、要約又は注釈のいずれか一つの種類に対応する原文文字列であってもよい。
本実施例において、端末は該ユーザデータにおける引用内容が改訂前の電子出版物において対応する原文文字列を取得する際、以下のような2種類の取得方法を有する。
第一の方法では、端末は引用内容の開始位置と長さに基づいて該原文文字列を取得する。
例えば、引用内容が「120305個目の文字、全部で32個の文字」である場合、端末は現在の章節の120305個目の文字の位置から開始し、該120305個目の文字の後の、32個の文字の長さを有する文字列を取得し、該引用内容に対応する原文文字列の取得を実現する。
第二の方法では、端末は引用内容の開始位置と終了位置に基づいて該原文文字列を取得する。
例えば、引用内容が「120305個目の文字、120337個目の文字」である場合、端末は現在の章節の120305個目の文字の位置から120337個目の文字の位置までの間の文字列を取得し、該引用内容に対応する原文文字列の取得を実現する。
Figure 0006085067
ステップ3a02において、改訂後の該電子出版物において、該原文文字列に対し直接マッチングを行う。
端末が原文文字列を取得した場合、端末は改訂後の電子出版物において、改訂前の電子出版物の一つの章節に対応する章節の開始位置から始まり、取得した原文文字列の長さをサーチ長さに、該特定章節に対応する章節において該原文文字列に対しサーチを行い、該原文文字列に対するマッチングを実現する。
Figure 0006085067
ステップ3a03において、マッチング成功したとき、マッチング結果に基づいて該ユーザデータにおける引用内容を更新し、更新された該ユーザデータを得る。
端末が原文文字列に対しマッチング成功したとき、端末はマッチングして得た文字列の位置情報に基づいて、該文字列に対応するユーザデータの引用内容を更新し、更新されたユーザデータを得る。ここで、該位置情報は、マッチングして得た文字列が改訂後の電子出版物における開始位置と、マッチングして得た文字列が改訂後の電子出版物における終了位置であってもよく、又は、該位置情報は、マッチングして得た文字列が改訂後の電子出版物における開始位置と、マッチングして得た文字列が改訂後の電子出版物における本文の長さであってもよい。
例えば、ユーザデータがしおりである場合、端末は該しおりの位置に基づいて、改訂後の電子出版物の対応する位置にしおりを追加する。ユーザデータが要約である場合、端末は、該要約の開始位置と該要約に対応する引用内容に基づいて、改訂後の電子出版物の対応する位置に要約を追加する。ユーザデータが注釈である場合、端末は該注釈の開始位置、引用内容及び該注釈の内容に基づいて、改訂後の電子出版物の対応する位置に注釈を追加する。
Figure 0006085067
本発明の実施例が提供するユーザデータ更新方法は、ユーザデータにおける引用内容が改訂前の電子出版物において対応する原文文字列を取得することを通じて、改訂後の該電子出版物において、該原文文字列に対し直接マッチングを行い、マッチングが成功した時、マッチング結果に基づいて該ユーザデータにおける引用内容を更新し、更新された該ユーザデータを得る。本発明の実施例が提供するユーザデータ更新方法を採用することで、パッチファイルを作成する計算コストを節約し、且つ本発明の実施例が提供するユーザデータ更新方法は単独でメンテナンスする必要がなく、比較的広範囲に使用可能である。
直接マッチング方法は、原文文字列が未改訂の場合のみに適用されるため、原文文字列が改訂された場合は、マッチングは成功できない。従って、以下のような実施例を提供する。
図4aは他の一つの例示的な実施例にかかるユーザデータ更新方法のフローチャートである。図4aに示すように、本実施例は該方法を図1に示すような端末に応用し、且つ端末は分割マッチング方法を採用することを例として説明を行う。該方法のプロセスは以下のようなステップを含む。
ステップ4a01において、端末はユーザデータにおける引用内容が改訂前の電子出版物において対応する原文文字列を取得する。
該ステップ4a01と上述した図3aに示す実施例におけるステップ3a01は同一又は類似しており、本実施例ではこれについて繰り返し説明しない。
ステップ4a02において、端末は該原文文字列を分割し、順に排列されたn個の文を得る。ここでnは正整数である。
Figure 0006085067
ステップ4a03において、端末は改訂後の該電子出版物において、順にn個の文に対しマッチングを行う。
端末は改訂後の電子出版物において、サーチ開始位置からi個目の文に対しマッチングを行う。ここで1≦i≦nである。i=1の場合、該サーチ開始位置は該原文文字列が属する章節の開始位置である。i個目の文に対するマッチング成功した場合、端末は該サーチ開始位置を該i個目の文のマッチング内容の終了位置に更新し、更新後の該サーチ開始位置からi+1個目の文に対しマッチングを行う。ここでi+1≦nである。i個目の文に対するマッチングが成功しなかった場合、該i個目の文に対応するサーチ位置からi+1個目の文に対しマッチングを行う。
ここで説明しなければならないのは、該n個の文のすべてに対するマッチングを行った後、該n個の文と完全マッチングするマッチング内容が存在する場合、又は該n個の文と部分マッチングするが、マッチング程度が所定のマッチング範囲内であるマッチング内容が存在する場合、文のマッチングが成功したことを確定するということである。ここで、該所定のマッチング範囲は、マッチングして得た文の正確性を判断し、その目的は不完全な類似文字列をマッチングして得ることを避けると同時に、過度に長い類似文字列をマッチングして得ることを避けることにある。該所定のマッチング範囲は80%×Len1≦Len2≦120%×Len1で表示することができる。ここで、Len1は原文文字列の本文の長さで、Len2はマッチングして得た文字列の長さである。
Figure 0006085067
Figure 0006085067
上述した列挙過程において、文字列の本文の長さが56.4より大きい又は37.5より小さい長さしか端末はマッチングできなかった場合、マッチングは失敗する。該マッチングの具体的な過程は上述した例と同じ道理であり、ここでは繰り返し説明しない。
ステップ4a04において、マッチングが成功した時、端末はマッチング結果に基づいて該ユーザデータにおける引用内容を更新し、更新された該ユーザデータを得る。
該ステップ4a04と上述した図3aに示す実施例におけるステップ3a03は同一又は類似し、本実施例はこれについて繰り返し説明しない。
本発明の実施例が提供するユーザデータ更新方法は、ユーザデータにおける引用内容が改訂前の電子出版物において対応する原文文字列を取得することを通じて、該原文文字列を分割し、順に排列されたn個の文を得る。ここでnは正整数である。改訂後の該電子出版物において順に該n個の文に対しマッチングを行い、マッチングが成功した時、マッチング結果に基づいて該ユーザデータにおける引用内容を更新し、更新された該ユーザデータを得る。本発明の実施例が提供するユーザデータ更新方法を採用することで、パッチファイルを作成する計算コストを節約し、且つ本発明の実施例が提供するユーザデータ更新方法は単独でメンテナンスする必要がなく、比較的広範囲に使用可能である。
本発明の実施例が提供するユーザデータ更新方法は、更に分割マッチング方法を通じて、原文文字列に文レベルの変化が生じたとしても、マッチング過程を完成させることができる効果を奏する。
本発明の実施例が提供するユーザデータ更新方法は、更にマッチング程度と所定のマッチング範囲との間の関係を判断した後、判断結果に基づいてユーザデータの引用内容を更新することを通じて、更新されたユーザデータの正確性を高めることができる。
分割マッチング方法は、原文文字列において文レベルの改訂が生じた場合のみに適用されるため、原文文字列に文字レベルの改訂が生じた場合は、マッチングは成功できない。従って、以下のような実施例を提出する。
図5aは他の一つの例示的な実施例にかかるユーザデータ更新方法の方法フローチャートである。図5aに示すように、本実施例は該方法を図1に示すような端末に応用し、端末は直接マッチング方法と分割マッチング方法の二つを組み合わせた方法を採用し、且つ分割マッチングが成功しなかった場合は更に単語分割マッチング方法を採用することを例として説明を行う。該方法のプロセスは以下のようなステップを含む。
ステップ5a01において、ユーザデータにおける引用内容が改訂前の電子出版物において対応する原文文字列を取得する。
該ステップ5a01と上述した図3aに示す実施例におけるステップ3a01は同一又は類似しており、本実施例はこれについて繰り返し説明しない。
ステップ5a02において、改訂後の該電子出版物において、該原文文字列に対し直接マッチングを行う。
Figure 0006085067
ステップ5a03において、直接マッチングが成功しなかった場合、該原文文字列を分割し、順に排列されたn個の文を得る。ここでnは正整数である。
Figure 0006085067
ステップ5a04において、改訂後の該電子出版物において、順にn個の文に対しマッチングを行う。
端末はサーチ開始位置からi個目の文に対しマッチングを行う。ここで1≦i≦nである。i=1の場合、該サーチ開始位置は該原文文字列が属する章節の開始位置であり、該i個目の文に対するマッチング成功した場合、該サーチ開始位置を該i個目の文のマッチング内容の終了位置に更新し、更新後の該サーチ開始位置からi+1個目の文に対しマッチングを行う。ここでi+1≦nである。該i個目の文に対するマッチングが成功しなかった場合、該i個目の文に対応するサーチ位置からi+1個目の文に対しマッチングを行う。
Figure 0006085067
ステップ5a05において、該n個の文においてマッチング成功した最初の文が1個目の文でない場合、該1個目の文から該マッチング成功した最初の文の前までの全ての文を単語に分割し、順に排列されたm個の単語を得る。ここでmは正整数である。
端末が原文文字列の文に対しマッチングを行う場合、該原文文字列の1個目の文のマッチング成功しなかったら、端末は該原文文字列における最初のマッチング成功した文と該原文文字列の1個目の文との間の全ての文を単語に分割し、m個の単語を得る。ここで該mは正整数である。
Figure 0006085067
Figure 0006085067
ステップ5a06において、該マッチング成功した最初の単語のマッチング内容の開始位置から開始し、逆順に該m個の単語に対しマッチングを行い、マッチング成功した最後の単語のマッチング内容の開始位置を、原文文字列が改訂後の該電子出版物において対応する開始位置とする。
端末は該マッチング成功した最初の文のマッチング内容の開始位置から開始し、逆順に該m個の単語に対しマッチングを行い、即ち端末はまず最後の一つの単語に対しマッチングを行い、続いて最後から二番目の単語に対しマッチングを行い、順次類推して、端末は最後に1個目の単語に対しマッチングを行う。
ここで説明しなければならないのは、端末は該m個の単語に対しマッチングを行う場合、該章節において最初にマッチング成功した文の前の内容において、該m個の単語に対しマッチングを行うということである。
更に、該m個の単語に全てマッチングをした後、該m個の単語と完全マッチングするマッチング内容が存在する場合、又は該m個の単語と部分マッチングするが、マッチング程度が第一所定のマッチング範囲内であるマッチング内容が存在する場合、単語分割マッチング成功したことを確定し、端末は最後にマッチング成功した単語の位置を、原文文字列が改訂後の該電子出版物において対応する開始位置とする。またマッチング程度が第一所定のマッチング範囲内に属さないマッチング内容である場合、単語分割マッチングに失敗したことを確定し、端末は最初にマッチング成功した文の位置を、原文文字列が改訂後の電子出版物において対応する開始位置とすることを説明しなければならない。ここで、該第一所定のマッチング範囲は、m1≧50%×mであってもよく、 mはステップ5a05におけるmと同一であり、即ちmは最初にマッチング成功した文と該原文文字列の1個目の文との間の全ての文を単語に分割して得た単語の数を表し、m1はマッチングして得た単語の数を表す。
Figure 0006085067
Figure 0006085067
以上において、該6個の単語に対しマッチングを行う際、部分的な単語はマッチング成功しておらず、従って、部分マッチングに属し、端末は該マッチング程度と第一所定のマッチング範囲との間の関係を計算し、端末は、マッチングに関与した単語は6個で、マッチング成功した単語は2個であり、マッチングに関与した単語の50%は3個で、2<3であることを算出することができる。従って、単語分割マッチングは失敗し、端末は原文文字列が改訂後の該電子出版物において対応する開始位置を更新せず、即ち、端末は「及」を原文文字列が改訂後の該電子出版物において対応する開始位置とする。
ここで説明しなければならないのは、端末が、マッチング成功した単語の数が3以上であることを算出した場合、単語分割マッチングは成功し、この場合、端末は原文文字列が改訂後の該電子出版物における開始位置を最後のマッチング成功した単語の位置に変更する必要があるということである。
ステップ5a07において、該n個の文においてマッチング成功した最後の文がn個目の文でない場合、該マッチング成功した最後の文の後から該n個目の文までの全ての文を単語に分割し、順に排列されたq個の単語を得る。ここでqは正整数である。
端末が原文文字列の文に対しマッチングを行う際、該原文文字列のマッチング成功した最後の文がn個目の文でない場合、端末は該マッチング成功した最後の文の後から該n個目までの全ての文を単語に分割し、順に排列されたq個の単語を得る。ここでqは正整数である。
Figure 0006085067
Figure 0006085067
ステップ5a08において、該マッチング成功した最後の文のマッチング内容の終了位置から開始し、該q個の単語に対し順にマッチングを行い、マッチング成功した最後の単語のマッチング内容の終了位置を、該原文文字列が改訂後の該電子出版物において対応する終了位置とする。
端末は該マッチング成功した最後の文のマッチング内容の終了位置から開始し、順に該q個の単語に対しマッチングを行う。
端末は該q個の単語に対しマッチングを行うとき、該章節における最後にマッチング成功した文の後の内容において、該q個の単語に対しマッチングを行うことを説明しなければならない。
更に、該q個の単語に対して全部マッチングを行った後、該q個の単語と完全マッチングするマッチング内容が存在する場合、又は該q個の単語と部分マッチングするが、マッチング程度が第一所定のマッチング範囲に属するマッチング内容が存在する場合、単語分割マッチング成功したことを確定し、端末はマッチング成功した最後の単語の位置を、原文文字列が改訂後の該電子出版物において対応する終了位置とする。またマッチング程度が第一所定のマッチング範囲に属さない場合、単語分割マッチングが失敗したことを確認し、端末はマッチング成功した最後の文の位置を、原文文字列が改訂後の電子出版物において対応する終了位置とすることを説明しなければならない。ここで、該第一所定のマッチング範囲は、q1≧50%×qであってもよく、ここで、qはステップ5a07におけるqと同一であり、即ちqはマッチング成功した最後の文の後からn個目の文までの全ての文を単語に分割して得た単語の数を表し、q1はマッチングして得た単語の数を表す。
Figure 0006085067
Figure 0006085067
以上において該3個の単語に対しマッチングを行う際、部分的な単語はマッチング成功しておらず、従って、部分マッチングに属し、端末は該マッチング程度と第一所定のマッチング範囲を計算し、端末はマッチングに関与した単語は3個で、マッチング成功した単語は2個であり、マッチングに関与した単語の50%は1.5で、2>1.5であることを算出することができる。従って、単語分割マッチングは成功し、端末は該「天下」の終了位置を、原文文字列が改訂後の電子出版物において対応する終了位置とする。
ここで説明しなければならないのは、端末がマッチング成功した単語の数が1.5より小さいことを算出した場合、単語分割マッチングは失敗し、この場合、端末は原文文字列が改訂後の該電子出版物において対応する終了位置を更新せず、即ち端末は「,」を原文文字列が改訂後の該電子出版物において対応する終了位置とするということである。
ステップ5a09において、マッチング程度と所定のマッチング範囲との間の関係を計算し、マッチング程度が所定のマッチング範囲に属す場合、マッチングの成功を確定する。
上述したステップ5a01〜5a08が終了した後、端末はマッチング程度と所定のマッチング範囲との間の対応関係を計算し、マッチング程度が所定のマッチング範囲に属す場合、原文文字列に対するマッチングの成功を確定する。ここで、該所定のマッチング範囲は 80%×Len1≦Len2≦120%×Len1表示することができる。ここで、Len1は原文文字列の本文の長さで、Len2はマッチングして得た文字列の長さである。
Figure 0006085067
ここで説明しなければならないのは、上述した列挙過程において、本文の長さが37.5と56.4の間である文字列を端末がマッチングした場合のみ、マッチングは成功するということである。該マッチングの具体的な過程は上述した例と同じ道理で、ここでは繰り返し説明しない。
ステップ5a10において、マッチングが成功した時、マッチング結果に基づいて該ユーザデータにおける引用内容を更新し、更新された該ユーザデータを得る。
該ステップ5a10と上述した図3aに示す実施例におけるステップ3a03は同一又は類似しており、本実施例ではこれについて繰り返し説明しない。
本発明の実施例が提供するユーザデータ更新方法は、ユーザデータにおける引用内容が改訂前の電子出版物において対応する原文文字列を取得することを通じて、改訂後の該電子出版物において、該原文文字列に対し直接マッチングを行い、直接マッチングが成功しなかったとき、該原文文字列を分割し、順に排列されたn個の文を獲得し、改訂後の該電子出版物において順に該n個の文に対しマッチングを行い、マッチング成功した最初の文が1個目の文でなく、及び/又はマッチング成功した最後の文が該原文文字列の最後の文でない場合、該原文文字列がマッチング成功した最初の文と該原文文字列の1個目の文との間の文、及び最後にマッチング成功した文と該原文文字列の最後の文との間の文に対し単語分割処理を行い、改訂後の対応する章節において、該各単語に対しマッチングを行い、マッチング結果に基づいて該原文文字列に対応するユーザデータを更新する。これでパッチファイルを作成する計算コストを節約し、ユーザデータ更新方法の使用範囲は比較的に広くなり、更に、単語のマッチング程度と第一所定のマッチング範囲との関係を限定することを通じて、更新されたユーザデータの正確性を高めると共に、該ユーザデータ更新方法の完全性を保証した。
ここで説明しなければならないのは、上記の図2〜図5aに示す実施例において、該ユーザデータの引用内容を更新する実行主体は端末であるが、事実上、本発明が提供するその他の実施例において、該ユーザデータの引用内容を更新する実行主体はサーバであってもよく、端末はサーバ側から該更新されたユーザデータの引用内容をダウンロードすることができるということである。
図6は一つの例示的な実施例にかかるユーザデータ更新装置のブロック図である。該ユーザデータ更新装置はソフトウェア、ハードウェア、又は両者の組み合わせを通じて、DLNAサーバの一部分又は全部として実現することができる。該ユーザデータ更新装置は、取得モジュール601、マッチングモジュール602及び更新モジュール603を備えることができる。
取得モジュール601は、ユーザデータにおける引用内容が改訂前の電子出版物において対応する原文文字列を取得するように配置され、該取得モジュール601はマッチングモジュール602と接続し、マッチングモジュール602は、改訂後の該電子出版物において該原文文字列に対しマッチングを行うように配置され、該マッチングモジュール602は更新モジュール603と接続し、更新モジュール603は、マッチングが成功した時、マッチング結果に基づいて該ユーザデータにおける引用内容を更新し、更新された該ユーザデータを得るように配置される。
一つの実施例において、該マッチングモジュール603は、改訂後の該電子出版物において、該原文文字列に対しマッチングを行うように配置され、又は、
該マッチングモジュール603は、該原文文字列を分割し、順に排列されたn個(nは正整数であり)の文を獲得し、改訂後の該電子出版物において順に該n個の文に対しマッチングを行うように配置され、又は、
該マッチングモジュール603は、改訂後の該電子出版物において該原文文字列に対し直接マッチングを行い、直接マッチングが成功しなかった場合、該原文文字列を分割し、順に排列されたn個(nは正整数であり)の文を獲得し、改訂後の該電子出版物において順に該n個の文に対しマッチングを行うように配置される。
また一つの実施例において、該マッチングモジュール603は、マッチングユニットと、位置更新ユニットと、継続マッチングユニットと、確定ユニットとを備える。
マッチングユニットは、サーチ開始位置から、i個目の文に対しマッチングを行うように配置され、ここで1≦i≦nであり、i=1の場合、該サーチ開始位置は該原文文字列が属する章節の開始位置であり、
位置更新ユニットは、該i番目の文に対するマッチングが成功した時、該サーチ開始位置を該i個目の文のマッチング内容の終了位置に更新し、更新後の該サーチ開始位置からi+1個目の文に対しマッチングを行うように配置され、ここでi+1≦nであり、
継続マッチングユニットは、該i個目の文に対するマッチングが成功しなかったとき、該i番目の文に対応するサーチ位置からi+1個目の文に対しマッチングを行うように配置され、
確定ユニットは、該n個の文のすべてに対するマッチングを行った後、該n個の文と完全マッチングするマッチング内容が存在する場合、又は該n個の文と部分マッチングするが、マッチング程度が所定のマッチング範囲に属すマッチング内容が存在する場合、分割マッチングの成功を確定するように配置されている。
また一つの実施例において、該装置は更に、
該n個の文においてマッチング成功した最初の文が1個目の文でない場合、該1個目の文から該マッチング成功した最初の文の前までの全ての文を単語に分割し、順に排列されたm(mは正整数であり)個の単語を得るように配置された第一の単語分割ユニットと、
該マッチング成功した最初の文のマッチング内容の開始位置から開始し、該m個の単語に対し逆順にマッチングを行うように配置された単語マッチングユニットと、
マッチング成功した最後の単語のマッチング内容の開始位置を、改訂後の該電子出版物における、原文文字列に対応する開始位置とするように配置された開始確定ユニットとを備える。
また一つの実施例において、
第二単語分割ユニットは、該n個の文においてマッチング成功した最後の文が第n個目の文でない場合、該マッチング成功した最後の文の後から該第n個目までの全ての文を単語に分割し、順に排列されたq(ここでqは正整数であり)個の単語を得るように配置され、
単語マッチングユニットは、該マッチング成功した最後の文のマッチング内容の終了位置から開始し、該m個の単語に対し順にマッチングを行うように配置され、
終了確定ユニットは、マッチング成功した最後の単語のマッチング内容の終了位置を、改訂後の該電子出版物における、原文文字列に対応する終了位置とするように配置される。
本発明の実施例が提供するユーザデータ更新装置は、ユーザデータにおける引用内容が改訂前の電子出版物において対応する原文文字列を取得し、改訂後の該電子出版物において、該原文文字列に対しマッチングを行い、マッチングが成功した時、マッチング結果に基づいて該ユーザデータにおける引用内容を更新し、更新された該ユーザデータを得る。本発明の実施例が提供するユーザデータ更新方法を採用することで、パッチファイルを作成する計算コストを節約し、且つ本発明の実施例が提供するユーザデータ更新方法は単独でメンテナンスする必要がなく、比較的広範囲に使用可能である。
上述した実施例における装置に関しては、各モジュールが操作を実行する具体的な形態は、既に上記方法に関連する実施例において詳細な説明を行っており、ここでは繰り返し説明しない。
図7は一つの例示的な実施例にかかる、ユーザデータ更新に使われる装置700のブロック図である。例えば、装置700は携帯電話、コンピュータ、デジタル放送端末、メッセージ送受信設備、ゲームコンソール、タブレット設備、医療設備、フィットネス設備、パーソナルデジタルアシスタント等であってもよい。
図7に示すように、装置700は、処理ユニット702、メモリ704、電源ユニット706、マルチメディアユニット708、オーディオユニット710、入力/出力(I/O)のインターフェース712、センサユニット714、及び通信ユニット716の一つ又は複数ユニットを含むことができる。
処理ユニット702は通常の場合、例えば表示、電話の呼び出し、データ通信、カメラ操作及び記録操作と関わりのある、装置700の全ての操作を制御する。処理ユニット702は一つ又は複数のプロセッサ720でコマンドを実行することができ、これにより、上述した方法の全部又は一部ステップを完成する。また、処理ユニット702はその他のユニットとのやり取りを行うため、一つ又は複数のモジュールを含むことができる。例えば、処理ユニット702はマルチメディアユニット708とのやり取りを行うため、マルチメディアモジュールを含むことができる。
メモリ704は、装置700において、操作を実行するため、各種のデータを記憶するように配置されている。これらのデータの例示は、装置700において操作する任意のアプリケーションプログラム又は方法のコマンド、連絡先データ、電話帳データ、メッセージ、画像、映像等を含む。メモリ704は、スタティックランダムアクセスメモリ(SRAM)、電気的に書き込みと消去が可能なROM(EEPROM)、電気的に書き込み可能なROM(EPROM)、書き込み可能メモリ(PROM)、読み出し専用メモリ(ROM)、磁気メモリ、フラッシュメモリ、磁気ディスク又は光ディスク等の全ての種類の揮発性もしくは不揮発性メモリ、又はそれらの組み合わせにより実現することができる。
電源ユニット706は装置700における各種ユニットに給電する。電源ユニット706は電源管理システム、一つ又は複数の電源、並びに装置700のために電力の生成、管理及び分配と関連するその他のユニットを含むことができる。
マルチメディアユニット708は、前記装置700とユーザとの間で出力インターフェースを提供するスクリーンを含む。一部の実施例において、スクリーンは液晶ディスプレイ(LCD)及びタッチパネル(TP)を含むことができる。スクリーンがタッチパネルを含む場合、ユーザからの入力信号を受信するために、スクリーンはタッチスクリーンとして実現することができる。タッチ、スワイプ及びタッチパネル上の手の動きを感知するために、タッチパネルは一つ又は複数のタッチセンサを含んでいる。前記タッチセンサはタッチ又はスワイプ操作の境目を感知するだけでなく、前記タッチ又はスワイプ操作の持続時間及び圧力も感知する。一部の実施例において、マルチメディアユニット708は一つのフロントカメラ及び/又はバックカメラを含む。装置700が、例えば撮影モード又は映像モードなどの操作モードにある場合、フロントカメラ及び/又はバックカメラは外部のマルチメディアデータを受信することができる。それぞれのフロントカメラ及びバックカメラは一つの固定の光学レンズシステム又は、焦点距離及び光学ズーム機能を有するものであってもよい。
オーディオユニット710はオーディオ信号を出力及び/又は入力するように配置されている。例えば、オーディオユニット710は一つのマイクロフォン(MIC)を含んでおり、装置700が呼び出しモード、記録モード及び音声認識モードのような操作モードにある場合、マイクロフォンは外部のオーディオ信号を受信するように配置されている。受信したオーディオ信号は更にメモリ704に記憶されるか、又は通信ユニット716を経由して送信することができる。一部の実施例において、オーディオユニット710は更に一つの、オーディオ信号を出力するためのスピーカーを含む。
I/Oインターフェース712は、処理ユニット702と周辺インターフェースモジュールの間でインターフェースを提供し、上述した周辺インターフェースモジュールはキーボード、クリックホイール、ボタンなどであってもよい。これらのボタンにはホームページボタン、音量ボタン、起動ボタン及びロックボタンが含まれるが、これに限定されない。
センサユニット714は、装置700に各方面の状態の評価を提供するために、一つ又は複数のセンサを含んでいる。例えば、センサユニット714は装置700のオン/オフ状態、ユニットの相対位置を感知することができる。前記ユニットは例えば、装置700のディスプレイ及びキーパッドであってもよく、センサユニット714は更に、装置700又は装置700の一つのユニットの位置変化、ユーザと装置700の接触の有無、装置700の方位又は加速/減速及び、装置700の温度変化を検出することができる。センサユニット714は接近センサを含むことができ、これは如何なる物理的接触がない場合においても付近の物体の存在を検出するように配置されている。センサユニット714は更に、イメージング応用において使用される、CMOS又はCCDイメージセンサのような光センサを含むことができる。一部の実施例において、該センサユニット714は更に、加速度センサ、ジャイロセンサ、磁気センサ、圧力センサ又は温度センサを含むことができる。
通信ユニット716は、装置700がその他の設備と有線又は無線方式の通信をするように配置されている。装置700は、例えばWiFi、2G若しくは3G、又はそれらの組み合わせなどの、通信規格に準拠した無線ネットワークに接続することができる。一つの例示的な実施例において、通信ユニット716は放送チャンネルを経由して、外部の放送管理システムからの放送信号又は、放送関連情報を受信する。一つの例示的な実施例において、前記通信ユニット716は更に近距離通信を促進するための近距離無線通信(NFC)モジュールを含んでいる。例えば、NFCモジュールは、無線周波数識別(RFID)技術、赤外線データ協会(IrDA)技術、超広帯域(UWB)技術、ブルートゥース(BT)技術及びその他の技術に基づき、実現することが可能である。
例示的な実施例において、装置700は一つ又は複数の特定の用途向け集積回路(ASIC)、デジタル信号プロセッサ(DSP)、デジタル信号処理デバイス(DSPD)、プログラマブルロジックデバイス(PLD)、フィールドプログラマブルゲートアレイ(FPGA)、コントローラ、マイクロコントローラ、マイクロプロセッサ又はその他の電子デバイスにより実現することができ、上述した方法を実行するために使用される。
例示的な実施例において、例えばコマンドを含むメモリ704のような、コマンドを含む非一時的なコンピュータ読み取り可能な記憶媒体を提供し、上述したコマンドは装置700のプロセッサ720によって実行されることで上述した方法を完成することができる。例えば、前記非一時的なコンピュータ読み取り可能な記憶媒体はROM、ランダムアクセスメモリ(RAM)、CD−ROM、磁気テープ、フロッピー(登録商標)ディスク及び光データ記憶装置などであってもよい。
非一時的なコンピュータ読み取り可能な記憶媒体は、前記記憶媒体のコマンドが装置700のプロセッサによって実行されるとき、装置700が上述したユーザデータ更新方法を実行できるようにする。
図8は一つの例示的な実施例にかかる、ユーザデータ更新に使われる装置800のブロック図である。例えば、装置800を一つのサーバとして提供することができる。図8に示すように、装置800は、一つ又は複数のプロセッサを有する処理ユニット822、及びメモリ832を代表とする記憶装置を備える。該記憶装置は、例えばアプリケーションプログラムのような、処理ユニット822によって実行されるコマンドを記憶するために使われる。メモリ832に記憶されるアプリケーションプログラムは、一つ又は一つ以上の、それぞれが一組のコマンドに対応するモジュールを含むことができる。また、処理ユニット822はコマンドを実行するように配置され、上記のアプリケーションプログラムの処理方法を実行する。
装置800は更に、装置800の電源の管理を実行するように配置された電源ユニット826、装置800をネットワークに接続するように配置された一つの有線又は無線ネットワークインターフェース850、及び一つの入力/出力(I/O)インターフェース858を備える。装置800は、メモリ832に記憶された、例えばWindows(登録商標) Server、Mac 0S X(登録商標)、Unix(登録商標)、Linux(登録商標)、FreeBSD(登録商標)のようなオペレーティングシステムに基づいて操作することができる。
当業者は明細書を検討し、ここで開示した発明を実践した後、本発明のその他の実施形態を容易に思いつくことができる。本願は本発明の全ての変更、用途又は適応性の変化を含む。これらの変更、用途又は適応性の変化は本発明の一般的な原理に従っており、本発明に未開示の本技術分野における周知技術又は慣用技術手段を含む。明細書及び実施例は例示的なものに過ぎず、本発明の真の範囲及び主旨は以下の特許請求の範囲によって示される。
本発明は、上記で説明した、また図面において示した精確な構造に限定されず、その範囲を逸脱しない前提のもとで種々の変更及び修正を行うことができることを理解すべきである。本発明の範囲は付された特許請求の範囲によってのみ限定される。

Claims (10)

  1. プロセッサを含むユーザデータ更新装置が実行する方法であって、
    前記プロセッサが、ユーザデータにおける引用内容が改訂前の電子出版物において対応する原文文字列を取得すること、
    前記プロセッサが、改訂後の前記電子出版物において、前記原文文字列に対し直接マッチングを行い、直接マッチングが成功しなかった時、前記原文文字列を分割し、順に排列されたn個(nは正整数であり)の文を獲得し、改訂後の前記電子出版物において順に前記n個の文に対しマッチングを行うこと、
    前記プロセッサが、前記n個の文において、マッチング成功した最初の文が1個目の文でない場合、前記1個目の文から前記マッチング成功した最初の文の前までの全ての文を単語に分割し、順に排列されたm(mは正整数であり)個の単語を獲得し、前記マッチング成功した最初の文のマッチング内容の開始位置から開始し、逆順に前記m個の単語に対しマッチングを行い、マッチング成功した最後の単語のマッチング内容の開始位置を、前記原文文字列が改訂後の前記電子出版物において対応する開始位置とすること、
    前記プロセッサが、マッチングが成功した時、マッチング結果に基づいて前記ユーザデータにおける引用内容を更新し、更新された前記ユーザデータを得ることを含むことを特徴とするユーザデータ更新方法。
  2. プロセッサを含むユーザデータ更新装置が実行する方法であって、
    前記プロセッサが、ユーザデータにおける引用内容が改訂前の電子出版物において対応する原文文字列を取得すること、
    前記プロセッサが、改訂後の前記電子出版物において、前記原文文字列に対し直接マッチングを行い、直接マッチングが成功しなかった時、前記原文文字列を分割し、順に排列されたn個(nは正整数であり)の文を獲得し、改訂後の前記電子出版物において順に前記n個の文に対しマッチングを行うこと、
    前記プロセッサが、前記n個の文において、マッチング成功した最後の文がn個目の文でない場合、前記マッチング成功した最後の文の後から前記n個目の文までの全ての文を単語に分割し、順に排列されたq(qは正整数であり)個の単語を獲得し、前記マッチング成功した最後の文のマッチング内容の終了位置から開始し、順に前記q個の単語に対しマッチングを行い、マッチング成功した最後の単語のマッチング内容の終了位置を、前記原文文字列が改訂後の前記電子出版物において対応する終了位置とすること、
    前記プロセッサが、マッチングが成功した時、マッチング結果に基づいて前記ユーザデータにおける引用内容を更新し、更新された前記ユーザデータを得ることを含むことを特徴とするユーザデータ更新方法。
  3. 前記改訂後の前記電子出版物において、順に前記n個の文に対しマッチングを行うことは、
    前記プロセッサが、サーチ開始位置からi(1≦i≦nであり)個目の文に対しマッチングを行い、i=1の場合、前記サーチ開始位置は前記原文文字列が属する章節の開始位置であり、
    前記プロセッサが、前記i個目の文に対するマッチングが成功した時、前記サーチ開始位置を前記i個目の文のマッチング内容の終了位置に更新し、更新後の前記サーチ開始位置からi+1(i+1≦n)個目の文に対しマッチングを行い、
    前記i個目の文に対するマッチングが成功しなかった時、前記プロセッサが前記i個目の文に対応するサーチ位置からi+1個目の文に対しマッチングを行い、
    前記n個の文のすべてに対するマッチングを行った後、前記プロセッサが前記n個の文と完全マッチングするマッチング内容が存在する時、又は前記n個の文と部分マッチングするが、マッチング程度が所定のマッチング範囲に属するマッチング内容が存在する時、分割マッチングの成功を確定することを含むことを特徴とする請求項1又は2に記載のユーザデータ更新方法。
  4. ユーザデータ更新装置であって、
    ユーザデータにおける引用内容が改訂前の電子出版物において対応する原文文字列を取得する取得モジュールと、
    改訂後の前記電子出版物において、前記原文文字列に対し直接マッチングを行い、直接のマッチングが成功しなかった場合、前記原文文字列を分割し、順に排列されたn個(nは正整数であり)の文を獲得し、改訂後の前記電子出版物において、順に前記n個の文に対しマッチングを行うマッチングモジュールと、
    前記n個の文において、マッチング成功した最初の文が1個目の文でない場合、前記1個目の文から前記マッチング成功した最初の文の前までの全ての文を単語に分割し、順に排列されたm(mは正整数であり)個の単語を得る第一の単語分割ユニットと、
    前記マッチング成功した最初の文のマッチング内容の開始位置から開始し、逆順に前記m個の単語に対しマッチングを行う単語マッチングユニットと、
    マッチング成功した最後の単語のマッチング内容の開始位置を、前記原文文字列が改訂後の前記電子出版物において対応する開始位置とする開始確定ユニットと、
    マッチングが成功した時、マッチング結果に基づいて前記ユーザデータにおける引用内容を更新し、更新された該ユーザデータを得る更新モジュールとを備えることを特徴とするユーザデータ更新装置。
  5. ユーザデータ更新装置であって、
    ユーザデータにおける引用内容が改訂前の電子出版物において対応する原文文字列を取得する取得モジュールと、
    改訂後の前記電子出版物において、前記原文文字列に対し直接マッチングを行い、直接のマッチングが成功しなかった場合、前記原文文字列を分割し、順に排列されたn個(nは正整数であり)の文を獲得し、改訂後の前記電子出版物において、順に前記n個の文に対しマッチングを行うマッチングモジュールと、
    前記n個の文においてマッチング成功した最後の文がn個目の文でない場合、前記マッチング成功した最後の文の後から前記n個目の文までの全ての文を単語に分割し、順に排列されたq(qは正整数であり)個の単語を得る第二の単語分割ユニットと、
    前記マッチング成功した最後の文のマッチング内容の終了位置から開始し、順に前記q個の単語に対しマッチングを行う単語マッチングユニットと、
    マッチング成功した最後の単語のマッチング内容の終了位置を、前記原文文字列が改訂後の前記電子出版物において対応する終了位置とする終了確定ユニットと、
    マッチングが成功した時、マッチング結果に基づいて前記ユーザデータにおける引用内容を更新し、更新された該ユーザデータを得る更新モジュールとを備えることを特徴とするユーザデータ更新装置。
  6. 前記マッチングモジュールは、マッチングユニットと、位置更新ユニットと、継続マッチングユニットと、確定ユニットとを備え、
    前記マッチングユニットは、サーチ開始位置からi(1≦i≦n)個目の文に対しマッチングを行い、i=1の場合、前記サーチ開始位置は前記原文文字列が属する章節の開始位置であり、
    前記位置更新ユニットは、前記i番目の文に対するマッチングが成功した時、前記サーチ開始位置を前記i個目の文のマッチング内容の終了位置に更新し、更新後の前記サーチ開始位置からi+1(i+1≦n)個目の文に対しマッチングを行い、
    前記継続マッチングユニットは、前記i個目の文に対するマッチングが成功しなかった時、前記i個目の文に対応するサーチ位置からi+1個目の文に対しマッチングを行い、
    前記確定ユニットは、前記n個の文のすべてに対するマッチングを行った後、前記n個の文と完全マッチングするマッチング内容が存在する場合、又は前記n個の文と部分マッチングするが、マッチング程度が所定のマッチング範囲に属するマッチング内容が存在する場合、分割マッチングの成功を確定することを特徴とする請求項4又は5に記載のユーザデータ更新装置。
  7. ユーザデータ更新装置であって、
    プロセッサと、
    前記プロセッサが実行可能なコマンドを記憶するためのメモリとを備えており、
    前記プロセッサは、
    ユーザデータにおける引用内容が改訂前の電子出版物において対応する原文文字列を取得し、
    改訂後の前記電子出版物において、前記原文文字列に対し直接マッチングを行い、直接マッチングが成功しなかった時、前記原文文字列を分割し、順に排列されたn個(nは正整数であり)の文を獲得し、改訂後の前記電子出版物において順に前記n個の文に対しマッチングを行い、
    前記n個の文において、マッチング成功した最初の文が1個目の文でない場合、前記1個目の文から前記マッチング成功した最初の文の前までの全ての文を単語に分割し、順に排列されたm(mは正整数であり)個の単語を獲得し、前記マッチング成功した最初の文のマッチング内容の開始位置から開始し、逆順に前記m個の単語に対しマッチングを行い、マッチング成功した最後の単語のマッチング内容の開始位置を、前記原文文字列が改訂後の前記電子出版物において対応する開始位置とし、
    マッチングが成功した時、マッチング結果に基づいて前記ユーザデータにおける引用内容を更新し、更新された前記ユーザデータを得ることを特徴とするユーザデータ更新装置。
  8. ユーザデータ更新装置であって、
    プロセッサと、
    前記プロセッサが実行可能なコマンドを記憶するためのメモリとを備えており、
    前記プロセッサは、
    ユーザデータにおける引用内容が改訂前の電子出版物において対応する原文文字列を取得し、
    改訂後の前記電子出版物において、前記原文文字列に対し直接マッチングを行い、直接マッチングが成功しなかった時、前記原文文字列を分割し、順に排列されたn個(nは正整数であり)の文を獲得し、改訂後の前記電子出版物において順に前記n個の文に対しマッチングを行い、
    前記n個の文において、マッチング成功した最後の文がn個目の文でない場合、前記マッチング成功した最後の文の後から前記n個目の文までの全ての文を単語に分割し、順に排列されたq(qは正整数であり)個の単語を獲得し、前記マッチング成功した最後の文のマッチング内容の終了位置から開始し、順に前記q個の単語に対しマッチングを行い、マッチング成功した最後の単語のマッチング内容の終了位置を、前記原文文字列が改訂後の前記電子出版物において対応する終了位置とし、
    マッチングが成功した時、マッチング結果に基づいて前記ユーザデータにおける引用内容を更新し、更新された前記ユーザデータを得ることを特徴とするユーザデータ更新装置。
  9. プロセッサに実行されることにより、請求項1から請求項3のいずれかに記載のユーザデータ更新方法を実現することを特徴とするプログラム。
  10. 請求項9に記載のプログラムが記録された記録媒体。
JP2016526447A 2014-06-12 2014-11-20 ユーザデータ更新方法、装置、プログラム、及び記録媒体 Active JP6085067B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201410260916.0 2014-06-12
CN201410260916.0A CN104090915B (zh) 2014-06-12 2014-06-12 用户数据更新方法及装置
PCT/CN2014/091745 WO2015188589A1 (zh) 2014-06-12 2014-11-20 用户数据更新方法及装置

Publications (2)

Publication Number Publication Date
JP2016526246A JP2016526246A (ja) 2016-09-01
JP6085067B2 true JP6085067B2 (ja) 2017-02-22

Family

ID=51638631

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016526447A Active JP6085067B2 (ja) 2014-06-12 2014-11-20 ユーザデータ更新方法、装置、プログラム、及び記録媒体

Country Status (9)

Country Link
US (1) US20150363372A1 (ja)
EP (1) EP2963561A1 (ja)
JP (1) JP6085067B2 (ja)
KR (1) KR20160005671A (ja)
CN (1) CN104090915B (ja)
BR (1) BR112015002308A2 (ja)
MX (1) MX359265B (ja)
RU (1) RU2608470C2 (ja)
WO (1) WO2015188589A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104090915B (zh) * 2014-06-12 2017-02-15 小米科技有限责任公司 用户数据更新方法及装置
US9817866B1 (en) * 2016-04-01 2017-11-14 Color Genomics, Inc. Lossless compression of client read data
US10853130B1 (en) 2015-12-02 2020-12-01 Color Genomics, Inc. Load balancing and conflict processing in workflow with task dependencies
CN116108326A (zh) * 2023-04-12 2023-05-12 山东工程职业技术大学 一种数学工具软件控制方法、装置、设备及存储介质

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3477812B2 (ja) * 1994-04-21 2003-12-10 富士ゼロックス株式会社 文書処理装置および方法
JP3771826B2 (ja) * 2001-09-13 2006-04-26 日本電信電話株式会社 書籍型データ差分追加更新装置,そのプログラムの記録媒体およびそのプログラム
US7260773B2 (en) * 2002-03-28 2007-08-21 Uri Zernik Device system and method for determining document similarities and differences
US20050060643A1 (en) * 2003-08-25 2005-03-17 Miavia, Inc. Document similarity detection and classification system
US7181472B2 (en) * 2003-10-23 2007-02-20 Microsoft Corporation Method and system for synchronizing identity information
US7689578B2 (en) * 2004-01-15 2010-03-30 International Business Machines Corporation Dealing with annotation versioning through multiple versioning policies and management thereof
US8201079B2 (en) * 2004-01-15 2012-06-12 International Business Machines Corporation Maintaining annotations for distributed and versioned files
JP2005250690A (ja) * 2004-03-02 2005-09-15 Ntt Electornics Corp 情報表示システム、情報表示装置及び識別情報割当装置
CN1707476A (zh) * 2005-05-06 2005-12-14 贺方升 辅助翻译搜索引擎系统及其方法
US20100278453A1 (en) * 2006-09-15 2010-11-04 King Martin T Capture and display of annotations in paper and electronic documents
US8352870B2 (en) * 2008-04-28 2013-01-08 Microsoft Corporation Conflict resolution
CN102339275B (zh) * 2010-07-20 2014-11-19 汉王科技股份有限公司 电子书籍批注处理方法及装置
JP2012129979A (ja) * 2010-11-24 2012-07-05 Jvc Kenwood Corp 区間作成装置、区間作成方法、及び区間作成プログラム
US20140115436A1 (en) * 2012-10-22 2014-04-24 Apple Inc. Annotation migration
CN103257956B (zh) * 2013-04-19 2016-06-15 小米科技有限责任公司 一种电子文档的数据更新方法及装置
CN104090915B (zh) * 2014-06-12 2017-02-15 小米科技有限责任公司 用户数据更新方法及装置

Also Published As

Publication number Publication date
KR20160005671A (ko) 2016-01-15
US20150363372A1 (en) 2015-12-17
RU2608470C2 (ru) 2017-01-18
MX359265B (es) 2018-09-19
BR112015002308A2 (pt) 2017-07-04
JP2016526246A (ja) 2016-09-01
CN104090915B (zh) 2017-02-15
CN104090915A (zh) 2014-10-08
EP2963561A1 (en) 2016-01-06
RU2015103742A (ru) 2016-08-27
WO2015188589A1 (zh) 2015-12-17
MX2015001621A (es) 2016-04-27

Similar Documents

Publication Publication Date Title
JP6916970B2 (ja) ビデオ処理方法及び装置、電子機器並びに記憶媒体
US10691402B2 (en) Multimedia data processing method of electronic device and electronic device thereof
US9959487B2 (en) Method and device for adding font
JP6085067B2 (ja) ユーザデータ更新方法、装置、プログラム、及び記録媒体
CN106462270B (zh) 用于电子设备的输入设备、方法和系统
CN104035995A (zh) 群标签生成方法及装置
KR20160059455A (ko) 웹 페이지 인코딩 인식 방법, 인식 장치, 프로그램 및 저장매체
CN105550643A (zh) 医学术语识别方法及装置
EP2940984B1 (en) Electronic apparatus and method for taking a photograph in electronic apparatus
EP4343580A1 (en) Media file processing method and apparatus, device, readable storage medium, and product
CN105139848A (zh) 数据转换方法和装置
US10691717B2 (en) Method and apparatus for managing data
CN108984628B (zh) 内容描述生成模型的损失值获取方法及装置
US20190012042A1 (en) Method and device for producing an electronic signed document
CN111950397B (zh) 图像的文本标注方法、装置、设备及存储介质
US20160077790A1 (en) Audio data operating method and electronic device supporting the same
CN110648657A (zh) 一种语言模型训练方法、构建方法和装置
CN111832455A (zh) 获取内容图像的方法、装置、存储介质和电子设备
CN115941869A (zh) 音频处理方法、装置及电子设备
CN109740136B (zh) 网页数据导入方法、装置、电子设备及存储介质
CN108241438B (zh) 一种输入方法、装置和用于输入的装置
US20200126517A1 (en) Image adjustment method, apparatus, device and computer readable storage medium
CN108345590B (zh) 一种翻译方法、装置、电子设备以及存储介质
CN115017073A (zh) 通信控制器的使能方法、装置、电子设备及存储介质
CN110765943A (zh) 网络训练、识别方法及装置、电子设备和存储介质

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160809

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161108

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161129

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161209

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170117

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170126

R150 Certificate of patent or registration of utility model

Ref document number: 6085067

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250