JP7096917B2 - 行列型テキストの記憶方法、装置及び電子機器 - Google Patents

行列型テキストの記憶方法、装置及び電子機器 Download PDF

Info

Publication number
JP7096917B2
JP7096917B2 JP2021001601A JP2021001601A JP7096917B2 JP 7096917 B2 JP7096917 B2 JP 7096917B2 JP 2021001601 A JP2021001601 A JP 2021001601A JP 2021001601 A JP2021001601 A JP 2021001601A JP 7096917 B2 JP7096917 B2 JP 7096917B2
Authority
JP
Japan
Prior art keywords
type
data
matrix
subtype
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021001601A
Other languages
English (en)
Other versions
JP2021111405A (ja
Inventor
ヤン ワン,
シュンチャオ ソン,
ペンチョン ユアン,
ハイピン ジャン,
イーフェイ ワン,
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Publication of JP2021111405A publication Critical patent/JP2021111405A/ja
Application granted granted Critical
Publication of JP7096917B2 publication Critical patent/JP7096917B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/258Data format conversion from or to a database
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/174Redundancy elimination performed by the file system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本出願は、データ処理技術分野に関し、具体的にはテキスト記憶技術分野に関し、特に行列型テキストの記憶方法、装置、電子機器及びコンピュータ読み取り可能な記憶媒体に関する。
グラフデータベースは、オイラーグラフ理論に由来し、グラフ指向/ベースのデータベースとも呼ばれ、対応する英語はGraph Databaseである。グラフデータベースの基本的な意味は、グラフを記憶するデータベースではなく、「グラフ」というデータ構造でデータを記憶して検索することである。グラフデータベースの主な入力データは行列型テキストであり、大規模の行列型テキストデータを記憶することで、データの検索を実現する。
関連技術では、一般的に、以下の2つの方式で行列型テキストを記憶する。第1に、行列型テキストデータをjsonに変換して記憶するが、実際の記憶過程はデータが膨大になり、検索にかかる時間が長くなる。第2に、行列型テキストデータを順に記憶すると、順に記憶される行列型テキストの記憶圧縮率が不十分であるため、冗長フィールドが多すぎ、検索効率が低くなるなどの欠点がある。
本出願は、行列型テキストの記憶方法を提供する。行列型テキストデータのデータ記述ドメイン及びバリューストレージドメインを決定して、データ記述ドメイン及びバリューストレージドメインを行列型テキストデータとして構成して記憶することで、行列型テキストデータの記憶圧縮率、及びデータの検索効率を向上させる。
本出願の第1の態様の実施例は、複数のフィールドを含む記憶すべき行列型テキストを取得するステップと、前記複数のフィールドから有効フィールドを取得し、前記有効フィールドに基づいてフィールドタイプテーブルを検索して行列型テキストデータのデータ記述ドメインを生成するステップと、前記複数のフィールドの内容及び前記フィールドタイプテーブルに基づいて前記行列型テキストデータのバリューストレージドメインを決定するステップと、前記データ記述ドメイン及び前記バリューストレージドメインを前記行列型テキストデータとして構成して記憶するステップと、を含む、行列型テキストの記憶方法を提供する。
本出願の実施例の第1の可能な実現形態として、前記フィールドタイプテーブルは複数のタイプを含み、各タイプは対応するタイプ識別子及びサブタイプ集合を含み、各サブタイプは対応するサブタイプシーケンス番号及び属性を有し、前記属性は属性番号、属性タイプ、デフォルト値及びヌル値を許可するか否かを含む。
本出願の実施例の第2の可能な実現形態として、前記有効フィールドに基づいてフィールドタイプテーブルを検索して行列型テキストデータのデータ記述ドメインを生成するステップは、前記行列型テキストに対応する前記フィールドタイプテーブルにおけるタイプを取得し、対応するタイプのタイプ識別子に基づいてタイプIDデータを生成するステップと、前記有効フィールドに対応する前記タイプのサブタイプ集合内のサブタイプのサブタイプシーケンス番号を取得するステップと、対応するサブタイプシーケンス番号に基づいて属性値データを生成するステップと、前記タイプIDデータ及び前記属性値データに基づいて前記データ記述ドメインを生成するステップと、を含む。
本出願の実施例の第3の可能な実現形態として、前記複数のフィールドの内容及び前記フィールドタイプテーブルに基づいて前記行列型テキストデータのバリューストレージドメインを決定するステップは、前記有効フィールドに対応するサブタイプシーケンス番号を取得し、前記バリューストレージドメインにおける前記サブタイプシーケンス番号の記憶位置を取得するステップと、前記有効フィールドが文字列であると決定する場合、前記有効フィールドの文字列内容を前記バリューストレージドメインにおける前記サブタイプシーケンス番号の記憶位置に記憶するステップと、前記有効フィールドが文字列ではないと決定する場合、前記有効フィールドに対応するサブタイプの属性値を取得し、前記属性値を前記バリューストレージドメインにおける前記サブタイプシーケンス番号の記憶位置に記憶するステップと、を含む。
本出願の実施例の第4の可能な実現形態として、前記タイプIDデータ及び前記属性値データは、可変長整数型記憶である。
本出願の第2の態様の実施例は、複数のフィールドを含む記憶すべき行列型テキストを取得する取得モジュールと、前記複数のフィールドから有効フィールドを取得し、前記有効フィールドに基づいてフィールドタイプテーブルを検索して行列型テキストデータのデータ記述ドメインを生成する生成モジュールと、前記複数のフィールドの内容及び前記フィールドタイプテーブルに基づいて前記行列型テキストデータのバリューストレージドメインを決定する決定モジュールと、前記データ記述ドメイン及び前記バリューストレージドメインを前記行列型テキストデータとして構成して記憶する記憶モジュールと、を備える、行列型テキストの記憶装置を提供する。
本出願の第3の態様の施例は、少なくとも1つのプロセッサと、前記少なくとも1つのプロセッサに通信可能に接続されるメモリと、を備える電子機器を提供し、前記メモリには、前記少なくとも1つのプロセッサにより実行可能な命令が記憶されており、前記命令は、前記少なくとも1つのプロセッサが上記実施例に記載の行列型テキストの記憶方法を実行できるように、前記少なくとも1つのプロセッサにより実行される。
本出願の第4の態様の実施例は、コンピュータ命令が記憶される非一時的なコンピュータ読み取り可能な記憶媒体であって、前記コンピュータ命令は、前記コンピュータに上記実施例に記載の行列型テキストの記憶方法を実行させるために用いられる、非一時的なコンピュータ読み取り可能な記憶媒体を提供する。
上記出願の1つの実施例は、以下の利点または有益な効果を有する。複数のフィールドを含む記憶すべき行列型テキストを取得し、複数のフィールドから有効フィールドを取得し、有効フィールドに基づいてフィールドタイプテーブルを検索して行列型テキストデータのデータ記述ドメインを生成し、複数のフィールドの内容及びフィールドタイプテーブルに基づいて行列型テキストデータのバリューストレージドメインを決定し、データ記述ドメイン及びバリューストレージドメインを行列型テキストデータとして構成して記憶する。該方法は、行列型テキストデータのデータ記述ドメイン及びバリューストレージドメインを決定して、データ記述ドメイン及びバリューストレージドメインを行列型テキストデータとして構成して記憶することにより、行列型テキストデータの記憶圧縮率、及びデータの検索効率を向上させる。
上記選択可能な形態が持っている他の効果について、具体的な実施例を組み合わせて以下に説明する。
図面は、本技術案がよりよく理解されるためのものであり、本出願を限定するものではない。
本出願の実施例1に係る行列型テキストの記憶方法のフローチャートである。 本出願の実施例1に係る行列型テキストの記憶の概略図である。 本出願の実施例2に係る行列型テキストの記憶方法のフローチャートである。 本出願の実施例3に係る行列型テキストの記憶方法のフローチャートである。 本出願の実施例4に係る行列型テキストの記憶装置の概略構成図である。 本出願の実施例の行列型テキストの記憶方法を実現するための電子機器のブロック図である。
以下、図面を参照して本出願の例示的な実施例を説明するが、理解を容易にするために、本出願の実施例の様々な詳細を含んでおり、それらは単なる例示であると見なされるべきである。したがって、当業者は、本出願の範囲及び趣旨から逸脱することなく、ここで説明される実施例に対して様々な変更や修正を行うことができることを理解すべきである。同様に、明確及び簡潔のため、以下の説明では、周知の機能及び構成の説明を省略する。
本出願は、関連技術の行列型テキスト記憶方法に存在した、圧縮率が十分ではなく、検索効率が低いなどの問題を解決することを目的とし、複数のフィールドを含む記憶すべき行列型テキストを取得し、複数のフィールドから有効フィールドを取得し、有効フィールドに基づいてフィールドタイプテーブルを検索して行列型テキストデータのデータ記述ドメインを生成し、複数のフィールドの内容及びフィールドタイプテーブルに基づいて行列型テキストデータのバリューストレージドメインを決定し、データ記述ドメイン及びバリューストレージドメインを行列型テキストデータとして構成して記憶することによる、行列型テキストの記憶方法を提供する。
本出願の実施例の行列型テキストの記憶方法、装置及び電子機器について、図面を参照して以下に説明する。
図1は、本出願の実施例1に係る行列型テキストの記憶方法のフローチャートである。
図1に示すように、該行列型テキストの記憶方法は、以下のステップを含んでよい。
ステップ101:複数のフィールドを含む記憶すべき行列型テキストを取得する。
本出願の実施例では、行列型テキストは、コンマ区切り値(Comma-Separated Values、CSVと略記)テキストとも呼ばれ、テキストファイル形式で記憶されるテーブルデータである。例えば、以下のテーブルが行列型テキストである。
Figure 0007096917000001
本出願の実施例では、記憶すべき行列型テキストをデータベースに記憶する前に、複数のフィールドを含む、記憶すべき行列型テキストを取得する。
上記テーブルから分かるように、行列型テキストを記憶する際、記憶すべき行列型テキストは複数のフィールドを含み、テーブルの「列」は、それぞれあるテーマの情報を含むフィールドと呼ばれる。例えば、上記行列型テキストには「名前」フィールド、「年齢」フィールド、「町」フィールドが含まれる。「連絡先」データベースにおける「名前」、「電話番号」は、いずれもテーブルにおけるすべての行の共有属性であるため、これらの列を「名前」フィールド、「電話番号」フィールドと呼ぶ。
ステップ102:複数のフィールドから有効フィールドを取得し、有効フィールドに基づいてフィールドタイプテーブルを検索して行列型テキストデータのデータ記述ドメインを生成する。
ステップ103:複数のフィールドの内容及びフィールドタイプテーブルに基づいて、行列型テキストデータのバリューストレージドメインを決定する。
本出願の実施例では、フィールドタイプテーブルは複数のタイプを含み、各タイプは対応するタイプ識別子及びサブタイプ集合を含み、各サブタイプは対応するサブタイプシーケンス番号及び属性を有し、属性は属性番号、属性タイプ、デフォルト値及びヌル値を許可するか否かを含む。
本出願の実施例では、行列型テキストに含まれる複数のフィールドのうちの有効フィールドは、記憶すべき行列型テキストに存在した、記憶する必要があるフィールドを意味してもよい。
本出願の実施例では、記憶すべき行列型テキストを2つのフィールド、すなわち、データ記述ドメイン及びバリューストレージドメインに分ける。
本出願の実施例では、記憶すべき行列型テキストを取得した後、行列型テキストに含まれる複数のフィールドから有効フィールドを取得し、有効フィールドに基づいてフィールドタイプテーブルを検索して行列型テキストデータのデータ記述ドメインを生成する。
本出願の実施例では、記憶すべき行列型テキストに含まれる複数のフィールドの内容及びフィールドタイプテーブルに基づいて、行列型テキストデータのバリューストレージドメインを決定できる。
ステップ104:データ記述ドメイン及びバリューストレージドメインを行列型テキストデータとして構成して記憶する。
本出願の実施例では、記憶すべき行列型テキストデータのデータ記述ドメイン及びバリューストレージドメインを生成した後、構成される行列型テキストデータを記憶するように、データ記述ドメイン及びバリューストレージドメインを行列型テキストデータとして構成してもよい。それにより、行列型テキストを圧縮記憶し、データ記憶時の圧縮率を向上させることができる。
「原籍」がデフォルトで「漢族」であり、「性別」がデフォルトで「男」または「女」であるように、行列型テキストデータのうちのほとんどのデータがデフォルト値である。広く使用されるvalueに対して、デフォルト値を設定してもよく、記憶する必要がなく、1つのビットで示せばよいので、行列型テキストデータの記憶時の圧縮率を非常に高くすることができる。
例えば、図2に示すように、データdataは、灰色部分がデータ記述ドメインである。図2には、有効フィールドがマーキングされ、行列型テキストデータは、名称:「小度在線」、会社の性質:「科学技術創新」、行列型テキストデータには「法人」、「成立時間」及び「登録資本金」がないため、構成される行列型テキストデータを記憶する際には、「法人」、「成立時間」及び「登録資本金」を記憶することなく、属性状態にマーキングすればよい。「会社の性質」が直接0と書かれ、行列型テキストを検索することで、該フィールドが列挙値であり、0が列挙型の1番目の値であり、従って、「会社の性質」の値が「科学技術創新」となる。
「成立時間」フィールドを取得する場合、属性状態により、該フィールドが存在しないことが分かるので、直接行列型テキストデータを検索し、デフォルト値があれば、デフォルト値に戻る。
順に記憶される行列型テキストデータの検索効率が低いという問題に対しては、行列型テキストデータを記憶した後、行列型テキストデータの内容を検索する際に、属性番号さらにデータ記述ドメイン全体を記憶することができるため、フィールドが存在するか否かを検索し、フィールドが存在する場合には、バリューストレージドメインの何番目であるかなどのフィールドの状態を非常に迅速に特定できる。
本出願の実施例では、複数のフィールドを含む記憶すべき行列型テキストを取得することで、複数のフィールドから有効フィールドを取得し、有効フィールドに基づいてフィールドタイプテーブルを検索して行列型テキストデータのデータ記述ドメインを生成し、複数のフィールドの内容及びフィールドタイプテーブルに基づいて行列型テキストデータのバリューストレージドメインを決定し、データ記述ドメイン及びバリューストレージドメインを行列型テキストデータとして構成して記憶する。該方法は、行列型テキストデータのデータ記述ドメイン及びバリューストレージドメインを決定することで、データ記述ドメイン及びバリューストレージドメインを行列型テキストデータとして構成して記憶し、行列型テキストデータの記憶圧縮率、及びデータの検索効率を向上させる。
1つの可能な実現形態としては、上記ステップ102では、有効フィールドに基づいてフィールドタイプテーブルを検索して行列型テキストデータのデータ記述ドメインを生成する際に、さらに行列型テキストに対応するフィールドタイプテーブルにおけるタイプを取得し、対応するタイプのタイプ識別子に基づいてタイプIDデータを生成し、有効フィールドに対応するタイプのサブタイプ集合内のサブタイプのサブタイプシーケンス番号を取得し、対応するサブタイプシーケンス番号に基づいて属性値データを生成し、さらに、タイプIDデータ及び属性値データに基づいてデータ記述ドメインを生成してもよい。以下、図3を参照して、具体的な実現過程について詳細に説明する。図3は、本出願の実施例2に係る行列型テキストの記憶方法のフローチャートである。
図3に示すように、該行列型テキストの記憶方法は、以下のステップをさらに含む。
ステップ201:行列型テキストに対応するフィールドタイプテーブルにおけるタイプを取得し、対応するタイプのタイプ識別子に基づいてタイプIDデータを生成する。
本出願の実施例では、フィールドタイプテーブルにおけるタイプは、整数型、浮動小数点型、文字列型、列挙型及び日付時間であり得る。
列挙型は、非常に特殊なタイプであり、他のデータベースにはあまり存在しない。mysqlの外部キーテーブルに類似しており、実際には、ほとんどのフィールドタイプのデータが列挙タイプである。例えば「会社種類」、「属する業界」、「性別」、「取引タイプ」、「国家&地域」などである。
本出願の実施例では、行列型テキストに含まれる複数のフィールドを取得した後、対応するフィールドタイプテーブルにおいて各フィールドの属するタイプを決定し、各フィールドに対応するタイプ識別子に基づいてタイプIDデータを生成する。
例えば、行列型テキストが会社フィールド、銀行フィールド及び個人フィールドを含むと仮定すると、各フィールドが1つのタイプIDデータに対応し、会社フィールドに対応するタイプIDデータがであってもよい。
ステップ202:有効フィールドに対応するタイプのサブタイプ集合内のサブタイプのサブタイプシーケンス番号を取得する。
本出願の実施例では、行列型テキストに含まれる複数のフィールドは、全てのフィールドが有効フィールドというわけではなく、行列型テキストの記憶時の圧縮率を向上させるため、有効フィールドに対応するタイプのサブタイプ集合内のサブタイプのサブタイプシーケンス番号のみを取得すればよい。
ステップ203:対応するサブタイプシーケンス番号に基づいて属性値データを生成する。
本出願の実施例では、各サブタイプのサブタイプシーケンスを取得した後、行列型テキストに各サブタイプが存在するか否かに基づいて、属性値データを生成する。
1例としては、行列型テキストのフィールドタイプテーブルに含まれるフィールドタイプは、「名称」、「法人」、「会社の性質」、「成立時間」及び「登録資本金」があり、フィールドタイプが「会社の性質」のタイプに対応するサブタイプ集合は、「科学技術創新」、「農林」「教育」及び「他」である。有効フィールドに対応するタイプのサブタイプ集合内のサブタイプのサブタイプシーケンスを取得した後、タイプが「名称」及び「会社の性質」の属性値データは1であり、残りのタイプの生成した属性値データがいずれも0であると決定できる。行列型テキストの各フィールドに対応する属性値データが0のフィールドを記憶する必要がないので、データ記憶時のデータ圧縮率を向上させ、記憶スペースを節約する。
ステップ204:タイプIDデータ及び属性値データに基づいてデータ記述ドメインを生成する。
タイプIDデータ及び属性値データがいずれも可変長整数型記憶であり、基準長さとステッピング長さの組み合せでタイプIDデータ及び属性値データに対して圧縮記憶を行い、データ記憶時に大量のスペースを予め残す必要がある状況を回避し、データの記憶圧縮率を向上させ、データ記憶スペースを節約する。
可変長整数型は、1つのゾーンビット及び7つのデータビットで1つの正整数型数値を圧縮する。ゾーンビットの作用は、7ビットのデータビットのほかのデータビットの値がゼロであるか否かを表すことである。具体的な演算方式では、数値と0x7fをAND演算し、数値が0であれば、該数値の有効データビットが7ビットであり、数値が1であれば、有効データがあり、0になるまで、数値を右へ7ビット循環シフトしてから前のステップを続ける。それにより、データに対する圧縮記憶を実現し、データの圧縮率を向上させる。
本出願の実施例では、行列型テキストにおける各フィールドに対応するタイプIDデータ、及び有効フィールドに対応する属性値の数を決定した後、タイプIDデータ及び属性値データに基づいてデータ記述ドメインを生成してもよい。
本出願の実施例の行列型テキストの記憶方法は、行列型テキストに対応する前記フィールドタイプテーブルにおけるタイプを取得し、対応するタイプのタイプ識別子に基づいてタイプIDデータを生成することで、有効フィールドに対応するタイプのサブタイプ集合内のサブタイプのサブタイプシーケンス番号を取得し、対応するサブタイプシーケンス番号に基づいて属性値データを生成し、タイプIDデータ及び属性値データに基づいてデータ記述ドメインを生成する。それにより、データ記憶時のデータ圧縮率を向上させ、記憶スペースを節約する。
1つの可能な実現形態としては、上記ステップ103では、複数のフィールドの内容及びフィールドタイプテーブルに基づいて行列型テキストデータのバリューストレージドメインを決定する場合、有効フィールドに対応するサブタイプシーケンス番号を取得し、バリューストレージドメインにおけるサブタイプシーケンス番号の記憶位置を取得し、有効フィールドが文字列であるか否かに基づいて、有効フィールドを記憶することができる。以下、図4を参照して上記過程について詳細に説明する。図4は、本出願の実施例3に係る行列型テキストの記憶方法のフローチャートである。
図4に示すように、該行列型テキストの記憶方法は、以下のステップをさらに含む。
ステップ301:有効フィールドに対応するサブタイプシーケンス番号を取得し、バリューストレージドメインにおけるサブタイプシーケンス番号の記憶位置を取得する。
本出願の実施例では、記憶すべき行列型テキストを取得し、行列型テキストに含まれる複数のフィールドから有効フィールドを決定し、さらに、有効フィールドに対応するサブタイプシーケンス番号及びバリューストレージドメインにおけるサブタイプシーケンス番号の記憶位置を取得する。
1例としては、記憶すべき行列型テキストには「会社」タイプ、「銀行」タイプ及び「個人」タイプが含まれ、「会社」タイプにはサブタイプの「名称」、「法人」、「会社の性質」、「成立時間」及び「登録資本金」がさらに含まれる。各サブタイプは、対応するサブタイプシーケンス番号及び属性を有し、属性が属性番号、属性タイプ、デフォルト値及びヌル値を許可するか否かを含む。
図2を例として、記憶すべき行列型テキストが名称:「小度在線」、会社の性質:「科学技術創新」であると仮定すると、記憶すべき行列型テキストの有効フィールドに対応するサブタイプが「名称」及び「会社の性質」である。さらに、有効フィールドに対応するサブタイプシーケンス番号、及びバリューストレージドメインにおけるサブタイプシーケンス番号の記憶位置を取得することができる。
ステップ302:有効フィールドが文字列であるか否かを判断する。
本出願の実施例では、記憶すべき行列型テキストの有効フィールドを取得した後、有効フィールドのタイプが文字列であるか否かを判断して、有効フィールドに対応するタイプに基づいて、有効フィールドを記憶する。
ステップ303:有効フィールドが文字列であると決定する場合、有効フィールドの文字列内容をバリューストレージドメインにおけるサブタイプシーケンス番号の記憶位置に記憶する。
本出願の実施例では、記憶すべき行列型テキストの有効フィールドが文字列であると決定する場合、有効フィールドの文字列内容をバリューストレージドメインにおけるサブタイプシーケンス番号の記憶位置に記憶することができる。
ステップ304:有効フィールドが文字列ではないと決定する場合、有効フィールドに対応するサブタイプの属性値を取得し、属性値をバリューストレージドメインにおけるサブタイプシーケンス番号の記憶位置に記憶する。
本出願の実施例では、記憶すべき行列型テキストの有効フィールドが文字列ではないと決定する場合、有効フィールドに対応するサブタイプの属性値を取得し、属性値をバリューストレージドメインにおけるサブタイプシーケンス番号の記憶位置に記憶する。
1つの例としては、図2に示すように、「会社の性質」に対応するサブタイプの属性値が0であり、フィールドタイプテーブルを検索することで、「会社の性質」に対応するフィールドが列挙タイプであると決定でき、0が列挙タイプの1番目の値を表すため、「会社の性質」に対応する値が「科学技術創新」である。従って、「会社の性質」に対応するサブタイプの属性値を取得した後、属性値をバリューストレージドメインにおけるサブタイプシーケンス番号の記憶位置に記憶する。
本出願の実施例の行列型テキストの記憶方法は、有効フィールドに対応するサブタイプシーケンス番号を取得し、バリューストレージドメインにおけるサブタイプシーケンス番号の記憶位置を取得し、有効フィールドが文字列であると決定する場合、有効フィールドの文字列内容をバリューストレージドメインにおけるサブタイプシーケンス番号の記憶位置に記憶し、有効フィールドが文字列ではないと決定する場合、有効フィールドに対応するサブタイプの属性値を取得し、属性値をバリューストレージドメインにおけるサブタイプシーケンス番号の記憶位置に記憶する。それにより、記憶すべき行列型テキストの記憶時の圧縮率を向上させ、記憶スペースを節約する。
上記実施例を実現するために、本出願の実施例は、行列型テキストの記憶装置を提供する。
図5は、本出願の実施例4に係る行列型テキストの記憶装置の概略構成図である。
図5に示すように、該行列型テキストの記憶装置400は、取得モジュール410と、生成モジュール420と、決定モジュール430と、記憶モジュール440と、を備えてもよい。
取得モジュール410は、複数のフィールドを含む記憶すべき行列型テキストを取得するために用いられる。
生成モジュール420は、複数のフィールドから有効フィールドを取得し、有効フィールドに基づいてフィールドタイプテーブルを検索して行列型テキストデータのデータ記述ドメインを生成するために用いられる。
決定モジュール430は、複数のフィールドの内容及びフィールドタイプテーブルに基づいて行列型テキストデータのバリューストレージドメインを決定するために用いられる。
記憶モジュール440は、データ記述ドメイン及びバリューストレージドメインを行列型テキストデータとして構成して記憶するために用いられる。
1つの可能な実現形態としては、フィールドタイプテーブルは複数のタイプを含み、各タイプは対応するタイプ識別子及びサブタイプ集合を含み、各サブタイプは対応するサブタイプシーケンス番号及び属性を有し、属性は属性番号、属性タイプ、デフォルト値及びヌル値を許可するか否かを含む。
他の可能な実現形態としては、生成モジュール420は、さらに、行列型テキストに対応するフィールドタイプテーブルにおけるタイプを取得し、対応するタイプのタイプ識別子に基づいてタイプIDデータを生成し、有効フィールドに対応するタイプのサブタイプ集合内のサブタイプのサブタイプシーケンス番号を取得し、対応するサブタイプシーケンス番号に基づいて属性値データを生成し、タイプIDデータ及び属性値データに基づいてデータ記述ドメインを生成するために用いられる。
他の可能な実現形態としては、決定モジュール430は、さらに、有効フィールドに対応するサブタイプシーケンス番号を取得し、バリューストレージドメインにおけるサブタイプシーケンス番号の記憶位置を取得し、有効フィールドが文字列であると決定する場合、有効フィールドの文字列内容をバリューストレージドメインにおけるサブタイプシーケンス番号の記憶位置に記憶し、有効フィールドが文字列ではないと決定する場合、有効フィールドに対応するサブタイプの属性値を取得し、属性値をバリューストレージドメインにおけるサブタイプシーケンス番号の記憶位置に記憶するために用いられる。
他の可能な実現形態としては、タイプIDデータ及び前記属性値データが可変長整数型記憶である。
本出願の実施例の行列型テキストの記憶装置は、複数のフィールドを含む記憶すべき行列型テキストを取得することで、複数のフィールドから有効フィールドを取得し、有効フィールドに基づいてフィールドタイプテーブルを検索して行列型テキストデータのデータ記述ドメインを生成し、複数のフィールドの内容及びフィールドタイプテーブルに基づいて行列型テキストデータのバリューストレージドメインを決定し、データ記述ドメイン及びバリューストレージドメインを行列型テキストデータとして構成して記憶する。該方法は、行列型テキストデータのデータ記述ドメイン及びバリューストレージドメインを決定することで、データ記述ドメイン及びバリューストレージドメインを行列型テキストデータとして構成して記憶し、行列型テキストデータの記憶圧縮率、及びデータの検索効率を向上させる。
本出願の実施例によれば、本出願は、電子機器及び読み取り可能な記憶媒体をさらに提供する。
図6に示すように、本出願の実施例による行列型テキストの記憶方法の電子機器のブロック図である。電子機器は、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、メインフレーム、及び他の適切なコンピュータなどの様々な形態のデジタルコンピュータを表すことを目的とする。電子機器は、携帯情報端末、携帯電話、スマートフォン、ウェアラブルデバイス、他の同様のコンピューティングデバイスなどの様々な形態のモバイルデバイスを表すこともできる。本明細書で示されるコンポーネント、それらの接続と関係、及びそれらの機能は単なる例であり、本明細書の説明及び/又は要求される本出願の実現を制限することを意図したものではない。
図6に示すように、該電子機器は、1つまたは複数のプロセッサ601と、メモリ602と、高速インターフェースおよび低速インターフェースを含む各コンポーネントを接続するインターフェースと、を備える。各コンポーネントは、異なるバスで相互に接続され、共通のマザーボードに取り付けられるか、又は必要に応じて他の方式で取り付けることができる。プロセッサは、メモリ内またはメモリ上において外部入力/出力装置(例えば、インターフェースにカップリングされた表示機器)にGUIのグラフィック情報を表示する命令を含んだ、電子機器内に実行される命令を処理する。他の実施形態では、必要であれば、複数のプロセッサ及び/又は複数のバスを、複数のメモリと複数のメモリとともに使用することができる。同様に、複数の電子機器を接続することができ、各機器は、一部の必要な操作(たとえば、サーババンク、1群のブレードサーバ、またはマルチプロセッサシステムとして)を提供することができる。図6では、1つのプロセッサ601を例とする。
メモリ602は、本出願に係る非一時的なコンピュータ読み取り可能な記憶媒体である。前記メモリには、前記少なくとも1つのプロセッサが本出願に係る多義語の翻訳方法を実行できるように、少なくとも1つのプロセッサにより実行可能な命令が記憶されている。本出願の非一時的なコンピュータ読み取り可能な記憶媒体には、コンピュータに本出願に係る行列型テキストの記憶方法を実行させるためのコンピュータ命令が記憶されている。
メモリ602は、非一時的なコンピュータ読み取り可能な記憶媒体として、本出願の実施例に係る行列型テキストの記憶方法に対応するプログラム命令/モジュール(例えば、図4に示す取得モジュール410、生成モジュール420、決定モジュール430及び記憶モジュール440)などの、非一時的なソフトウェアプログラム、非一時的なコンピュータ実行可能なプログラム及びモジュールを記憶するように構成される。プロセッサ601は、メモリ602に記憶されている非一時的なソフトウェアプログラム、命令及びモジュールを実行することにより、サーバの様々な機能アプリケーション及びデータ処理を実行し、すなわち、上記方法実施例の行列型テキストの記憶方法を実現する。
メモリ602は、プログラム記憶領域とデータ記憶領域と、を含むことができ、プログラム記憶領域は、オペレーティングシステム、少なくとも1つの機能に必要なアプリケーションプログラムを記憶することができ、データ記憶領域は、行列型テキストを記憶する電子機器の使用により作成されたデータなどを記憶することができる。メモリ602は、高速ランダムアクセスメモリを含んでもよく、非一時的なメモリをさらに含んでもよく、例えば、少なくとも1つのディスクストレージデバイス、フラッシュメモリデバイス、又は他の非一時的なソリッドステートストレージデバイスである。いくつかの実施例では、メモリ602は、プロセッサ601に対して遠隔に設けられたメモリを選択的に含んでもよく、これらの遠隔メモリは、ネットワークを介して行列型テキストを記憶する電子機器に接続されてもよい。上記のネットワークの例としては、インターネット、イントラネット、ローカルエリアネットワーク、モバイル通信ネットワーク、及びその組み合わせを含むが、これらに限定されない。
行列型テキストの記憶方法の電子機器は、さらに、入力装置603及び出力装置604を備えてもよい。プロセッサ601、メモリ602、入力装置603及び出力装置604は、バス又は他の方式を介して接続することができ、図6では、バスを介して接続することを例とする。
入力装置603は、入力された数字またはキャラクタ情報を受信し、行列型テキストを記憶する電子機器のユーザ設定及び機能制御に関連するキー信号入力を生成してもよく、たとえばタッチスクリーン、キーパッド、マウス、トラックパッド、タッチパッド、インジケータースティック、1つのまたは複数のマウスキー、トラックボール、ジョイスティックなどの入力装置である。出力装置1104は、表示機器、補助照明装置(たとえば、LED)及び触覚フィードバック装置(たとえば、バイブラモータ)などを含んでもよい。該表示機器は、液晶ディスプレイ(LCD)、発光ダイオード(LED)ディスプレイ及びプラズマディスプレイを含んでもよいがこれらに限られない。いくつかの実施形態では、表示機器は、タッチスクリーンであり得る。
ここで説明されるシステム及び技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、特定用途向けASIC(特定用途向け集積回路)、コンピュータハードウェア、ファームウェア、ソフトウェア、及び/またはそれらの組合せで実現することができる。これらの様々な実施形態は、1つまたは複数のコンピュータプログラムで実施されること、を含むことができ、該1つまたは複数のコンピュータプログラムは、少なくとも1つのプログラマブルプロセッサを含むプログラマブルシステムで実行及び/または解釈でき、該プログラマブルプロセッサは、特定用途向けまたは汎用プログラマブルプロセッサであってもよく、ストレージシステム、少なくとも1つの入力装置、及び少なくとも1つの出力装置からデータ及び命令を受信し、該ストレージシステム、該少なくとも1つの入力装置、及び該少なくとも1つの出力装置に伝送することができる。
これらのコンピュータプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、またはコードとも称される)は、プログラマブルプロセッサに対するマシン命令を含み、高レベル手続き型及び/またはオブジェクト指向プログラミング言語、および/またはアセンブリ/マシン言語で実装することができる。本明細書で使用される際、「マシン読み取り可能な媒体」及び「コンピュータ読み取り可能な媒体」という用語は、マシン命令及び/またはデータをプログラマブルプロセッサに提供する任意のコンピュータプログラム製品、機器、及び/または装置(たとえば、磁気ディスク、光ディスク、メモリ、プログラマブルロジックデバイス(PLD))であり、マシン読み取り可能な信号であるマシン命令を受信する機器可読媒体を含む。用語の「マシン読み取り可能な信号」とは、マシン命令及び/またはデータをプログラマブルプロセッサに提供する任意の信号である。
ユーザとのインタラクションを提供するために、ここで説明されているシステム及び技術をコンピュータ上で実施することができ、該コンピュータは、ユーザに情報を表示する表示機器(例えば、CRT(陰極線管)またはLCD(液晶ディスプレイ)モニタ)と、キーボード及びポインティングデバイス(例えば、マウスまたはトラックボール)とを有し、ユーザは、該キーボード及び該ポインティングデバイスよりコンピュータに入力することができる。他の種類の装置は、ユーザとのインタラクションを提供するために用いられてもよい。例えば、ユーザに提供されるフィードバックは、任意の形態のセンシングフィードバック(例えば、視覚フィードバック、聴覚フィードバック、または触覚フィードバック)であってもよく、任意の形態(音響入力と、音声入力と、触覚入力と、を含む)でユーザからの入力を受信することができる。
ここで説明されるシステム及び技術は、バックエンドコンポーネントを含むコンピューティングシステム(例えば、データサーバとする)、またはミドルウェアコンポーネントを含むコンピューティングシステム(例えば、アプリケーションサーバ)、またはフロントエンドコンポーネントを含むコンピューティングシステム(例えば、グラフィカルユーザインタフェースまたはウェブブラウザを有するユーザコンピュータ、ユーザは、該グラフィカルユーザインタフェースまたは該ウェブブラウザによってここで説明されるシステム及び技術の実施形態とインタラクションする)、またはこのようなバックエンドコンポーネントと、ミドルウェアコンポーネントと、フロントエンドコンポーネントの任意の組み合わせを含むコンピューティングシステムで実施することができる。任意の形態または媒体のデジタルデータ通信(例えば、通信ネットワーク)によりシステムのコンポーネントを相互に接続されてもよい。通信ネットワークの例としては、ローカルエリアネットワーク(LAN)と、ワイドエリアネットワーク(WAN)と、インターネットと、を含む。
コンピュータシステムは、クライアント側とサーバと、を含むことができる。クライアント側とサーバは、一般的に、互いに離れており、通常に通信ネットワークを介してインタラクションする。対応するコンピュータ上で実行され、互いにクライアント-サーバ関係を有するコンピュータプログラムによりクライアント側とサーバとの関係が生成される。
本出願の実施例の技術案によれば、複数のフィールドを含む記憶すべき行列型テキストを取得することで、複数のフィールドから有効フィールドを取得し、有効フィールドに基づいてフィールドタイプテーブルを検索して行列型テキストデータのデータ記述ドメインを生成し、複数のフィールドの内容及びフィールドタイプテーブルに基づいて行列型テキストデータのバリューストレージドメインを決定し、データ記述ドメイン及びバリューストレージドメインを行列型テキストデータとして構成して記憶する。該方法は、行列型テキストデータのデータ記述ドメイン及びバリューストレージドメインを決定して、データ記述ドメイン及びバリューストレージドメインを行列型テキストデータとして構成して記憶することで、行列型テキストデータの記憶圧縮率、及びデータの検索効率を向上させる。
上記に示される様々な形式のフローを使用して、ステップを並べ替え、追加、又は削除することができることを理解されたい。例えば、本出願に記載されている各ステップは、並列に実行されてもよいし、順次的に実行されてもよいし、異なる順序で実行されてもよいが、本出願で開示されている技術案が所望の結果を実現することができれば、本明細書では限定されない。
上記の具体的な実施形態は、本出願の保護範囲を制限するものではない。当業者は、設計要件及び他の要因に応じて、様々な修正、組み合わせ、サブコンビネーション、及び置換を行うことができる。本出願の要旨と原則内で行われる任意の修正、同等の置換や改良などは、いずれも本出願の保護範囲内に含まれるべきである。

Claims (7)

  1. コンピュータが複数のフィールドを含む記憶すべき行列型テキストを取得するステップと、
    コンピュータが前記複数のフィールドから有効フィールドを取得し、前記有効フィールドに基づいてフィールドタイプテーブルを検索して行列型テキストデータのデータ記述ドメインを生成するステップであって、前記フィールドタイプテーブルは複数のタイプを含み、各タイプは対応するタイプ識別子及びサブタイプ集合を含み、各サブタイプは対応するサブタイプシーケンス番号及び属性を有し、前記属性は属性番号、属性タイプ、デフォルト値及びヌル値を許可するか否かを含む、ステップと、
    コンピュータが前記複数のフィールドの内容及び前記フィールドタイプテーブルに基づいて前記行列型テキストデータのバリューストレージドメインを決定するステップと、
    コンピュータが前記データ記述ドメイン及び前記バリューストレージドメインを前記行列型テキストデータとして構成して記憶するステップと、を含み、
    コンピュータが前記有効フィールドに基づいてフィールドタイプテーブルを検索して行列型テキストデータのデータ記述ドメインを生成するステップは、
    コンピュータが前記行列型テキストに対応する前記フィールドタイプテーブルにおけるタイプを取得し、対応するタイプのタイプ識別子に基づいてタイプIDデータを生成するステップと、
    コンピュータが前記有効フィールドに対応する前記タイプのサブタイプ集合内のサブタイプのサブタイプシーケンス番号を取得するステップと、
    コンピュータが対応するサブタイプシーケンス番号に基づいて属性値データを生成するステップと、
    コンピュータが前記タイプIDデータ及び前記属性値データに基づいて前記データ記述ドメインを生成するステップと、を含み、
    コンピュータが前記複数のフィールドの内容及び前記フィールドタイプテーブルに基づいて前記行列型テキストデータのバリューストレージドメインを決定するステップは、
    コンピュータが前記有効フィールドに対応するサブタイプシーケンス番号を取得し、前記バリューストレージドメインにおける前記サブタイプシーケンス番号の記憶位置を取得するステップと、
    コンピュータが前記有効フィールドが文字列であると決定する場合、前記有効フィールドの文字列内容を前記バリューストレージドメインにおける前記サブタイプシーケンス番号の記憶位置に記憶するステップと、
    コンピュータが前記有効フィールドが文字列ではないと決定する場合、前記有効フィールドに対応するサブタイプの属性値を取得し、前記属性値を前記バリューストレージドメインにおける前記サブタイプシーケンス番号の記憶位置に記憶するステップと、を含ことを特徴とする、行列型テキストの記憶方法。
  2. 前記タイプIDデータ及び前記属性値データが、可変長整数型記憶であることを特徴とする、請求項に記載の行列型テキストの記憶方法。
  3. 複数のフィールドを含む記憶すべき行列型テキストを取得する取得モジュールと、
    前記複数のフィールドから有効フィールドを取得し、前記有効フィールドに基づいてフィールドタイプテーブルを検索して行列型テキストデータのデータ記述ドメインを生成する生成モジュールであって、前記フィールドタイプテーブルは複数のタイプを含み、各タイプは対応するタイプ識別子及びサブタイプ集合を含み、各サブタイプは対応するサブタイプシーケンス番号及び属性を有し、前記属性は属性番号、属性タイプ、デフォルト値及びヌル値を許可するか否かを含む、生成モジュールと、
    前記複数のフィールドの内容及び前記フィールドタイプテーブルに基づいて前記行列型テキストデータのバリューストレージドメインを決定する決定モジュールと、
    前記データ記述ドメイン及び前記バリューストレージドメインを前記行列型テキストデータとして構成して記憶する記憶モジュールと、を含み、
    前記生成モジュールは、さらに、
    前記行列型テキストに対応する前記フィールドタイプテーブルにおけるタイプを取得し、対応するタイプのタイプ識別子に基づいてタイプIDデータを生成し、
    前記有効フィールドに対応する前記タイプのサブタイプ集合内のサブタイプのサブタイプシーケンス番号を取得し、
    対応するサブタイプシーケンス番号に基づいて属性値データを生成し、
    前記タイプIDデータ及び前記属性値データに基づいて前記データ記述ドメインを生成するために用いられ、
    前記決定モジュールは、さらに、
    前記有効フィールドに対応するサブタイプシーケンス番号を取得し、前記バリューストレージドメインにおける前記サブタイプシーケンス番号の記憶位置を取得し、
    前記有効フィールドが文字列であると決定する場合、前記有効フィールドの文字列内容を前記バリューストレージドメインにおける前記サブタイプシーケンス番号の記憶位置に記憶し、
    前記有効フィールドが文字列ではないと決定する場合、前記有効フィールドに対応するサブタイプの属性値を取得し、前記属性値を前記バリューストレージドメインにおける前記サブタイプシーケンス番号の記憶位置に記憶するために用いられることを特徴とする、行列型テキストの記憶装置。
  4. 前記タイプIDデータ及び前記属性値データが可変長整数型記憶であることを特徴とする、請求項に記載の行列型テキストの記憶装置。
  5. 少なくとも1つのプロセッサと、
    前記少なくとも1つのプロセッサに通信可能に接続されるメモリと、を備え、
    前記メモリには、前記少なくとも1つのプロセッサにより実行可能な命令が記憶されており、前記命令は、前記少なくとも1つのプロセッサにより実行される場合、前記少なくとも1つのプロセッサが請求項1または2に記載の行列型テキストの記憶方法を実行できることを特徴とする、電子機器。
  6. コンピュータ命令が記憶される非一時的なコンピュータ読み取り可能な記憶媒体であって、
    前記コンピュータ命令は、コンピュータに請求項1または2に記載の行列型テキストの記憶方法を実行させるために用いられることを特徴とする、非一時的なコンピュータ読み取り可能な記憶媒体。
  7. コンピュータ上で動作しているときに、請求項1または2に記載の行列型テキストの記憶方法を前記コンピュータに実行させることを特徴とする、コンピュータプログラム。
JP2021001601A 2020-01-10 2021-01-07 行列型テキストの記憶方法、装置及び電子機器 Active JP7096917B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202010025931.2 2020-01-10
CN202010025931.2A CN111259107B (zh) 2020-01-10 2020-01-10 行列式文本的存储方法、装置以及电子设备

Publications (2)

Publication Number Publication Date
JP2021111405A JP2021111405A (ja) 2021-08-02
JP7096917B2 true JP7096917B2 (ja) 2022-07-06

Family

ID=70950328

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021001601A Active JP7096917B2 (ja) 2020-01-10 2021-01-07 行列型テキストの記憶方法、装置及び電子機器

Country Status (5)

Country Link
US (1) US11334551B2 (ja)
EP (1) EP3848816A1 (ja)
JP (1) JP7096917B2 (ja)
KR (1) KR102564543B1 (ja)
CN (1) CN111259107B (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11561948B1 (en) * 2021-03-01 2023-01-24 Era Software, Inc. Database indexing using structure-preserving dimensionality reduction to accelerate database operations
CN113792095A (zh) * 2021-08-31 2021-12-14 通号城市轨道交通技术有限公司 信号系统接口信息转换方法、装置、电子设备和存储介质
US12026152B1 (en) 2021-11-08 2024-07-02 Servicenow Delaware Llc Maximally distributed minimally coordinated systems and methods
CN114615232B (zh) * 2022-05-12 2022-08-12 南京赛宁信息技术有限公司 一种主动防御网关访客标识生成方法与系统
CN115543977B (zh) * 2022-09-29 2024-07-19 河北雄安睿天科技有限公司 一种供水行业数据清洗方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000305822A (ja) 1999-04-26 2000-11-02 Denso Corp データベース管理装置,データベースレコード抽出装置,データベース管理方法及びデータベースレコード抽出方法
JP2014511587A (ja) 2011-01-28 2014-05-15 アビニシオ テクノロジー エルエルシー データパターン情報の生成
JP2016053976A (ja) 2015-11-18 2016-04-14 富士通株式会社 データ生成方法、装置及びプログラム、検索処理方法、装置及びプログラム

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9320404D0 (en) * 1993-10-04 1993-11-24 Dixon Robert Method & apparatus for data storage & retrieval
US6032151A (en) * 1997-11-17 2000-02-29 Sun Microsystems, Inc. Database system employing polymorphic entry and entry matching
US7890518B2 (en) * 2007-03-29 2011-02-15 Franz Inc. Method for creating a scalable graph database
US8037108B1 (en) * 2009-07-22 2011-10-11 Adobe Systems Incorporated Conversion of relational databases into triplestores
US20110208759A1 (en) * 2010-02-23 2011-08-25 Paul Zellweger Method, Apparatus, and Interface For Creating A Chain of Binary Attribute Relations
US8984031B1 (en) * 2010-09-29 2015-03-17 Emc Corporation Managing data storage for databases based on application awareness
US9547681B2 (en) * 2014-05-30 2017-01-17 International Business Machines Corporation Combining row based and column based tables to form mixed-mode tables
WO2016171927A1 (en) * 2015-04-20 2016-10-27 Unified Compliance Framework (Network Frontiers) Structured dictionary
US10366114B2 (en) * 2015-11-15 2019-07-30 Microsoft Technology Licensing, Llc Providing data presentation functionality associated with collaboration database
CN105426541B (zh) * 2015-12-23 2019-03-08 北京奇虎科技有限公司 一种通用数据的存储方法和装置
CN107015985B (zh) * 2016-01-27 2021-03-30 创新先进技术有限公司 一种数据存储与获取方法及装置
US10180992B2 (en) * 2016-03-01 2019-01-15 Microsoft Technology Licensing, Llc Atomic updating of graph database index structures
US10674358B2 (en) * 2017-04-10 2020-06-02 Qualcomm Incorporated Representing unique device identifiers in hierarchical device certificates as fully qualified domain names (FQDN)
CN107273485A (zh) * 2017-06-13 2017-10-20 苏州弘铭检测科技有限公司 一种基于可配置数据库的数据存储结构及数据库重置方法
CN108304472A (zh) * 2017-12-28 2018-07-20 中国银联股份有限公司 一种数据压缩存储方法以及数据压缩存储装置
CN108052659B (zh) * 2017-12-28 2022-03-11 北京百度网讯科技有限公司 基于人工智能的搜索方法、装置和电子设备
CN110109910A (zh) * 2018-01-08 2019-08-09 广东神马搜索科技有限公司 数据处理方法及系统、电子设备和计算机可读存储介质
CN109522405A (zh) * 2018-09-29 2019-03-26 南昌与德软件技术有限公司 文件信息处理方法、电子设备以及计算机可读存介质
CN109815228A (zh) * 2018-12-14 2019-05-28 深圳壹账通智能科技有限公司 数据库表的创建方法、装置、计算机设备及可读存储介质
CN110147413B (zh) * 2019-04-26 2023-06-02 平安科技(深圳)有限公司 数据存储方法、数据查询方法、装置、设备及存储介质
CN110427524B (zh) * 2019-08-05 2022-03-08 北京百度网讯科技有限公司 知识图谱补全的方法、装置、电子设备及存储介质
CN110659287A (zh) * 2019-09-11 2020-01-07 北京亚信数据有限公司 一种表格的字段名处理方法及计算设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000305822A (ja) 1999-04-26 2000-11-02 Denso Corp データベース管理装置,データベースレコード抽出装置,データベース管理方法及びデータベースレコード抽出方法
JP2014511587A (ja) 2011-01-28 2014-05-15 アビニシオ テクノロジー エルエルシー データパターン情報の生成
JP2016053976A (ja) 2015-11-18 2016-04-14 富士通株式会社 データ生成方法、装置及びプログラム、検索処理方法、装置及びプログラム

Also Published As

Publication number Publication date
US11334551B2 (en) 2022-05-17
KR102564543B1 (ko) 2023-08-04
CN111259107A (zh) 2020-06-09
US20210216520A1 (en) 2021-07-15
CN111259107B (zh) 2023-08-18
EP3848816A1 (en) 2021-07-14
KR20210090558A (ko) 2021-07-20
JP2021111405A (ja) 2021-08-02

Similar Documents

Publication Publication Date Title
JP7096917B2 (ja) 行列型テキストの記憶方法、装置及び電子機器
JP7369740B2 (ja) 検索語の推薦方法と装置、目的モデルの訓練方法と装置、電子デバイス、記憶媒体、及びプログラム
US20210191934A1 (en) Target data obtaining method and apparatus
KR102689628B1 (ko) 라벨 데이터 처리 방법, 장치, 기기 및 저장 매체
US20210334669A1 (en) Method, apparatus, device and storage medium for constructing knowledge graph
WO2022000802A1 (zh) 深度学习模型的适配方法、装置及电子设备
KR102521765B1 (ko) 인과 관계의 판별 방법, 장치, 전자 기기 및 저장 매체
EP3832484A2 (en) Semantics processing method, semantics processing apparatus, electronic device, and medium
KR102585797B1 (ko) 페이지 테마 결정 방법, 장치, 기기 및 저장 매체
JP2021106018A (ja) データ処理方法、装置、機器及び記憶媒体
EP3832493B1 (en) Method, apparatus, electronic device and readable storage medium for data query
US12105750B2 (en) Method and apparatus for mining entity relationship, electronic device, and storage medium
US20210224480A1 (en) Method, device and storage medium for predicting punctuation in text
CN111708805A (zh) 数据查询方法、装置、电子设备及存储介质
US20210216713A1 (en) Method, apparatus, device and storage medium for intelligent response
CN113220710B (zh) 数据查询方法、装置、电子设备以及存储介质
KR102531507B1 (ko) 정보 출력 방법, 장치, 기기 및 저장 매체
CN111723318B (zh) 页面数据处理方法、装置、设备和存储介质
US11657550B2 (en) Method for generating electronic report, electronic device, and storage medium
US20220309395A1 (en) Method and apparatus for adapting deep learning model, and electronic device
CN112541718B (zh) 物料处理方法和装置
JP7161563B2 (ja) ネットワークデータの処理方法、ネットワークデータ処理装置、電子機器、記憶媒体、及びプログラム
CN112269605B (zh) 一种皮肤更换方法、装置、电子设备及存储介质
CN112527734B (zh) 一种图形处理方法、装置、电子设备及存储介质
CN112183041A (zh) 一种基于指标的报表调整方法、装置、设备和存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210107

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20211130

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211207

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220304

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220621

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220624

R150 Certificate of patent or registration of utility model

Ref document number: 7096917

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150