JP2005509205A - 機械で読み取り可能な熟語を使用してデータを記憶するためのシステムと方法 - Google Patents
機械で読み取り可能な熟語を使用してデータを記憶するためのシステムと方法 Download PDFInfo
- Publication number
- JP2005509205A JP2005509205A JP2002582390A JP2002582390A JP2005509205A JP 2005509205 A JP2005509205 A JP 2005509205A JP 2002582390 A JP2002582390 A JP 2002582390A JP 2002582390 A JP2002582390 A JP 2002582390A JP 2005509205 A JP2005509205 A JP 2005509205A
- Authority
- JP
- Japan
- Prior art keywords
- root
- word
- roots
- field
- concept
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/374—Thesaurus
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99941—Database schema or data structure
- Y10S707/99942—Manipulating data structure, e.g. compression, compaction, compilation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99941—Database schema or data structure
- Y10S707/99943—Generating database or data structure, e.g. via user interface
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
Claims (28)
- 下記の各ステップを含むデータ表現方法において:
各語根(ルート)がツリー構造をした複数レベルで表現された複数の共通フィールドを含み、特定語根中の各特定フィールドが一つの値を有し、この値が前記特定フィールドで表現されたツリー構造の一つのレベルにおける前記特定の語根の意味に対応する場合に、予め定義づけられたツリー構造に基づき、複数の語根セットの各語根を所定の値で表現するステップと;
前記複数の語根における各語根が、単語により表現されたデータ概念の特徴に対応する場合に、該単語を形成する語根セットから選択された複数の語根をグループ化して前記データ概念を表現するステップと;そして
前記単語を記憶するステップ;とで構成されたことを特徴とするデータ表現方法。 - 前記各単語は、単語を処理するためにコンピュータの処理レジスタに格納できるビット数と同じビット数を含み、かつ前記複数の共通フィールドの各フィールドは少なくとも1つのビットに関連することを特徴とする請求項1記載のデータ表現方法。
- ツリー構造の各レベルでのフィールドの値は、該ツリー構造の一つ高位に位置するレベルの値が有する意味を示していることを特徴とする請求項1記載のデータ表現方法。
- ある複数の語根(ルート)は、より基本語根に割り振られた値に基づいて個別規則化されており、該個別規則化された語根は予め定めた個別規則に基づいたフィールド値が与えられていることを特徴とする請求項1記載のデータ表現方法。
- ある複数の語根(ルート)により示された特性は、より基本語根に割り振られた値に基づいて定義されることを特徴とする請求項1記載のデータ表現方法。
- 前記単語には、特定の語根(ルート)に関連する否定ビットを含み、該否定ビットに割り振られた値は、該特定語根の意味がツリー構造をした分類法での値で表現された意味とは反対の意味であることを示すことを特徴とする請求項1記載のデータ表現方法。
- 前記単語には、単語がどのように使われるかについて指し示す暗示語根(ルート)を含むことを特徴とする請求項1記載のデータ表現方法。
- 下記の各ステップを含む全ての概念を表現する表現方法において;
各複数の語根(ルート)中の各語根が特定概念の特徴を表現する場合に、複数の語根で各特定概念を表現するステップと;
複数のフィールドにおける各フィールドが、予め定義されたツリー構造での重要性のレベルで前記表現された語根(ルート)の意味を表現し、前記予め定義されたツリー構造での最重要レベルは知識を、思考に関する複数の抽象的小グループに分割し、前記予め定義されたツリー構造での下位重要レベルは各上位の思考に関する小グループを、複数の思考に関する小グループに分割し、さらに複数のフィールドにおける最重要フィールドが、前記ツリー構造の最上位の複数の抽象的小グループ内での一つの小グループを表現し、複数のフィールドにおける下位重要フィールドが、前記ツリー構造の下位の複数の抽象的小グループ内での一つの小グループを表現する場合に、複数のフィールドで各語根(ルート)を表現するステップ;とで構成されたことを特徴とする全ての概念を表現する表現方法。 - 各フィールドには少なくとも1つのビットを含み、前記単語には単語を処理するためにコンピュータの処理レジスタに格納できるビット数と同じビット数を含むことを特徴とする請求項8記載の全ての概念を表現する表現方法。
- 複数の語根(ルート)の中のある語根は、複数の語根中の少なくとも一つのフィールドの内容に基づいて個別規則化されていることを特徴とする請求項8記載の全ての概念を表現する表現方法。
- 複数の語根(ルート)中のある語根により表現された特性は、前記複数の他の少なくとも一つの語根のフィールドの内容で定義付けされていることを特徴とする請求項8記載の全ての概念を表現する表現方法。
- 特定の語根(ルート)により示される意味が否定的に解釈されるべきか否かを表現するステップを、更に含むことを特徴とする請求項8記載の全ての概念を表現する表現方法。
- 前記各特定概念を表現するステップには、該特定概念の暗示を表現する語根(ルート)で該特定概念を表現するステップを、更に含むことを特徴とする請求項8記載の全ての概念を表現する表現方法。
- 読み取り可能媒体に記憶でき、かつ概念が表現されるデータ構造において:
読み取り可能な値を収納するフィールドである場合に、該複数のフィールドと;
一定の複数フィールドを含む語根(ルート)であり、各語根は最重要フィールドと下位重要フィールドを含み、最重要フィールドでは読み取り可能な値が一般的抽象概念を表現し、下位重要フィールドでは読み取り可能な値が前記最重要フィールドで表現された前記一般的抽象概念を限定する概念を表現し、各語根が語根中の各フィールドの値により指定された概念を表現している場合に、該複数の語根と;
複数の語根の各語根により各概念が表現されており、各語根が単語の異なる特徴を表現している場合に、上記複数の語根を含む一つの単語;とで構成されたことを特徴とするデータ構造。 - 前記複数の語根(ルート)は、語根の予め定められたセットから選択されるように構成されたことを特徴とする請求項14記載のデータ構造。
- 語根(ルート)の前記予め定められたセットはツリー構造に基づいて構成されており、該ツリー構造では、最重要フィールドの読み取り可能な値がツリー構造の最高位の一般的抽象概念を表現し、下位重要フィールドの読み取り可能な値がツリー構造の下位レベルの概念を表現するように構成されたことを特徴とする請求項14記載のデータ構造。
- 前記単語は、該単語がどのように使用されるかの方法を表現する語根(ルート)を更に含むように構成されたことを特徴とする請求項14記載のデータ構造。
- マシン語の熟語から所定の意味を決定するためのコンピュータ装置において:
ビット表示のデータを同時に受けるためのレジスタを有したプロセッサであり、該プロセッサはレジスタで受けられる単語を処理するようにプログラムされており、該単語は特殊概念を表現しており、また該単語は複数の語根(ルート)を含んでおり、単語の中の各語根は該単語で表現した概念の特徴を定義付けており、該語根は複数のフィールドを含んでおり、全語根中の第1フィールドは前記特徴を含む一般的抽象思想のクラスを表現しており、全語根中の第2フィールドは前記特徴を含むクラス内の思想的小グループを表現しており、各フィールドはレジスタで受けた単語を形成するビット表示のデータで表現されており、前記プロセッサが各フィールド内のビット表示のデータの値を決定しかつ各フィールドの該値と該フィールドの意味が関連付けられてプログラムされている場合に、該プロセッサを含むように構成されたことを特徴とするコンピュータ装置。 - 前記レジスタが、各々の単語の全てのフィールド内のデータを構成するビット数と同一のビット数を同時に受けることができるように構成されたことを特徴とする請求項18記載のコンピュータ装置。
- 特定の語根(ルート)内のフィールドの値が、同じ単語の他の語根の所定のフィールドで参照されるように構成されたことを特徴とする請求項18記載のコンピュータ装置。
- マシン語の熟語から所定の意味を決定するためのコンピュータ装置において:
概念を各々示すデジタルデータ表示の単語を受け取る手段と;
複数のフィールドの値が、前記概念の複数の語根(ルート)内の各語根の思想に関する一般的抽象的なクラスを表現しており、更にその後に続く複数のフィールドの値が、前記複数の語根内の各語根の思想に関する一般的抽象的なクラスのサブクラスを表現しており、前記複数の語根の各語根は、前記単語により表現された概念の特徴を表現しており、各単語は少なくとも一つのフィールドの値で表現される意味に基づき処理される場合に、単語の各々に含まれる各々の複数のフィールドの各フィールド内の値を決定することによって単語を処理する手段;とで構成されたことを特徴とするコンピュータ装置。 - 前記各単語は、デジタルデータについて固定ビット数を有し、前記処理手段には、単語を構成する各ビットを受け容れるレジスタを有するプロセッサを含むように構成されたことを特徴とする請求項21記載のコンピュータ装置。
- 前記処理手段には、単語がどの様に使用されるかを表現する語根(ルート)中にある付加的な複数のフィールド内の値を決定するプロセッサを含むように構成されたことを特徴とする請求項21記載のコンピュータ装置。
- データを記憶する方法において:
分類法の上位レベルが複数のクラスに分かれており、分類法の下位レベルが複数のサブクラスに分かれており、該分類法の各レベルは各語根(ルート)内のフィールドで表現されている場合に、語根のためのツリー構造をした分類法を形成するステップと;
各語根が単語を形成しかつ該単語の特徴を表現している場合に、各単語を形成する複数の語根を結合するステップと;そして
前記単語を記憶するステップ;とで構成されたことを特徴とするデータ記憶方法。 - 語根(ルート)のための分類法は所定の個別規則を含み、この個別規則により語根を形成するフィールドで表現されるクラスおよびサブクラスが、単語を形成する一つの語根と結合した他の語根内の複数のフィールドに基づいて変更されるように構成されたことを特徴とする請求項24記載のデータ記憶方法。
- 単語を形成するために結合した少なくとも一つの語根(ルート)により表現された特徴が、同じ単語を形成するために結合した他の語根に参照されるように構成されたことを特徴とする請求項24記載のデータ記憶方法。
- 前記結合のステップには、否定ビットで各語根(ルート)が否定的に解釈されるか否かを示す場合に、単語を形成する複数の語根と一連の否定ビットが結合することを含むように構成されたことを特徴とする請求項24記載のデータ記憶方法。
- 前記結合のステップには、単語がどの様に使用されるかを表現する一つの語根(ルート)と前記複数の語根とが結合するステップを含むように構成されたことを特徴とする請求項24記載のデータ記憶方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/835,400 US7516063B1 (en) | 2001-04-17 | 2001-04-17 | System and method for storing data using a machine readable vocabulary |
PCT/US2002/011943 WO2002084518A1 (en) | 2001-04-17 | 2002-04-17 | System and method for storing data using a machine readable vocabulary |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005509205A true JP2005509205A (ja) | 2005-04-07 |
Family
ID=25269416
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002582390A Pending JP2005509205A (ja) | 2001-04-17 | 2002-04-17 | 機械で読み取り可能な熟語を使用してデータを記憶するためのシステムと方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US7516063B1 (ja) |
EP (1) | EP1390867A1 (ja) |
JP (1) | JP2005509205A (ja) |
CA (1) | CA2443576A1 (ja) |
WO (1) | WO2002084518A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007219190A (ja) * | 2006-02-17 | 2007-08-30 | Murata Mach Ltd | 音声認識装置と認識方法及びそのプログラム |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4473702B2 (ja) * | 2004-11-02 | 2010-06-02 | 株式会社東芝 | 機械翻訳システム、機械翻訳方法及びプログラム |
US10733223B2 (en) * | 2008-01-08 | 2020-08-04 | International Business Machines Corporation | Term-driven records file plan and thesaurus design |
JP5819860B2 (ja) * | 2010-02-12 | 2015-11-24 | グーグル・インコーポレーテッド | 複合語分割 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4384329A (en) * | 1980-12-19 | 1983-05-17 | International Business Machines Corporation | Retrieval of related linked linguistic expressions including synonyms and antonyms |
US5754847A (en) * | 1987-05-26 | 1998-05-19 | Xerox Corporation | Word/number and number/word mapping |
US5056021A (en) | 1989-06-08 | 1991-10-08 | Carolyn Ausborn | Method and apparatus for abstracting concepts from natural language |
US6101490A (en) | 1991-07-19 | 2000-08-08 | Hatton; Charles Malcolm | Computer system program for creating new ideas and solving problems |
US5737732A (en) * | 1992-07-06 | 1998-04-07 | 1St Desk Systems, Inc. | Enhanced metatree data structure for storage indexing and retrieval of information |
US5873056A (en) | 1993-10-12 | 1999-02-16 | The Syracuse University | Natural language processing system for semantic vector representation which accounts for lexical ambiguity |
US5838965A (en) * | 1994-11-10 | 1998-11-17 | Cadis, Inc. | Object oriented database management system |
US5794050A (en) | 1995-01-04 | 1998-08-11 | Intelligent Text Processing, Inc. | Natural language understanding system |
US5708822A (en) | 1995-05-31 | 1998-01-13 | Oracle Corporation | Methods and apparatus for thematic parsing of discourse |
US6026388A (en) | 1995-08-16 | 2000-02-15 | Textwise, Llc | User interface and other enhancements for natural language information retrieval system and method |
US5778157A (en) | 1996-06-17 | 1998-07-07 | Yy Software Corporation | System and method for expert system analysis using quiescent and parallel reasoning and set structured knowledge representation |
US6622142B1 (en) * | 1999-04-13 | 2003-09-16 | Staktek Group, L.P. | Database utilities |
US6711585B1 (en) * | 1999-06-15 | 2004-03-23 | Kanisa Inc. | System and method for implementing a knowledge management system |
US6332143B1 (en) | 1999-08-11 | 2001-12-18 | Roedy Black Publishing Inc. | System for connotative analysis of discourse |
-
2001
- 2001-04-17 US US09/835,400 patent/US7516063B1/en not_active Expired - Fee Related
-
2002
- 2002-04-17 CA CA002443576A patent/CA2443576A1/en not_active Abandoned
- 2002-04-17 EP EP02733992A patent/EP1390867A1/en not_active Withdrawn
- 2002-04-17 JP JP2002582390A patent/JP2005509205A/ja active Pending
- 2002-04-17 WO PCT/US2002/011943 patent/WO2002084518A1/en not_active Application Discontinuation
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007219190A (ja) * | 2006-02-17 | 2007-08-30 | Murata Mach Ltd | 音声認識装置と認識方法及びそのプログラム |
Also Published As
Publication number | Publication date |
---|---|
CA2443576A1 (en) | 2002-10-24 |
WO2002084518A1 (en) | 2002-10-24 |
US7516063B1 (en) | 2009-04-07 |
EP1390867A1 (en) | 2004-02-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
List et al. | Sequence comparison in computational historical linguistics | |
Anderson et al. | The influence of family groups on inferences made with the program Structure | |
Hayes et al. | Evaluation of three strategies using DNA markers for traceability in aquaculture species | |
CN110223742A (zh) | 中文电子病历数据的临床表现信息抽取方法和设备 | |
EP0964344A2 (en) | Method of and apparatus for forming an index, use of an index and a storage medium | |
Baronchelli et al. | The biological origin of linguistic diversity | |
CN105975458B (zh) | 一种基于细粒度依存关系的中文长句相似度计算方法 | |
CN105938495A (zh) | 实体关系识别方法及装置 | |
CN107609644A (zh) | 用于状态机中的数据分析的方法及系统 | |
CN102214232A (zh) | 一种文本数据相似度的计算方法及装置 | |
da Silva Júnior et al. | A roadmap toward the automatic composition of systematic literature reviews | |
CA2836220A1 (en) | Methods and systems for matching records and normalizing names | |
CN111159412A (zh) | 分类方法、装置、电子设备及可读存储介质 | |
Paraskevopoulou et al. | Differential response to heat stress among evolutionary lineages of an aquatic invertebrate species complex | |
CN115344504B (zh) | 基于需求规格说明书的软件测试用例自动生成方法及工具 | |
US20090234852A1 (en) | Sub-linear approximate string match | |
Winkler et al. | Sectioned or whole otoliths? A global review of hard structure preparation techniques used in ageing sparid fishes | |
CN106815265A (zh) | 裁判文书的搜索方法及装置 | |
JP2005509205A (ja) | 機械で読み取り可能な熟語を使用してデータを記憶するためのシステムと方法 | |
Dowling et al. | Population structure in the Roundtail Chub (Gila robusta complex) of the Gila River basin as determined by microsatellites: evolutionary and conservation implications | |
Omar | Feature selection in text clustering applications of literary texts: A hybrid of term weighting methods | |
Östergren et al. | Close relatives in population samples: evaluation of the consequences for genetic stock identification | |
Nédellec et al. | WTO, an ontology for wheat traits and phenotypes in scientific publications | |
Jónsson et al. | The effect of growth rate on otolith-based discrimination of cod (Gadus morhua) ecotypes | |
Lloréns et al. | Automatic generation of domain representations using thesaurus structures |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050111 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050415 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070406 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20070703 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20070711 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20071012 |