RU2004115749A - Неограниченная языком компьютеризованная кодирующая-декодирующая система и способ - Google Patents

Неограниченная языком компьютеризованная кодирующая-декодирующая система и способ Download PDF

Info

Publication number
RU2004115749A
RU2004115749A RU2004115749/09A RU2004115749A RU2004115749A RU 2004115749 A RU2004115749 A RU 2004115749A RU 2004115749/09 A RU2004115749/09 A RU 2004115749/09A RU 2004115749 A RU2004115749 A RU 2004115749A RU 2004115749 A RU2004115749 A RU 2004115749A
Authority
RU
Russia
Prior art keywords
elements
semantic
indicated
unique
field
Prior art date
Application number
RU2004115749/09A
Other languages
English (en)
Inventor
Густаво ПОРТИЛЛА (CO)
Густаво ПОРТИЛЛА
Original Assignee
Диджитал Эсперанто, Инк. (Us)
Диджитал Эсперанто, Инк.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Диджитал Эсперанто, Инк. (Us), Диджитал Эсперанто, Инк. filed Critical Диджитал Эсперанто, Инк. (Us)
Publication of RU2004115749A publication Critical patent/RU2004115749A/ru

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/47Machine-assisted translation, e.g. using translation memory
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation

Claims (12)

1. Компьютеризованная система кодирования слов и символов, характеризующаяся тем, что она содержит:
a) компьютерное средство, имеющее ассоциативное запоминающее устройство;
b) первую индексную базу данных, имеющую первое поле, содержащее коды для множества уникальных смысловых элементов, и второе поле слов или символов, которые соответствуют по значению каждому указанному уникальному смысловому элементу, отличающаяся тем, что она также содержит средство для классифицирования указанных смысловых элементов по одному из заранее заданного набора классов, при этом указанная первая индексная база данных находится в указанном запоминающем устройстве;
c) средство ввода, обеспечивающее ввод слов и символов в указанное компьютерное средство;
d) программное кодирующее средство для выбора одного из указанных смысловых элементов для каждого из слов или символов, введенных посредством указанного вводного устройства, которое включает в свой состав средство для проверки того, соответствуют ли введенные слово или символ уникальному смысловому элементу, и, если указанное слово или символ действительно имеет один смысловой элемент, то создает итоговый код, и, кроме того, включающее средство для отображения выбранных смысловых элементов, в случае если указанное слово или символ, которые вводятся, действительно имеют более одного смыслового элемента, включающее дополнительно в свой состав средство для обнаружения одного смыслового элемента, выбранного пользователем из указанной выведенной на экран информации, проверенной на наличие смысловых элементов для создания итогового кода смыслового элемента; и
e) средство вывода для сохранения в памяти указанного кода значения.
2. Компьютеризированная система по п.1, отличающаяся тем, что указанная первая индексная база данных включает в себя множество вторых полей, причем каждое второе поле связано с одним языком, имеющим, по меньшей мере, одно слово или символ, который соответствует по значению каждому из указанных смысловых элементов.
3. Компьютеризированная система по п.2, отличающаяся тем, что она дополнительно содержит:
f) вторую индексную базу данных, имеющую третье поле, содержащее коды для множества грамматических структурных элементов и множество четвертых полей, причем каждое четвертое поле включает в свой состав заранее заданное количество грамматических структурных элементов в языке, при этом каждый из указанных грамматических структурных элементов в каждом указанном четвертом поле коррелируется только с одним из вторых грамматических структурных элементов других четвертых полей, а указанные грамматические структурные элементы классифицируются в соответствии с последовательностями классов указанных смысловых элементов, которые содержатся в каждом из указанных грамматических структурных элементов;
g) средство, обеспечивающее идентификацию последовательностей классов из указанных полученных кодов смысловых элементов и корреляцию указанных неявных последовательностей классов в указанных в кодах смысловых элементов с одной из указанных грамматических структурных элементов и генерацию итогового кода грамматического структурного элемента; и
h) средство вывода для сохранения в памяти указанного итогового кода грамматического структурного элемента.
4. Компьютеризированная система по п.4, отличающаяся тем, что она дополнительно содержит:
i) декодирующее программное средство для выбора одного из указанного итоговых кодов смысловых элементов и перекрестной отсылки каждого из указанных итоговых кодов смысловых элементов к уникальному слову или символу и
j) средство вывода для сохранения в памяти указанных слов или символов.
5. Компьютеризированная система по п.4, отличающаяся тем, что указанная первая индексная база данных включает в свой состав множество вторых полей, причем каждое второе поле связано с одним языком, имеющим, по меньшей мере, одно слово или символ, которое соответствует по значению каждому из указанных смысловых элементов.
6. Компьютеризированная система по п.5, отличающаяся тем, что она дополнительно содержит:
f) вторую индексную базу данных, имеющую множество третьих полей, причем каждое третье поле включает в свой состав заранее заданное количество грамматических структурных элементов языка, при этом каждый из указанных грамматических структурных элементов в каждом указанном третьем поле коррелируется только с одним из указанных грамматических структурных элементов других третьих полей, а указанные грамматические структурные единицы классифицируются в соответствии с последовательностями классов указанных смысловых элементов, которые содержатся в каждом из указанных грамматических структурных элементах;
g) средство, обеспечивающее идентификацию последовательностей классов указанных итоговых кодов смысловых элементов и корреляцию указанных последовательностей неявных классов в указанных кодах смысловых элементов с одним из указанных грамматических структурных элементов и последующую генерацию итогового кода грамматического структурного элемента;
i) средство вывода для сохранения в памяти указанного итогового кода грамматического структурного элемента;
k) средство, обеспечивающее идентификацию указанных итоговых кодов грамматических структурных элементов с уникальной последовательностью классов из полученных смысловых элементов;
l) средство для компоновки указанных уникальных слов или символов в одной из указанных последовательностей классов полученных смысловых элементов и
m) средство вывода для сохранения в памяти указанных уникальных последовательностей уникальных слов или символов.
7. Способ кодирования слова и символов, характеризующийся тем, что он включает операции:
a) размещения множества уникальных смысловых элементов в первом поле первой индексной базы данных;
b) размещения соответствующего множества слов или символов во втором поле указанной первой индексной базы данных;
c) группировки указанных смысловых элементов в одном из множества классов;
d) ввода слов или символов в компьютеризированную систему, сопровождаемого выбором смыслового элемента для каждого указанного слова или символа, которые вводят;
e) проверки того, соответствует ли каждое из указанных слов или символов истинному значению уникального смыслового элемента;
f) проверки того, что все введенные уникальные смысловые элементы для слов или символов имеют более одного уникального смыслового элемента, и подтверждения достоверности одного из указанного смыслового элемента;
g) выбора уникального смыслового элемента для введенных достоверных слов или символов с генерацией итогового кода и
h) записи в память указанного итогового кода смыслового элемента.
8. Способ по п.1, отличающийся тем, что он дополнительно включает операции:
i) компоновки заранее определенного количества вторых полей, одного второго поля для каждого языка и каждого второго поля, имеющего, по меньшей мере, одно слово или символ, который соответствует по значению каждому из указанных смысловых элементов.
9. Способ по п.7, отличающийся тем, что он также включает операции:
j) размещения множества грамматических структурных элементов в каждом заранее заданном количестве третьих полей во второй индексной базе данных и указанных грамматических структурных элементах, характеризуемых тем, что имеют уникальную последовательность классов из смысловых элементов, при этом каждое третье поле связанно с другим языком, а каждое из указанных грамматических структурных элементов в каждом из указанных третьих полей ссылается на другие элементы в другом третьем поле и обычно идентифицируется по коду грамматического структурного элемента;
k) идентификации последовательностей классов указанного итогового кода смыслового элемента и последующей корреляции указанных последовательностей с одним из указанных грамматических структурных элементов указанных третьих полей и
l) сохранения в памяти итогового грамматического кода.
10. Способ по п.7, отличающийся тем, что он также включает операции:
m) ввода указанного итогового кода в компьютеризированную систему;
n) выбора каждого из указанных итоговых кодов и их перекрестной отсылки для уникального слова или символа и
о) сохранения в памяти указанных слов или символов.
11. Способ по п.10, отличающийся тем, что он также включает операции:
р) компоновки заранее определенного количества вторых полей, одного второго поля для каждого языка и каждого второго поля, имеющего, по меньшей мере, одно слово или символ, которое соответствует по значению каждому из указанных смысловых элементов.
12. Способ по п.11, отличающийся тем, что он также включает операции:
j) размещения множества грамматических структурных элементов в каждом заранее заданном количестве третьих полей во второй индексной базе данных и указанных грамматических структурных элементов, характеризуемых тем, что имеют уникальную последовательность классов смысловых элементов, при этом каждое третье поле связанно с другим языком, а каждый из указанных грамматических структурных элементов в каждом из указанных третьих полей ссылается на другие элементы в другом третьем поле и обычно идентифицируется по коду грамматического структурного элемента;
k) идентификации последовательностей классов указанных итоговых кодов смысловых элементов и последующей корреляции указанных последовательностей с одним из указанных грамматических структурных элементов в указанных третьих полях и
l) сохранения в памяти итогового грамматического кода;
q) идентификации указанных кодов грамматического структурных элементов с уникальной последовательностью классов полученных смысловых элементов;
r) компоновку указанных уникальных слов или символов в одну из указанных уникальных последовательностей классов полученных смысловых элементов и
s) сохранение в памяти указанных последовательностей уникальных слов или символов.
RU2004115749/09A 2001-10-22 2002-03-28 Неограниченная языком компьютеризованная кодирующая-декодирующая система и способ RU2004115749A (ru)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/033,133 US20020052748A1 (en) 1999-07-09 2001-10-22 Computerized coder-decoder without being restricted by language and method
US10/033,133 2001-10-22

Publications (1)

Publication Number Publication Date
RU2004115749A true RU2004115749A (ru) 2005-10-27

Family

ID=21868726

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2004115749/09A RU2004115749A (ru) 2001-10-22 2002-03-28 Неограниченная языком компьютеризованная кодирующая-декодирующая система и способ

Country Status (10)

Country Link
US (1) US20020052748A1 (ru)
EP (1) EP1449118A1 (ru)
JP (1) JP2005506635A (ru)
KR (1) KR20040047939A (ru)
CN (1) CN1575467A (ru)
BR (1) BR0213667A (ru)
CA (1) CA2503329A1 (ru)
MX (1) MXPA04003792A (ru)
RU (1) RU2004115749A (ru)
WO (1) WO2003036522A1 (ru)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070265834A1 (en) * 2001-09-06 2007-11-15 Einat Melnick In-context analysis
EP1567941A2 (en) * 2002-11-28 2005-08-31 Koninklijke Philips Electronics N.V. Method to assign word class information
US20100280818A1 (en) * 2006-03-03 2010-11-04 Childers Stephen R Key Talk
US20070206771A1 (en) * 2006-03-03 2007-09-06 Childers Stephen Steve R Key talk
WO2008048090A2 (en) * 2006-10-18 2008-04-24 Calculemus B.V. Method, device, computer program and computer program product for processing linguistic data in accordance with a formalized natural language.
US9323854B2 (en) * 2008-12-19 2016-04-26 Intel Corporation Method, apparatus and system for location assisted translation
AU2015360472B2 (en) * 2014-12-10 2021-07-01 Qliktech International Ab Weighted subsymbolic data encoding
CN110096481B (zh) * 2019-04-19 2021-03-23 福建天晴数码有限公司 文件编码的识别方法及计算机可读存储介质

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2831647B2 (ja) * 1988-03-31 1998-12-02 株式会社東芝 機械翻訳システム
JP3176059B2 (ja) * 1990-11-15 2001-06-11 キヤノン株式会社 翻訳装置
US5442782A (en) * 1993-08-13 1995-08-15 Peoplesoft, Inc. Providing information from a multilingual database of language-independent and language-dependent items
US5715468A (en) * 1994-09-30 1998-02-03 Budzinski; Robert Lucius Memory system for storing and retrieving experience and knowledge with natural language
US5852798A (en) * 1995-08-08 1998-12-22 Matsushita Electric Industrial Co., Ltd. Machine translation apparatus and method for translating received data during data communication
US5963940A (en) * 1995-08-16 1999-10-05 Syracuse University Natural language information retrieval system and method
US6026388A (en) * 1995-08-16 2000-02-15 Textwise, Llc User interface and other enhancements for natural language information retrieval system and method

Also Published As

Publication number Publication date
WO2003036522A1 (en) 2003-05-01
CN1575467A (zh) 2005-02-02
KR20040047939A (ko) 2004-06-05
US20020052748A1 (en) 2002-05-02
EP1449118A1 (en) 2004-08-25
CA2503329A1 (en) 2003-05-01
JP2005506635A (ja) 2005-03-03
BR0213667A (pt) 2004-11-30
MXPA04003792A (es) 2004-07-30

Similar Documents

Publication Publication Date Title
CN100589099C (zh) 可配置的信息识别系统和方法
US5261087A (en) Electronic information retrieval system with relative difference analyzer
CN102402584A (zh) 多语言文本中的语言识别
US7359896B2 (en) Information retrieving system, information retrieving method, and information retrieving program
CN1950819B (zh) 检索信息的系统和方法以及储存信息的系统和方法
Sproat Lightly supervised learning of text normalization: Russian number names
JPWO2008032780A1 (ja) 検索方法、類似度計算方法、類似度計算及び同一文書照合システムと、そのプログラム
CN112667775A (zh) 基于关键词提示的检索方法、装置、电子设备及存储介质
RU2004115749A (ru) Неограниченная языком компьютеризованная кодирующая-декодирующая система и способ
CN101470701A (zh) 支持基于有限状态机的语义规则的文本分析器及其方法
Singh et al. Identification of languages and encodings in a multilingual document
CN116360794A (zh) 数据库语言解析方法、装置、计算机设备及存储介质
JP6470249B2 (ja) データクレンジングシステム、データクレンジング方法及びデータクレンジングプログラム
WO2014002212A1 (ja) 文書関連付け方法および文書検索方法、文書関連付け装置および文書検索装置、並びにそのためのプログラム
CN102177511A (zh) 汉字排序检索方法
JP4382634B2 (ja) 住所解析装置、住所解析方法及び住所解析プログラム
US20050065775A1 (en) Method and system for inputting chinese characters
JPS5882373A (ja) オンライン文字認識方法
JPH0748217B2 (ja) 文書要約装置
WO2023162273A1 (ja) 生成方法、生成プログラムおよび情報処理装置
JP4195780B2 (ja) プログラム、データ処理システム及び記憶媒体
Du et al. A novel pattern learning method for open domain question answering
Collins et al. Automated data verification in a format-free environment
JP2007140781A (ja) 名義解析装置、名義解析方法及び名義解析プログラム
JPH01259448A (ja) 漢字入力方式

Legal Events

Date Code Title Description
FA92 Acknowledgement of application withdrawn (lack of supplementary materials submitted)

Effective date: 20060615