RU2007149528A - Сети отношений - Google Patents

Сети отношений Download PDF

Info

Publication number
RU2007149528A
RU2007149528A RU2007149528/09A RU2007149528A RU2007149528A RU 2007149528 A RU2007149528 A RU 2007149528A RU 2007149528/09 A RU2007149528/09 A RU 2007149528/09A RU 2007149528 A RU2007149528 A RU 2007149528A RU 2007149528 A RU2007149528 A RU 2007149528A
Authority
RU
Russia
Prior art keywords
terms
data
data element
vectors
data elements
Prior art date
Application number
RU2007149528/09A
Other languages
English (en)
Inventor
Кэсиан ФРЭНКС (US)
Кэсиан ФРЭНКС
Корнелия А. МАЙЕРС (US)
Корнелия А. МАЙЕРС
Раф М. ПОДОВСКИ (US)
Раф М. ПОДОВСКИ
Original Assignee
Дзе Риджентс Оф Дзе Юниверсити Оф Калифорния (Us)
Дзе Риджентс Оф Дзе Юниверсити Оф Калифорния
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Дзе Риджентс Оф Дзе Юниверсити Оф Калифорния (Us), Дзе Риджентс Оф Дзе Юниверсити Оф Калифорния filed Critical Дзе Риджентс Оф Дзе Юниверсити Оф Калифорния (Us)
Publication of RU2007149528A publication Critical patent/RU2007149528A/ru

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3347Query execution using vector based model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/06Arrangements for sorting, selecting, merging, or comparing data on individual record carriers

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

1. Реализуемый посредством компьютера процесс для формирования сети отношений, включающий в себя этапы, на которых: ! (a) обеспечивают набор элементов данных, которые должны быть соотнесены, при этом упомянутые элементы данных содержат множество терминов; ! (b) выбирают первый элемент данных для обработки; ! (c) применяют структуру к упомянутому первому элементу данных, при этом упомянутая структура содержит первый набор терминов внутри упомянутого элемента данных; ! (d) вычисляют вектора данных для терминов внутри упомянутой структуры; ! (e) перемещают упомянутую структуру для включения в нее второго набора терминов внутри упомянутого элемента данных; ! (f) создают сеть отношений посредством повторения этапов (d)-(e) до вычисления векторов данных для всех терминов в упомянутом элементе данных; и ! (g) сохраняют упомянутую сеть отношений в запоминающем устройстве. ! 2. Способ по п.1, содержащий этап, на котором добавляют весовые значения упомянутым векторам данных для уникальных терминов в упомянутом первом элементе данных. ! 3. Способ по п.2, в котором упомянутые весовые значения относятся к частоте упомянутых терминов в упомянутом первом элементе данных. ! 4. Способ по п.1, в котором упомянутые элементы данных содержат документы, и упомянутые термины содержат слова. ! 5. Способ по п.4, в котором упомянутая структура содержит по меньшей мере три предложения в упомянутом элементе данных. ! 6. Способ по п.1, дополнительно содержащий этап, на котором удаляют определенные термины из упомянутых элементов данных. ! 7. Способ по п.1, в котором упомянутое вычисление содержит использование последовательности Фибоначчи в обратном порядке для п�

Claims (17)

1. Реализуемый посредством компьютера процесс для формирования сети отношений, включающий в себя этапы, на которых:
(a) обеспечивают набор элементов данных, которые должны быть соотнесены, при этом упомянутые элементы данных содержат множество терминов;
(b) выбирают первый элемент данных для обработки;
(c) применяют структуру к упомянутому первому элементу данных, при этом упомянутая структура содержит первый набор терминов внутри упомянутого элемента данных;
(d) вычисляют вектора данных для терминов внутри упомянутой структуры;
(e) перемещают упомянутую структуру для включения в нее второго набора терминов внутри упомянутого элемента данных;
(f) создают сеть отношений посредством повторения этапов (d)-(e) до вычисления векторов данных для всех терминов в упомянутом элементе данных; и
(g) сохраняют упомянутую сеть отношений в запоминающем устройстве.
2. Способ по п.1, содержащий этап, на котором добавляют весовые значения упомянутым векторам данных для уникальных терминов в упомянутом первом элементе данных.
3. Способ по п.2, в котором упомянутые весовые значения относятся к частоте упомянутых терминов в упомянутом первом элементе данных.
4. Способ по п.1, в котором упомянутые элементы данных содержат документы, и упомянутые термины содержат слова.
5. Способ по п.4, в котором упомянутая структура содержит по меньшей мере три предложения в упомянутом элементе данных.
6. Способ по п.1, дополнительно содержащий этап, на котором удаляют определенные термины из упомянутых элементов данных.
7. Способ по п.1, в котором упомянутое вычисление содержит использование последовательности Фибоначчи в обратном порядке для получения коэффициента затухания между терминами в упомянутой структуре.
8. Система для формирования отношений между элементами данных, содержащая:
память, содержащую набор элементов данных, которые должны быть соотнесены, при этом каждый элемент данных содержит несколько терминов;
генератор структуры, сконфигурированный для формирования структуры, которая выбирает несколько терминов в упомянутых элементах данных для ассоциирования; и
генератор векторов, сконфигурированный для формирования векторов данных для представления ассоциаций между элементами данных внутри упомянутой структуры.
9. Система по п.8, в которой генератор векторов содержит инструкции для назначения измерения расстояния каждому из упомянутых элементов данных в упомянутой структуре.
10. Система по п.9, в которой упомянутые инструкции используют вычисление затухания Фибоначчи.
11. Система по п.8, в которой упомянутый генератор векторов содержит инструкции для изменения векторов данных на основе частоты термина внутри структуры, разделенной на частоту термина в полном наборе документов.
12. Система по п.8, дополнительно содержащая инструкции для удаления слов черного списка из документов.
13. Система по п.8, дополнительно содержащая инструкции для обработки терминов, содержащих в качестве одиночных терминов многословные фразы.
14. Система по п.8, дополнительно содержащая модуль ввода для принятия термина запроса от пользователя и для определения векторов отношений, ассоциированных с упомянутым термином запроса.
15. Система по п.14, дополнительно содержащая модуль извлечения, содержащий инструкции для извлечения всех векторов отношений для упомянутого термина запроса.
16. Система по п.15, дополнительно содержащая генератор списка, содержащий инструкции для формирования списка упомянутых векторов отношений в соответствии с оценкой уникальности.
17. Система по п.8, в которой упомянутый генератор векторов содержит инструкции для вычисления расстояния между терминами.
RU2007149528/09A 2005-06-06 2006-06-05 Сети отношений RU2007149528A (ru)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US68824205P 2005-06-06 2005-06-06
US60/688,242 2005-06-06

Publications (1)

Publication Number Publication Date
RU2007149528A true RU2007149528A (ru) 2009-07-10

Family

ID=37498976

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2007149528/09A RU2007149528A (ru) 2005-06-06 2006-06-05 Сети отношений

Country Status (9)

Country Link
US (2) US7987191B2 (ru)
EP (1) EP1891558A2 (ru)
JP (1) JP2008542951A (ru)
KR (1) KR20080031262A (ru)
CN (1) CN101223525B (ru)
AU (1) AU2006255181A1 (ru)
CA (1) CA2610088A1 (ru)
RU (1) RU2007149528A (ru)
WO (1) WO2006133050A2 (ru)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9420072B2 (en) 2003-04-25 2016-08-16 Z124 Smartphone databoost
KR100724122B1 (ko) * 2005-09-28 2007-06-04 최진근 데이터의 연관성 구조를 저장하는 번들데이터베이스관리시스템 및 그 관리방법
US20110066624A1 (en) * 2006-08-01 2011-03-17 Divyank Turakhia system and method of generating related words and word concepts
US8108417B2 (en) 2007-04-04 2012-01-31 Intertrust Technologies Corporation Discovering and scoring relationships extracted from human generated lists
US8275681B2 (en) 2007-06-12 2012-09-25 Media Forum, Inc. Desktop extension for readily-sharable and accessible media playlist and media
EP2191399A1 (en) 2007-09-21 2010-06-02 International Business Machines Corporation System and method for analyzing electronic data records
US8326823B2 (en) 2007-11-01 2012-12-04 Ebay Inc. Navigation for large scale graphs
US8370368B2 (en) 2007-11-15 2013-02-05 International Business Machines Corporation System and method for providing user-tailored views
US8250637B2 (en) * 2008-04-29 2012-08-21 International Business Machines Corporation Determining the degree of relevance of duplicate alerts in an entity resolution system
US8015137B2 (en) 2008-04-29 2011-09-06 International Business Machines Corporation Determining the degree of relevance of alerts in an entity resolution system over alert disposition lifecycle
US8326788B2 (en) * 2008-04-29 2012-12-04 International Business Machines Corporation Determining the degree of relevance of alerts in an entity resolution system
US20090271394A1 (en) * 2008-04-29 2009-10-29 Allen Thomas B Determining the degree of relevance of entities and identities in an entity resolution system that maintains alert relevance
US8271483B2 (en) * 2008-09-10 2012-09-18 Palo Alto Research Center Incorporated Method and apparatus for detecting sensitive content in a document
US20110196872A1 (en) * 2008-10-10 2011-08-11 The Regents Of The University Of California Computational Method for Comparing, Classifying, Indexing, and Cataloging of Electronically Stored Linear Information
GB0906004D0 (en) * 2009-04-07 2009-05-20 Omnifone Ltd MusicStation desktop
US9727842B2 (en) * 2009-08-21 2017-08-08 International Business Machines Corporation Determining entity relevance by relationships to other relevant entities
US8788576B2 (en) 2010-09-27 2014-07-22 Z124 High speed parallel data exchange with receiver side data handling
US8751682B2 (en) 2010-09-27 2014-06-10 Z124 Data transfer using high speed connection, high integrity connection, and descriptor
US8499051B2 (en) * 2011-07-21 2013-07-30 Z124 Multiple messaging communication optimization
US9774721B2 (en) 2011-09-27 2017-09-26 Z124 LTE upgrade module
US9495012B2 (en) 2011-09-27 2016-11-15 Z124 Secondary single screen mode activation through user interface activation
WO2014143878A1 (en) * 2013-03-15 2014-09-18 The Board Of Trustees Of The Leland Stanford Junior University Systems and methods for recommending relationships within a graph database
US9141676B2 (en) * 2013-12-02 2015-09-22 Rakuten Usa, Inc. Systems and methods of modeling object networks
EP3238095A4 (en) * 2014-12-23 2018-07-11 Microsoft Technology Licensing, LLC Surfacing relationships between datasets
JP6080137B1 (ja) * 2015-08-14 2017-02-15 Psソリューションズ株式会社 対話インターフェース
JP6034459B1 (ja) * 2015-08-14 2016-11-30 Psソリューションズ株式会社 対話インターフェース
US10296527B2 (en) 2015-12-08 2019-05-21 Internatioanl Business Machines Corporation Determining an object referenced within informal online communications
CN105760273A (zh) * 2016-01-29 2016-07-13 浪潮通信信息系统有限公司 一种处理指标的方法及装置
CN108073563A (zh) * 2016-11-08 2018-05-25 北京国双科技有限公司 数据的生成方法及装置
US11281993B2 (en) * 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
US20230350931A1 (en) * 2019-12-20 2023-11-02 Benevolentai Technology Limited System of searching and filtering entities

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5325298A (en) * 1990-11-07 1994-06-28 Hnc, Inc. Methods for generating or revising context vectors for a plurality of word stems
US5619709A (en) * 1993-09-20 1997-04-08 Hnc, Inc. System and method of context vector generation and retrieval
JP3195752B2 (ja) * 1997-02-28 2001-08-06 シャープ株式会社 検索装置
US6405188B1 (en) * 1998-07-31 2002-06-11 Genuity Inc. Information retrieval system
US6138113A (en) * 1998-08-10 2000-10-24 Altavista Company Method for identifying near duplicate pages in a hyperlinked database
US6473753B1 (en) * 1998-10-09 2002-10-29 Microsoft Corporation Method and system for calculating term-document importance
US6721728B2 (en) * 2001-03-02 2004-04-13 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration System, method and apparatus for discovering phrases in a database
JP3775239B2 (ja) * 2001-05-16 2006-05-17 日本電信電話株式会社 テキスト分割方法及び装置及びテキスト分割プログラム及びテキスト分割プログラムを格納した記憶媒体
US6687690B2 (en) * 2001-06-14 2004-02-03 International Business Machines Corporation Employing a combined function for exception exploration in multidimensional data
JP3960530B2 (ja) * 2002-06-19 2007-08-15 株式会社日立製作所 テキストマイニングプログラム、方法、及び装置
JP3925418B2 (ja) * 2003-01-31 2007-06-06 日本電信電話株式会社 トピック境界決定装置及びプログラム
JP3847273B2 (ja) * 2003-05-12 2006-11-22 沖電気工業株式会社 単語分類装置、単語分類方法及び単語分類プログラム
JP2005135139A (ja) * 2003-10-30 2005-05-26 Recruit Co Ltd 構造解析システム
US20050120011A1 (en) * 2003-11-26 2005-06-02 Word Data Corp. Code, method, and system for manipulating texts

Also Published As

Publication number Publication date
US7987191B2 (en) 2011-07-26
JP2008542951A (ja) 2008-11-27
US20120054206A1 (en) 2012-03-01
WO2006133050A2 (en) 2006-12-14
US9026543B2 (en) 2015-05-05
CA2610088A1 (en) 2006-12-14
KR20080031262A (ko) 2008-04-08
AU2006255181A1 (en) 2006-12-14
CN101223525A (zh) 2008-07-16
US20080162514A1 (en) 2008-07-03
CN101223525B (zh) 2012-04-25
WO2006133050A3 (en) 2007-07-12
EP1891558A2 (en) 2008-02-27

Similar Documents

Publication Publication Date Title
RU2007149528A (ru) Сети отношений
CN106021457B (zh) 基于关键词的rdf分布式语义搜索方法
CN100445999C (zh) 一种数据存储及搜索方法
WO2008125495A3 (en) A method and system for finding a focus of a document
US20160217186A1 (en) Distributed fuzzy search and join with edit distance guarantees
KR20150070171A (ko) 스트링 변환의 귀납적 합성을 위한 랭킹 기법
US20120317087A1 (en) Location-Aware Search Ranking
US9449116B2 (en) Online radix tree compression with key sequence skip
CN109960814B (zh) 模型参数搜索方法以及装置
CN109062914A (zh) 用户推荐方法和装置,存储介质和服务器
CN106557476A (zh) 相关信息的获取方法及装置
CN105488176A (zh) 数据处理方法和装置
CN108875062A (zh) 一种重复视频的确定方法及装置
CN109542612A (zh) 一种热点关键字获取方法、装置及服务器
D'Angelo et al. Fully dynamic update of arc‐flags
CN108304384A (zh) 拆词方法及设备
Zhao et al. An integer programming column generation principle for heuristic search methods
Muñoz et al. Shears: Unstructured sparsity with neural low-rank adapter search
CN103257977B (zh) 获取标识号码的方法及装置
CN103020300B (zh) 一种信息检索方法和设备
Poltoratski Bernstein’s problem on weighted polynomial approximation
CN113780827A (zh) 一种物品筛选方法、装置、电子设备及计算机可读介质
Bogoya A nonlocal nonlinear diffusion equation in higher space dimensions
CN104765835B (zh) 一种搜索词的搜索方法及装置
CN103064872A (zh) 使用数据结构处理搜索查询

Legal Events

Date Code Title Description
FA92 Acknowledgement of application withdrawn (lack of supplementary materials submitted)

Effective date: 20101026