RU2007149528A - Сети отношений - Google Patents
Сети отношений Download PDFInfo
- Publication number
- RU2007149528A RU2007149528A RU2007149528/09A RU2007149528A RU2007149528A RU 2007149528 A RU2007149528 A RU 2007149528A RU 2007149528/09 A RU2007149528/09 A RU 2007149528/09A RU 2007149528 A RU2007149528 A RU 2007149528A RU 2007149528 A RU2007149528 A RU 2007149528A
- Authority
- RU
- Russia
- Prior art keywords
- terms
- data
- data element
- vectors
- data elements
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3347—Query execution using vector based model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F7/00—Methods or arrangements for processing data by operating upon the order or content of the data handled
- G06F7/06—Arrangements for sorting, selecting, merging, or comparing data on individual record carriers
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
1. Реализуемый посредством компьютера процесс для формирования сети отношений, включающий в себя этапы, на которых: ! (a) обеспечивают набор элементов данных, которые должны быть соотнесены, при этом упомянутые элементы данных содержат множество терминов; ! (b) выбирают первый элемент данных для обработки; ! (c) применяют структуру к упомянутому первому элементу данных, при этом упомянутая структура содержит первый набор терминов внутри упомянутого элемента данных; ! (d) вычисляют вектора данных для терминов внутри упомянутой структуры; ! (e) перемещают упомянутую структуру для включения в нее второго набора терминов внутри упомянутого элемента данных; ! (f) создают сеть отношений посредством повторения этапов (d)-(e) до вычисления векторов данных для всех терминов в упомянутом элементе данных; и ! (g) сохраняют упомянутую сеть отношений в запоминающем устройстве. ! 2. Способ по п.1, содержащий этап, на котором добавляют весовые значения упомянутым векторам данных для уникальных терминов в упомянутом первом элементе данных. ! 3. Способ по п.2, в котором упомянутые весовые значения относятся к частоте упомянутых терминов в упомянутом первом элементе данных. ! 4. Способ по п.1, в котором упомянутые элементы данных содержат документы, и упомянутые термины содержат слова. ! 5. Способ по п.4, в котором упомянутая структура содержит по меньшей мере три предложения в упомянутом элементе данных. ! 6. Способ по п.1, дополнительно содержащий этап, на котором удаляют определенные термины из упомянутых элементов данных. ! 7. Способ по п.1, в котором упомянутое вычисление содержит использование последовательности Фибоначчи в обратном порядке для п�
Claims (17)
1. Реализуемый посредством компьютера процесс для формирования сети отношений, включающий в себя этапы, на которых:
(a) обеспечивают набор элементов данных, которые должны быть соотнесены, при этом упомянутые элементы данных содержат множество терминов;
(b) выбирают первый элемент данных для обработки;
(c) применяют структуру к упомянутому первому элементу данных, при этом упомянутая структура содержит первый набор терминов внутри упомянутого элемента данных;
(d) вычисляют вектора данных для терминов внутри упомянутой структуры;
(e) перемещают упомянутую структуру для включения в нее второго набора терминов внутри упомянутого элемента данных;
(f) создают сеть отношений посредством повторения этапов (d)-(e) до вычисления векторов данных для всех терминов в упомянутом элементе данных; и
(g) сохраняют упомянутую сеть отношений в запоминающем устройстве.
2. Способ по п.1, содержащий этап, на котором добавляют весовые значения упомянутым векторам данных для уникальных терминов в упомянутом первом элементе данных.
3. Способ по п.2, в котором упомянутые весовые значения относятся к частоте упомянутых терминов в упомянутом первом элементе данных.
4. Способ по п.1, в котором упомянутые элементы данных содержат документы, и упомянутые термины содержат слова.
5. Способ по п.4, в котором упомянутая структура содержит по меньшей мере три предложения в упомянутом элементе данных.
6. Способ по п.1, дополнительно содержащий этап, на котором удаляют определенные термины из упомянутых элементов данных.
7. Способ по п.1, в котором упомянутое вычисление содержит использование последовательности Фибоначчи в обратном порядке для получения коэффициента затухания между терминами в упомянутой структуре.
8. Система для формирования отношений между элементами данных, содержащая:
память, содержащую набор элементов данных, которые должны быть соотнесены, при этом каждый элемент данных содержит несколько терминов;
генератор структуры, сконфигурированный для формирования структуры, которая выбирает несколько терминов в упомянутых элементах данных для ассоциирования; и
генератор векторов, сконфигурированный для формирования векторов данных для представления ассоциаций между элементами данных внутри упомянутой структуры.
9. Система по п.8, в которой генератор векторов содержит инструкции для назначения измерения расстояния каждому из упомянутых элементов данных в упомянутой структуре.
10. Система по п.9, в которой упомянутые инструкции используют вычисление затухания Фибоначчи.
11. Система по п.8, в которой упомянутый генератор векторов содержит инструкции для изменения векторов данных на основе частоты термина внутри структуры, разделенной на частоту термина в полном наборе документов.
12. Система по п.8, дополнительно содержащая инструкции для удаления слов черного списка из документов.
13. Система по п.8, дополнительно содержащая инструкции для обработки терминов, содержащих в качестве одиночных терминов многословные фразы.
14. Система по п.8, дополнительно содержащая модуль ввода для принятия термина запроса от пользователя и для определения векторов отношений, ассоциированных с упомянутым термином запроса.
15. Система по п.14, дополнительно содержащая модуль извлечения, содержащий инструкции для извлечения всех векторов отношений для упомянутого термина запроса.
16. Система по п.15, дополнительно содержащая генератор списка, содержащий инструкции для формирования списка упомянутых векторов отношений в соответствии с оценкой уникальности.
17. Система по п.8, в которой упомянутый генератор векторов содержит инструкции для вычисления расстояния между терминами.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US68824205P | 2005-06-06 | 2005-06-06 | |
US60/688,242 | 2005-06-06 |
Publications (1)
Publication Number | Publication Date |
---|---|
RU2007149528A true RU2007149528A (ru) | 2009-07-10 |
Family
ID=37498976
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2007149528/09A RU2007149528A (ru) | 2005-06-06 | 2006-06-05 | Сети отношений |
Country Status (9)
Country | Link |
---|---|
US (2) | US7987191B2 (ru) |
EP (1) | EP1891558A2 (ru) |
JP (1) | JP2008542951A (ru) |
KR (1) | KR20080031262A (ru) |
CN (1) | CN101223525B (ru) |
AU (1) | AU2006255181A1 (ru) |
CA (1) | CA2610088A1 (ru) |
RU (1) | RU2007149528A (ru) |
WO (1) | WO2006133050A2 (ru) |
Families Citing this family (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9420072B2 (en) | 2003-04-25 | 2016-08-16 | Z124 | Smartphone databoost |
KR100724122B1 (ko) * | 2005-09-28 | 2007-06-04 | 최진근 | 데이터의 연관성 구조를 저장하는 번들데이터베이스관리시스템 및 그 관리방법 |
US20110066624A1 (en) * | 2006-08-01 | 2011-03-17 | Divyank Turakhia | system and method of generating related words and word concepts |
US8108417B2 (en) | 2007-04-04 | 2012-01-31 | Intertrust Technologies Corporation | Discovering and scoring relationships extracted from human generated lists |
US8275681B2 (en) | 2007-06-12 | 2012-09-25 | Media Forum, Inc. | Desktop extension for readily-sharable and accessible media playlist and media |
EP2191399A1 (en) | 2007-09-21 | 2010-06-02 | International Business Machines Corporation | System and method for analyzing electronic data records |
US8326823B2 (en) | 2007-11-01 | 2012-12-04 | Ebay Inc. | Navigation for large scale graphs |
US8370368B2 (en) | 2007-11-15 | 2013-02-05 | International Business Machines Corporation | System and method for providing user-tailored views |
US8250637B2 (en) * | 2008-04-29 | 2012-08-21 | International Business Machines Corporation | Determining the degree of relevance of duplicate alerts in an entity resolution system |
US8015137B2 (en) | 2008-04-29 | 2011-09-06 | International Business Machines Corporation | Determining the degree of relevance of alerts in an entity resolution system over alert disposition lifecycle |
US8326788B2 (en) * | 2008-04-29 | 2012-12-04 | International Business Machines Corporation | Determining the degree of relevance of alerts in an entity resolution system |
US20090271394A1 (en) * | 2008-04-29 | 2009-10-29 | Allen Thomas B | Determining the degree of relevance of entities and identities in an entity resolution system that maintains alert relevance |
US8271483B2 (en) * | 2008-09-10 | 2012-09-18 | Palo Alto Research Center Incorporated | Method and apparatus for detecting sensitive content in a document |
US20110196872A1 (en) * | 2008-10-10 | 2011-08-11 | The Regents Of The University Of California | Computational Method for Comparing, Classifying, Indexing, and Cataloging of Electronically Stored Linear Information |
GB0906004D0 (en) * | 2009-04-07 | 2009-05-20 | Omnifone Ltd | MusicStation desktop |
US9727842B2 (en) * | 2009-08-21 | 2017-08-08 | International Business Machines Corporation | Determining entity relevance by relationships to other relevant entities |
US8788576B2 (en) | 2010-09-27 | 2014-07-22 | Z124 | High speed parallel data exchange with receiver side data handling |
US8751682B2 (en) | 2010-09-27 | 2014-06-10 | Z124 | Data transfer using high speed connection, high integrity connection, and descriptor |
US8499051B2 (en) * | 2011-07-21 | 2013-07-30 | Z124 | Multiple messaging communication optimization |
US9774721B2 (en) | 2011-09-27 | 2017-09-26 | Z124 | LTE upgrade module |
US9495012B2 (en) | 2011-09-27 | 2016-11-15 | Z124 | Secondary single screen mode activation through user interface activation |
WO2014143878A1 (en) * | 2013-03-15 | 2014-09-18 | The Board Of Trustees Of The Leland Stanford Junior University | Systems and methods for recommending relationships within a graph database |
US9141676B2 (en) * | 2013-12-02 | 2015-09-22 | Rakuten Usa, Inc. | Systems and methods of modeling object networks |
EP3238095A4 (en) * | 2014-12-23 | 2018-07-11 | Microsoft Technology Licensing, LLC | Surfacing relationships between datasets |
JP6080137B1 (ja) * | 2015-08-14 | 2017-02-15 | Psソリューションズ株式会社 | 対話インターフェース |
JP6034459B1 (ja) * | 2015-08-14 | 2016-11-30 | Psソリューションズ株式会社 | 対話インターフェース |
US10296527B2 (en) | 2015-12-08 | 2019-05-21 | Internatioanl Business Machines Corporation | Determining an object referenced within informal online communications |
CN105760273A (zh) * | 2016-01-29 | 2016-07-13 | 浪潮通信信息系统有限公司 | 一种处理指标的方法及装置 |
CN108073563A (zh) * | 2016-11-08 | 2018-05-25 | 北京国双科技有限公司 | 数据的生成方法及装置 |
US11281993B2 (en) * | 2016-12-05 | 2022-03-22 | Apple Inc. | Model and ensemble compression for metric learning |
US20230350931A1 (en) * | 2019-12-20 | 2023-11-02 | Benevolentai Technology Limited | System of searching and filtering entities |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5325298A (en) * | 1990-11-07 | 1994-06-28 | Hnc, Inc. | Methods for generating or revising context vectors for a plurality of word stems |
US5619709A (en) * | 1993-09-20 | 1997-04-08 | Hnc, Inc. | System and method of context vector generation and retrieval |
JP3195752B2 (ja) * | 1997-02-28 | 2001-08-06 | シャープ株式会社 | 検索装置 |
US6405188B1 (en) * | 1998-07-31 | 2002-06-11 | Genuity Inc. | Information retrieval system |
US6138113A (en) * | 1998-08-10 | 2000-10-24 | Altavista Company | Method for identifying near duplicate pages in a hyperlinked database |
US6473753B1 (en) * | 1998-10-09 | 2002-10-29 | Microsoft Corporation | Method and system for calculating term-document importance |
US6721728B2 (en) * | 2001-03-02 | 2004-04-13 | The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration | System, method and apparatus for discovering phrases in a database |
JP3775239B2 (ja) * | 2001-05-16 | 2006-05-17 | 日本電信電話株式会社 | テキスト分割方法及び装置及びテキスト分割プログラム及びテキスト分割プログラムを格納した記憶媒体 |
US6687690B2 (en) * | 2001-06-14 | 2004-02-03 | International Business Machines Corporation | Employing a combined function for exception exploration in multidimensional data |
JP3960530B2 (ja) * | 2002-06-19 | 2007-08-15 | 株式会社日立製作所 | テキストマイニングプログラム、方法、及び装置 |
JP3925418B2 (ja) * | 2003-01-31 | 2007-06-06 | 日本電信電話株式会社 | トピック境界決定装置及びプログラム |
JP3847273B2 (ja) * | 2003-05-12 | 2006-11-22 | 沖電気工業株式会社 | 単語分類装置、単語分類方法及び単語分類プログラム |
JP2005135139A (ja) * | 2003-10-30 | 2005-05-26 | Recruit Co Ltd | 構造解析システム |
US20050120011A1 (en) * | 2003-11-26 | 2005-06-02 | Word Data Corp. | Code, method, and system for manipulating texts |
-
2006
- 2006-06-05 JP JP2008515798A patent/JP2008542951A/ja active Pending
- 2006-06-05 EP EP06784579A patent/EP1891558A2/en not_active Withdrawn
- 2006-06-05 KR KR1020087000450A patent/KR20080031262A/ko not_active Application Discontinuation
- 2006-06-05 CN CN2006800260356A patent/CN101223525B/zh not_active Expired - Fee Related
- 2006-06-05 CA CA002610088A patent/CA2610088A1/en not_active Abandoned
- 2006-06-05 WO PCT/US2006/021662 patent/WO2006133050A2/en active Application Filing
- 2006-06-05 RU RU2007149528/09A patent/RU2007149528A/ru not_active Application Discontinuation
- 2006-06-05 AU AU2006255181A patent/AU2006255181A1/en not_active Abandoned
-
2007
- 2007-11-27 US US11/945,909 patent/US7987191B2/en active Active
-
2011
- 2011-07-25 US US13/190,365 patent/US9026543B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US7987191B2 (en) | 2011-07-26 |
JP2008542951A (ja) | 2008-11-27 |
US20120054206A1 (en) | 2012-03-01 |
WO2006133050A2 (en) | 2006-12-14 |
US9026543B2 (en) | 2015-05-05 |
CA2610088A1 (en) | 2006-12-14 |
KR20080031262A (ko) | 2008-04-08 |
AU2006255181A1 (en) | 2006-12-14 |
CN101223525A (zh) | 2008-07-16 |
US20080162514A1 (en) | 2008-07-03 |
CN101223525B (zh) | 2012-04-25 |
WO2006133050A3 (en) | 2007-07-12 |
EP1891558A2 (en) | 2008-02-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2007149528A (ru) | Сети отношений | |
CN106021457B (zh) | 基于关键词的rdf分布式语义搜索方法 | |
CN100445999C (zh) | 一种数据存储及搜索方法 | |
WO2008125495A3 (en) | A method and system for finding a focus of a document | |
US20160217186A1 (en) | Distributed fuzzy search and join with edit distance guarantees | |
KR20150070171A (ko) | 스트링 변환의 귀납적 합성을 위한 랭킹 기법 | |
US20120317087A1 (en) | Location-Aware Search Ranking | |
US9449116B2 (en) | Online radix tree compression with key sequence skip | |
CN109960814B (zh) | 模型参数搜索方法以及装置 | |
CN109062914A (zh) | 用户推荐方法和装置,存储介质和服务器 | |
CN106557476A (zh) | 相关信息的获取方法及装置 | |
CN105488176A (zh) | 数据处理方法和装置 | |
CN108875062A (zh) | 一种重复视频的确定方法及装置 | |
CN109542612A (zh) | 一种热点关键字获取方法、装置及服务器 | |
D'Angelo et al. | Fully dynamic update of arc‐flags | |
CN108304384A (zh) | 拆词方法及设备 | |
Zhao et al. | An integer programming column generation principle for heuristic search methods | |
Muñoz et al. | Shears: Unstructured sparsity with neural low-rank adapter search | |
CN103257977B (zh) | 获取标识号码的方法及装置 | |
CN103020300B (zh) | 一种信息检索方法和设备 | |
Poltoratski | Bernstein’s problem on weighted polynomial approximation | |
CN113780827A (zh) | 一种物品筛选方法、装置、电子设备及计算机可读介质 | |
Bogoya | A nonlocal nonlinear diffusion equation in higher space dimensions | |
CN104765835B (zh) | 一种搜索词的搜索方法及装置 | |
CN103064872A (zh) | 使用数据结构处理搜索查询 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FA92 | Acknowledgement of application withdrawn (lack of supplementary materials submitted) |
Effective date: 20101026 |