RU2016152191A - Понимание таблиц для поиска - Google Patents

Понимание таблиц для поиска Download PDF

Info

Publication number
RU2016152191A
RU2016152191A RU2016152191A RU2016152191A RU2016152191A RU 2016152191 A RU2016152191 A RU 2016152191A RU 2016152191 A RU2016152191 A RU 2016152191A RU 2016152191 A RU2016152191 A RU 2016152191A RU 2016152191 A RU2016152191 A RU 2016152191A
Authority
RU
Russia
Prior art keywords
column
candidate
columns
subject
names
Prior art date
Application number
RU2016152191A
Other languages
English (en)
Other versions
RU2671047C2 (ru
RU2016152191A3 (ru
Inventor
Чжунюань ВАН
Канстантсин ЗОРИН
Чжиминь ЧЭНЬ
Каушик ЧАКРАБАРТИ
Джеймс П. ФИННИГАН
Вивек Р. НАРАСАЙЯ
Сураджит ЧАУДХУРИ
Крис ГЭНДЖЕМ
Original Assignee
МАЙКРОСОФТ ТЕКНОЛОДЖИ ЛАЙСЕНСИНГ, ЭлЭлСи
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by МАЙКРОСОФТ ТЕКНОЛОДЖИ ЛАЙСЕНСИНГ, ЭлЭлСи filed Critical МАЙКРОСОФТ ТЕКНОЛОДЖИ ЛАЙСЕНСИНГ, ЭлЭлСи
Publication of RU2016152191A publication Critical patent/RU2016152191A/ru
Publication of RU2016152191A3 publication Critical patent/RU2016152191A3/ru
Application granted granted Critical
Publication of RU2671047C2 publication Critical patent/RU2671047C2/ru

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/211Schema design and management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/221Column-oriented storage; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/02Comparing digital values

Claims (68)

1. Способ детектирования одного или более предметных столбцов таблицы, содержащий этапы, на которых:
выбирают заданное количество столбцов из таблицы в качестве предметных столбцов-кандидатов, причем каждый предметный столбец-кандидат является подходящим для предметного столбца таблицы, при этом каждый предметный столбец-кандидат включает в себя множество значений;
для каждого предметного столбца-кандидата:
идентифицируют случаи, когда любое значение из множества значений образует пару с одним или более наименованиями столбцов во множестве других таблиц, и
вычисляют оценку для предметного столбца-кандидата на основе идентифицированных случаев, причем вычисленная оценка показывает правдоподобие того, что столбец-кандидат является предметным столбцом; и
выбирают по меньшей мере один из предметных столбцов-кандидатов в качестве предметного столбца таблицы согласно вычисленным оценкам.
2. Способ по п. 1, в котором при упомянутом выборе заданного количества столбцов из таблицы в качестве предметных столбцов-кандидатов выбирают заданное количество самых левых столбцов таблицы в качестве предметных столбцов-кандидатов.
3. Способ по п. 2, в котором при упомянутом выборе заданного количества самых левых столбцов таблицы в качестве предметных столбцов-кандидатов выбирают заданное количество самых левых нечисловых столбцов таблицы в качестве предметных столбцов-кандидатов.
4. Способ по п. 1, в котором при упомянутом выборе заданного количества столбцов из таблицы в качестве предметных столбцов-кандидатов выбирают заданное количество столбцов из таблицы в качестве предметных столбцов-кандидатов на основе определенности значений ячеек в заданном количестве столбцов.
5. Способ по п. 1, в котором при упомянутом выборе заданного количества столбцов из таблицы в качестве предметных столбцов-кандидатов выбирают заданное количество столбцов из реляционной таблицы.
6. Способ по п. 1, в котором при упомянутом выборе заданного количества столбцов из таблицы в качестве предметных столбцов-кандидатов выбирают заданное количество столбцов из веб-таблицы.
7. Способ по п. 1, в котором при упомянутой идентификации случаев, когда любое значение из множества значений образует пару с одним или более наименованиями столбцов во множестве других таблиц, идентифицируют случаи, когда любое значение из множества значений образует пару с одним или более наименованиями столбцов во множестве веб-таблиц.
8. Способ по п. 1, в котором при упомянутом выборе по меньшей мере одного из предметных столбцов-кандидатов в качестве предметного столбца таблицы выбирают множество предметных столбцов-кандидатов в качестве предметного столбца таблицы.
9. Реализуемый в вычислительной системе способ детектирования заголовка столбцов для таблицы, включающей в себя одну или более строк, содержащий этапы, на которых:
создают набор наименований-кандидатов столбцов для таблицы на основе данных, определяющих таблицу;
для каждого наименования-кандидата столбца в наборе наименований-кандидатов столбцов:
вычисляют частоту наименования-кандидата столбца для этого наименования-кандидата столбца посредством идентификации одной или более других таблиц из набора других таблиц, которые также содержат данное наименование-кандидат столбца в качестве наименования-кандидата столбца, и
вычисляют частоту наименования-некандидата столбца для упомянутого наименования-кандидата столбца посредством идентификации вторых одной или более других таблиц из набора других таблиц, которые содержат это наименование-кандидат столбца не в качестве наименования-кандидата столбца; и
выбирают строку таблицы в качестве заголовка столбцов, когда, по меньшей мере, заданное пороговое количество наименований-кандидатов столбцов, содержащихся в этой строке, имеют частоту наименования-кандидата столбца, которая является большей, чем частота наименования-некандидата столбца.
10. Способ по п. 9, дополнительно содержащий, перед созданием набора наименований-кандидатов столбцов, этап, на котором определяют, что данные, определяющие таблицу, не определяют явно заголовок столбцов.
11. Способ по п. 10, в котором при упомянутом определении того, что данные, определяющие таблицу, не определяют явно заголовок столбцов, определяют, что данные, определяющие таблицу, не включают в себя тег <th> языка разметки гипертекста (HTML) и не включают в себя тег <thead> языка разметки гипертекста (HTML).
12. Способ по п. 9, дополнительно содержащий, перед созданием набора наименований-кандидатов столбцов, этап, на котором определяют, что таблица не имеет явно определенного заголовка столбцов.
13. Способ по п. 9, в котором при упомянутом создании набора наименований-кандидатов столбцов для таблицы создают набор наименований-кандидатов столбцов для таблицы из наименований столбцов, включенных в первую строку таблицы.
14. Способ по п. 9, в котором при упомянутом создании набора наименований-кандидатов столбцов для таблицы создают набор наименований-кандидатов столбцов для реляционной веб-таблицы.
15. Способ по п. 9, в котором при упомянутом выборе строки таблицы в качестве заголовка столбцов выбирают первую строку таблицы в качестве заголовка столбцов.
16. Способ по п. 9, дополнительно содержащий этап, на котором увеличивают достоверность выбора строки таблицы в качестве заголовка столбцов путем получения посредством логического вывода того, что по меньшей мере один столбец выбранной строки является гиперонимом значений ячеек, содержащихся в этом по меньшей мере одном столбце.
17. Реализуемый в вычислительной системе способ детектирования заголовка столбцов для таблицы, включающей в себя одну или более строк, содержащий этапы, на которых:
создают набор наименований-кандидатов столбцов для таблицы;
посредством логического вывода получают, что столбец, включенный в набор наименований-кандидатов столбцов, является гиперонимом значений ячеек, содержащихся в этом столбце, на основе значений ячеек, содержащихся в данном столбце; и
выбирают строку, содержащую упомянутый столбец, в качестве заголовка столбцов для таблицы.
18. Способ по п. 17, в котором при упомянутом получении посредством логического вывода того, что столбец, включенный в набор наименований-кандидатов столбцов, является гиперонимом значений ячеек, содержащихся в столбце, посредством логического вывода получают, что столбец, включенный в набор наименований-кандидатов столбцов, является гиперонимом значений ячеек, содержащихся в столбце, путем обращения к базе знаний.
19. Способ по п. 18, в котором при упомянутом получении посредством логического вывода того, что столбец, включенный в набор наименований-кандидатов столбцов, является гиперонимом значений ячеек, содержащихся в столбце, путем обращении к базе знаний, извлекают один или более атрибутов концептов и один или более атрибутов примеров из базы знаний.
20. Способ по п. 18, дополнительно содержащий, перед выбором строки, содержащей столбец, в качестве заголовка столбцов для таблицы, этап, на котором определяют для другого столбца, включенного в набор наименований-кандидатов столбцов, что тип ячеек заголовка столбцов и тип ячеек других ячеек в столбце различаются.
21. Система, содержащая:
один или более процессоров;
системную память; и
один или более машиночитаемых носителей, на которых хранятся машиноисполняемые инструкции, представляющие детектор предметных столбцов, причем детектор предметных столбцов предназначен для детектирования одного или более предметных столбцов таблицы, при этом детектор предметных столбцов выполнен с возможностью:
выбирать заданное количество столбцов из таблицы в качестве предметных столбцов-кандидатов, причем каждый предметный столбец-кандидат является подходящим для предметного столбца таблицы, при этом каждый предметный столбец-кандидат включает в себя множество значений;
для каждого предметного столбца-кандидата:
идентифицировать случаи, когда любое значение из множества значений образует пару с одним или более наименованиями столбцов во множестве других таблиц, и
вычислять оценку для предметного столбца-кандидата на основе идентифицированных случаев, причем вычисленная оценка показывает правдоподобие того, что столбец-кандидат является предметным столбцом; и
выбирать по меньшей мере один из предметных столбцов-кандидатов в качестве предметного столбца таблицы согласно вычисленным оценкам.
22. Система по п. 21, в которой детектор предметных столбцов, будучи выполненным с возможностью выбора заданного количества столбцов из таблицы в качестве предметных столбцов-кандидатов, выполнен с возможностью выбирать заданное количество самых левых столбцов таблицы в качестве предметных столбцов-кандидатов.
23. Система по п. 21, в которой детектор предметных столбцов, будучи выполненным с возможностью выбора заданного количества столбцов из таблицы в качестве предметных столбцов-кандидатов, выполнен с возможностью выбирать заданное количество столбцов из таблицы в качестве предметных столбцов-кандидатов на основе определенности значений ячеек в заданном количестве столбцов.
24. Система по п. 21, в которой детектор предметных столбцов, будучи выполненным с возможностью идентификации случаев, когда любое значение из множества значений образует пару с одним или более наименованиями столбцов во множестве других таблиц, выполнен с возможностью идентифицировать случаи, когда любое значение из множества значений образует пару с одним или более наименованиями столбцов во множестве веб-таблиц.
25. Система по п. 21, в которой детектор предметных столбцов, будучи выполненным с возможностью выбора по меньшей мере одного из предметных столбцов-кандидатов в качестве предметного столбца таблицы, выполнен с возможностью выбирать множество предметных столбцов-кандидатов в качестве предметного столбца таблицы.
26. Система, содержащая:
один или более процессоров;
системную память; и
один или более машиночитаемых носителей, на которых хранятся машиноисполняемые инструкции, представляющие детектор заголовков столбцов, причем детектор предметных столбцов предназначен для детектирования одного или более предметных столбцов таблицы, при этом детектор предметных столбцов выполнен с возможностью:
создавать набор наименований-кандидатов столбцов для таблицы на основе данных, определяющих таблицу;
для каждого наименования-кандидата столбца в наборе наименований-кандидатов столбцов:
вычислять частоту наименования-кандидата столбца для этого наименования-кандидата столбца посредством идентификации одной или более других таблиц из набора других таблиц, которые также содержат данное наименование-кандидат столбца в качестве наименования-кандидата столбца, и
вычислять частоту наименования-некандидата столбца для упомянутого наименования-кандидата столбца посредством идентификации вторых одной или более других таблиц из набора других таблиц, которые содержат это наименование-кандидат столбца не в качестве наименования-кандидата столбца; и
выбирать строку таблицы в качестве заголовка столбцов, когда, по меньшей мере, заданное пороговое количество наименований-кандидатов столбцов, содержащихся в строке, имеют частоту наименования-кандидата столбца, которая является большей, чем частота наименования-некандидата столбца.
27. Система по п. 26, в которой детектор предметных столбцов дополнительно выполнен с возможностью, перед созданием набора наименований-кандидатов столбцов, определять, что таблица не имеет явно определенного заголовка столбцов.
28. Система по п. 26, в которой детектор предметных столбцов, будучи выполненным с возможностью создания набора наименований-кандидатов столбцов для таблицы, выполнен с возможностью создавать набор наименований-кандидатов столбцов для таблицы из наименований столбцов, включенных в первую строку таблицы.
29. Система по п. 26, в которой детектор предметных столбцов дополнительно выполнен с возможностью увеличивать достоверность выбора строки таблицы в качестве заголовка столбцов путем получения посредством логического вывода того, что по меньшей мере один столбец выбранной строки является гиперонимом значений ячеек, содержащихся в этом по меньшей мере одном столбце.
30. Система, содержащая:
один или более процессоров;
системную память; и
один или более машиночитаемых носителей, на которых хранятся машиноисполняемые инструкции, представляющие детектор заголовков столбцов, причем детектор предметных столбцов предназначен для детектирования одного или более предметных столбцов таблицы, при этом детектор предметных столбцов выполнен с возможностью:
создавать набор наименований-кандидатов столбцов для таблицы;
получать посредством логического вывода, что столбец, включенный в набор наименований-кандидатов столбцов, является гиперонимом значений ячеек, содержащихся в этом столбце, на основе значений ячеек, содержащихся в данном столбце; и
выбирать строку, содержащую упомянутый столбец, в качестве заголовка столбцов для таблицы.
31. Система по п. 30, в которой детектор предметных столбцов, будучи выполненным с возможностью получать посредством логического вывода, что столбец, включенный в набор наименований-кандидатов столбцов, является гиперонимом значений ячеек, содержащихся в столбце, выполнен с возможностью получать посредством логического вывода, что столбец, включенный в набор наименований-кандидатов столбцов, является гиперонимом значений ячеек, содержащихся в этом столбце, путем обращения к базе знаний.
32. Система по п. 30, в которой детектор предметных столбцов, будучи выполненным с возможностью получать посредством логического вывода, что столбец, включенный в набор наименований-кандидатов столбцов, является гиперонимом значений ячеек, содержащихся в столбце, путем обращения к базе знаний, выполнен с возможностью извлекать один или более атрибутов концептов и один или более атрибутов примеров из базы знаний.
33. Система по п. 30, в которой детектор предметных столбцов дополнительно выполнен с возможностью, перед выбором строки, содержащей столбец, в качестве заголовка столбцов для таблицы, определять, для другого столбца, включенного в набор наименований-кандидатов столбцов, что тип ячеек заголовка столбцов и тип ячеек других ячеек в этом столбце различаются.
RU2016152191A 2014-06-30 2014-06-30 Понимание таблиц для поиска RU2671047C2 (ru)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2014/081109 WO2016000115A1 (en) 2014-06-30 2014-06-30 Understanding tables for search

Publications (3)

Publication Number Publication Date
RU2016152191A true RU2016152191A (ru) 2018-07-02
RU2016152191A3 RU2016152191A3 (ru) 2018-07-02
RU2671047C2 RU2671047C2 (ru) 2018-10-29

Family

ID=54930742

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2016152191A RU2671047C2 (ru) 2014-06-30 2014-06-30 Понимание таблиц для поиска

Country Status (7)

Country Link
US (2) US9734181B2 (ru)
EP (1) EP3161673B1 (ru)
JP (1) JP6434542B2 (ru)
CN (1) CN105518667B (ru)
BR (1) BR112016027272A2 (ru)
RU (1) RU2671047C2 (ru)
WO (1) WO2016000115A1 (ru)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016075833A1 (ja) * 2014-11-14 2016-05-19 富士通株式会社 データ取得プログラム、データ取得方法及びデータ取得装置
US10545942B2 (en) 2016-06-13 2020-01-28 International Business Machines Corporation Querying and projecting values within sets in a table dataset
JP6575688B2 (ja) * 2016-10-07 2019-09-18 富士通株式会社 インデックス付きデータ生成プログラム、インデックス付きデータ生成方法、インデックス付きデータ生成システム、検索プログラム、検索方法、および検索システム
CN110020342A (zh) * 2017-08-31 2019-07-16 北京国双科技有限公司 数据的处理方法及装置
WO2019171537A1 (ja) * 2018-03-08 2019-09-12 日本電気株式会社 意味推定システム、方法およびプログラム
JP6817246B2 (ja) * 2018-03-22 2021-01-20 Kddi株式会社 データ処理装置、データ処理方法及びデータ処理プログラム
US10878195B2 (en) 2018-05-03 2020-12-29 Microsoft Technology Licensing, Llc Automated extraction of unstructured tables and semantic information from arbitrary documents
US11157496B2 (en) * 2018-06-01 2021-10-26 International Business Machines Corporation Predictive data distribution for parallel databases to optimize storage and query performance
US11163764B2 (en) * 2018-06-01 2021-11-02 International Business Machines Corporation Predictive data distribution for parallel databases to optimize storage and query performance
US11514258B2 (en) 2018-09-20 2022-11-29 International Business Machines Corporation Table header detection using global machine learning features from orthogonal rows and columns
US11443106B2 (en) 2018-09-20 2022-09-13 International Business Machines Corporation Intelligent normalization and de-normalization of tables for multiple processing scenarios
US10776573B2 (en) * 2018-09-20 2020-09-15 International Business Machines Corporation System for associating data cells with headers in tables having complex header structures
US10831798B2 (en) 2018-09-20 2020-11-10 International Business Machines Corporation System for extracting header labels for header cells in tables having complex header structures
JP7180420B2 (ja) * 2019-01-31 2022-11-30 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
CN110516048A (zh) * 2019-09-02 2019-11-29 苏州朗动网络科技有限公司 pdf文档中表格数据的提取方法、设备和存储介质
US11270065B2 (en) * 2019-09-09 2022-03-08 International Business Machines Corporation Extracting attributes from embedded table structures
US11176324B2 (en) * 2019-09-26 2021-11-16 Sap Se Creating line item information from free-form tabular data
CN112287660A (zh) * 2019-12-04 2021-01-29 上海柯林布瑞信息技术有限公司 Pdf文件中的表格解析方法及装置、计算设备、存储介质
US11636082B2 (en) 2020-06-23 2023-04-25 International Business Machines Corporation Table indexing and retrieval using intrinsic and extrinsic table similarity measures
CN111897884B (zh) * 2020-07-20 2024-02-23 北京用友薪畴数字科技有限公司 数据关系信息显示方法、终端设备
US20230161774A1 (en) * 2021-11-24 2023-05-25 International Business Machines Corporation Semantic annotation for tabular data

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7680324B2 (en) * 2000-11-06 2010-03-16 Evryx Technologies, Inc. Use of image-derived information as search criteria for internet and other search engines
US7054871B2 (en) * 2000-12-11 2006-05-30 Lucent Technologies Inc. Method for identifying and using table structures
US20060230016A1 (en) * 2005-03-29 2006-10-12 Microsoft Corporation Systems and methods for statistics over complex objects
US7740281B2 (en) * 2007-01-31 2010-06-22 The Ergonomic Group Method and system for producing certified documents and the like
JP4778474B2 (ja) * 2007-05-14 2011-09-21 日本電信電話株式会社 質問応答装置、質問応答方法、質問応答プログラム並びにそのプログラムを記録した記録媒体
US20100114902A1 (en) * 2008-11-04 2010-05-06 Brigham Young University Hidden-web table interpretation, conceptulization and semantic annotation
US8312366B2 (en) * 2009-02-11 2012-11-13 Microsoft Corporation Displaying multiple row and column header areas in a summary table
CN101556606B (zh) * 2009-05-20 2010-12-01 同方知网(北京)技术有限公司 一种基于Web数值表格抽取的数据挖掘方法
US10394754B2 (en) * 2010-03-08 2019-08-27 International Business Machines Corporation Indexing multiple types of data to facilitate rapid re-indexing of one or more types of data
US20110270815A1 (en) * 2010-04-30 2011-11-03 Microsoft Corporation Extracting structured data from web queries
US20170262529A1 (en) * 2010-10-01 2017-09-14 Google Inc. Sponsor answers and user-approved, system-suggested links in a social search engine
EP2469421A1 (en) * 2010-12-23 2012-06-27 British Telecommunications Public Limited Company Method and apparatus for processing electronic data
US8566308B2 (en) * 2011-01-26 2013-10-22 International Business Machines Corporation Intelligent adaptive index density in a database management system
JP5536687B2 (ja) * 2011-01-31 2014-07-02 インターナショナル・ビジネス・マシーンズ・コーポレーション 目次と見出しの対応付け方法、対応付け装置、及び対応付けプログラム
US20130080444A1 (en) * 2011-09-26 2013-03-28 Microsoft Corporation Chart Recommendations
US9020947B2 (en) 2011-11-30 2015-04-28 Microsoft Technology Licensing, Llc Web knowledge extraction for search task simplification
CN103198069A (zh) * 2012-01-06 2013-07-10 株式会社理光 抽取关系型表格的方法和装置
DE102012200600A1 (de) 2012-01-17 2013-07-18 Siemens Aktiengesellschaft MRT- Lokalspulenpositions-Erkennung in einem MRT-System
KR101872564B1 (ko) * 2012-01-23 2018-06-28 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 무경계 표 검출 엔진
US9665572B2 (en) * 2012-09-12 2017-05-30 Oracle International Corporation Optimal data representation and auxiliary structures for in-memory database query processing
US9047333B2 (en) * 2012-09-20 2015-06-02 Cray Inc Dynamic updates to a semantic database using fine-grain locking
EP2728493A1 (en) * 2012-11-01 2014-05-07 Telefonaktiebolaget L M Ericsson (Publ) Method, apparatus and computer program for detecting deviations in data repositories
US9116940B1 (en) * 2013-04-15 2015-08-25 Google Inc. Searching for join candidates
CN103605641A (zh) * 2013-11-11 2014-02-26 清华大学 一种汉语缩略语自动发现的方法及装置
US9940365B2 (en) * 2014-07-08 2018-04-10 Microsoft Technology Licensing, Llc Ranking tables for keyword search

Also Published As

Publication number Publication date
BR112016027272A2 (pt) 2021-06-08
JP2017525033A (ja) 2017-08-31
EP3161673A4 (en) 2018-05-23
US20170322964A1 (en) 2017-11-09
US10853344B2 (en) 2020-12-01
US20150379057A1 (en) 2015-12-31
WO2016000115A1 (en) 2016-01-07
EP3161673B1 (en) 2020-12-02
RU2671047C2 (ru) 2018-10-29
EP3161673A1 (en) 2017-05-03
JP6434542B2 (ja) 2018-12-05
US9734181B2 (en) 2017-08-15
CN105518667A (zh) 2016-04-20
CN105518667B (zh) 2019-06-18
RU2016152191A3 (ru) 2018-07-02

Similar Documents

Publication Publication Date Title
RU2016152191A (ru) Понимание таблиц для поиска
JP6860668B2 (ja) 名前マッチング方法および装置
Fleischhacker et al. Detecting errors in numerical linked data using cross-checked outlier detection
US8880548B2 (en) Dynamic search interaction
RU2014101126A (ru) Автоматическое извлечение именованных сущностей из текста
RU2016130328A (ru) Выявление навигационных результатов поиска
CN109684374B (zh) 一种时间序列数据的键值对的提取方法及装置
US20200125673A1 (en) Learning thematic similarity metric from article text units
RU2016150428A (ru) Заполнение записей контактов пользователя
CN105630941A (zh) 基于统计和网页结构的Web正文内容抽取方法
CN101425071A (zh) 位置描述检测装置、程序以及存储介质
RU2015151699A (ru) Извлечение сущностей из текстов на естественном языке
CN103399872B (zh) 对网页抓取进行优化的方法和装置
CN103853738A (zh) 一种网页信息相关地域的识别方法
CN103970733A (zh) 一种基于图结构的中文新词识别方法
CN102929930A (zh) 小样本自动化Web文本数据抽取模板生成与抽取方法
US11403550B2 (en) Classifier
RU2014152871A (ru) Способ формирования иерархической структуры данных, способ поиска данных с помощью иерархической структуры данных, сервер и постоянный машиночитаемый носитель
CN112149386A (zh) 一种事件抽取方法、存储介质及服务器
RU2016105426A (ru) Постоянно читаемый компьютером носитель, система и способ для обнаружения сомнительного контента в социальной сети.
RU2014108239A (ru) Способ обработки изображения, способ создания индекса изображения, способ обнаружения соответствия изображению из хранилища изображений и сервер (варианты)
US20160019318A1 (en) Problem structure extraction support system, problem structure extraction support method, and program
US10540600B2 (en) Method and apparatus for detecting changed data
CN103853771B (zh) 一种搜索结果的推送方法及系统
Xu et al. Cross-browser differences detection based on an empirical metric for web page visual similarity