RU2602786C2 - Форматирование данных по образцу - Google Patents

Форматирование данных по образцу Download PDF

Info

Publication number
RU2602786C2
RU2602786C2 RU2013135003/08A RU2013135003A RU2602786C2 RU 2602786 C2 RU2602786 C2 RU 2602786C2 RU 2013135003/08 A RU2013135003/08 A RU 2013135003/08A RU 2013135003 A RU2013135003 A RU 2013135003A RU 2602786 C2 RU2602786 C2 RU 2602786C2
Authority
RU
Russia
Prior art keywords
data
examples
elements
formatting rule
formatting
Prior art date
Application number
RU2013135003/08A
Other languages
English (en)
Other versions
RU2013135003A (ru
Inventor
Чэд РОТШИЛЛЕР
Дэниел БАТТАДЖИН
Кристофер БЕНЕДИКТ
Родриго МОРЕЙРА-СИЛВЕЙРА
Эрик КОЭН
Сумит ГУЛВАНИ
Дэни РОУХАНА
Ришабх СИНГХ
Бенджамин Гот ЗОРН
Рамаратхнам ВЕНКАТЕСАН
Дмитрий О. ДАНИЛОВ
Original Assignee
МАЙКРОСОФТ ТЕКНОЛОДЖИ ЛАЙСЕНСИНГ, ЭлЭлСи
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by МАЙКРОСОФТ ТЕКНОЛОДЖИ ЛАЙСЕНСИНГ, ЭлЭлСи filed Critical МАЙКРОСОФТ ТЕКНОЛОДЖИ ЛАЙСЕНСИНГ, ЭлЭлСи
Publication of RU2013135003A publication Critical patent/RU2013135003A/ru
Application granted granted Critical
Publication of RU2602786C2 publication Critical patent/RU2602786C2/ru

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/26Visual data mining; Browsing structured data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/14Digital output to display device ; Cooperation and interconnection of the display device with other functional units

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • User Interface Of Digital Computer (AREA)
  • Character Discrimination (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

Изобретение относится к средствам форматирования данных на основе примеров. Технический результат заключается в обеспечении возможности автоматического форматирования данных электронной таблицы. Определяют, когда правки произведены в отношении множества элементов в пределах документа электронной таблицы, причем каждые из этого множества элементов являются связанными. Автоматически создают правило форматирования данных на основе примеров входных данных, которые относятся к разным столбцам документа электронной таблицы, и примеров выходных данных в одном и том же столбце документа электронной таблицы, причем примеры входных данных и примеры выходных данных ассоциированы с упомянутыми правками. Автоматически применяют правило форматирования данных к другим элементам в пределах документа электронной таблицы, которые относятся к одному и тому же типу данных, при этом правило форматирования данных стремится форматировать эти другие элементы в формат, как определено примерами входных данных и примерами выходных данных, причем упомянутые другие элементы отличаются от упомянутого множества элементов. Отображают упомянутые другие элементы, отражая применение правила форматирования данных. 3 н. и 17 з.п. ф-лы, 8 ил.

Description

УРОВЕНЬ ТЕХНИКИ
Одинаковый тип данных часто вводится и сохраняется во многих разных форматах. Например, некоторые даты существуют в форме ВВГГММДД (19990101), другие даты в формате ММ/ДД/ВВГГ (01/01/1999), помимо этого, другие даты в формате М/Д/ГГ (1/1/99). Чтобы выполнять анализ над данными, они преобразуются в одинаковый формат. Например, некоторый анализ может предписывать, что телефонные номера должны форматироваться, придерживаясь формы (206) 555-1212, тогда как другой анализ может предписывать, чтобы форматирование было снято с телефонных номеров (т.е. 2065551212). Разные способы могут использоваться для преобразования данных. Например, могут быть использованы разные функции преобразования и/или может быть разработана управляющая программа для преобразования данных.
СУЩНОСТЬ ИЗОБРЕТЕНИЯ
Это краткое изложение сущности изобретения приведено, чтобы предоставить подборку концепций в упрощенной форме, которые дополнительно описаны ниже в подробном описании. Это краткое изложение сущность изобретения не предназначено для идентификации ключевых признаков или существенных признаков заявленного изобретения, и не предназначено для использования в качестве содействия в определении объема заявленного изобретения.
Правила форматирования данных для преобразования элементов данных из одной формы в другую форму определяются автоматически на основании примерного набора выходных данных, например, пользовательских правок. Эвристика машинного обучения применяется к исходным данным, а так же и примерным выходным данным (например, пользовательским правкам), чтобы определять правило форматирования данных, которое может применяться к дополнительным элементам данных. Например, пользователь может осуществлять правки, которые добавляют/удаляют символы из данных, сцепляют данные, извлекают данные, переименовывают данные и тому подобное. Посредством изучения исходных значений наряду с отредактированными значениями, может выводиться правило, которое заключает в себе этот тип преобразования, а затем такое правило может применяться в отношении дополнительных исходных значений, чтобы автоматически формировать требуемые отредактированные значения или выходные данные. Эвристика машинного обучения может запускаться автоматически в ответ на событие (например, после предопределенного количества правок, произведенных в отношении одного и того же типа данных), или запускаться вручную (например, путем выбора опции пользовательского интерфейса). Правило форматирования данных может быть применено к другим данным, а результаты форматирования - допускать ревизию со стороны пользователя. На основании дальнейших правок/ревизий, правило форматирования данных может обновляться. Правила форматирования данных могут сохраняться для более позднего использования и/или модификации. Также может быть представлен уровень достоверности, чтобы содействовать пользователю в определении того, был ли элемент(ы) переформатирован правильно.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
Фиг.1 иллюстрирует примерное вычислительное окружение;
Фиг.2 показывает систему для форматирования данных на основании правок, произведенных в отношении документа;
Фиг.3 иллюстрирует определение правила форматирования данных на основании пользовательских правок в отношении столбца и применение правила форматирования данных к другим ячейкам в пределах столбца;
Фиг.4 показывает пример осуществления пользователем правок в отношении элементов в столбце номера социального страхования;
Фиг.5 иллюстрирует пример осуществления пользователем правок для изменения форматирования дат;
Фиг.6 показывает элементы пользовательского интерфейса, которые можно использовать, чтобы взаимодействовать с форматированием элементов;
Фиг.7 показывает пользовательский интерфейс для разрешения/запрета заполнения по образцу;
Фиг.8 показывает иллюстративную последовательность операций для форматирования данных по образцу.
ПОДРОБНОЕ ОПИСАНИЕ
Далее, со ссылкой на чертежи, на которых одинаковые номера представляют подобные элементы, будут описаны различные варианты осуществления. В частности, Фиг.1 и соответствующее обсуждение предназначены для представления краткого общего описания пригодной вычислительной среды, в которой могут быть реализованы варианты осуществления.
Обычно, программные модули включают в себя процедуры, программы, компоненты, структуры данных и другие типы структур, которые выполняют конкретные задачи или реализуют конкретные абстрактные типы данных. Другие конфигурации компьютерной системы также могут использоваться, в том числе, карманные устройства, многопроцессорные системы, основанную на микропроцессоре или программируемую бытовую электронику, миникомпьютеры, универсальные вычислительные машины и тому подобное. Распределенные вычислительные среды также могут использоваться в тех случаях, когда задачи выполняются удаленными вычислительными устройствами, которые связаны через сети связи. В распределенном компьютерном окружении, программные модули могут быть расположены как в локальных, так и в удаленных запоминающих устройствах.
Далее, со ссылкой на Фиг.1, будет описано иллюстративное компьютерное окружение для компьютера 100, используемого в различных вариантах осуществления. Компьютерное окружение, показанное на Фиг.1, включает в себя вычислительные устройства, каждое из которых может быть сконфигурировано в качестве сервера, настольного или мобильного компьютера, либо некоторого другого типа вычислительного устройства, и включает в себя центральное процессорное устройство 5 («ЦПУ», «CPU»), системную память 7, включающую в себя оперативное запоминающее устройство 9 («ОЗУ», «RAM») и постоянное запоминающее устройство 10 («ПЗУ», «ROM»), и системную шину 12, которая присоединяет память к центральному процессорному устройству 5 («ЦПУ»).
Базовая система ввода-вывода, содержащая базовые процедуры, которые помогают пересылать информацию между элементами в пределах компьютера, к примеру, во время запуска, хранится в ПЗУ 10. Компьютер 100 дополнительно включает в себя запоминающее устройство 14 большой емкости для хранения операционной системы 16, электронной таблицы 11, приложения 24 электронных таблиц, других программных модулей 25 и диспетчера 26 форматирования, который будет подробнее описан ниже.
Запоминающее устройство 14 большой емкости присоединено к ЦПУ 5 через контроллер запоминающего устройства (не показан), присоединенный к шине 12. Запоминающее устройство 14 большой емкости и связанные с ним машинно-читаемые носители обеспечивают энергонезависимое хранилище для компьютера 100. Хотя описание машинно-читаемых носителей, содержащееся в материалах настоящей заявки, ссылается на запоминающее устройство большой емкости, такое как жесткий диск или привод CD-ROM (ПЗУ на компакт-диске), машинно-читаемые носителем могут быть любыми доступными носителями, которые могут подвергаться доступу компьютером 100.
В качестве примера, а не ограничения, машинно-читаемые носители могут содержать компьютерные носители данных и среды связи. Компьютерные носители данных включают в себя энергозависимые и энергонезависимые, съемные и несъемные носители, реализованные любым способом или технологией для хранения информации, такой как машинно-читаемые команды, структуры данных, программные модули или другие данные. Машинно-читаемые носители включают в себя, но не в качестве ограничения, ОЗУ, ПЗУ, стираемое программируемое запоминающее устройство («EPROM»), электрически стираемое программируемое запоминающее устройство («EEPROM»), флэш-память или другую технологию твердотельной памяти, CD-ROM, цифровой многофункциональный диск («DVD») или другое оптическое запоминающее устройство, магнитные кассеты, магнитную ленту, накопитель на магнитных дисках или другие магнитные запоминающие устройства, либо любой другой носитель, который может использоваться для хранения требуемой информации и который может подвергаться доступу компьютером 100.
Компьютер 100 работает в сетевом окружении, используя логические соединения с удаленными компьютерами посредством сети 18, такой как Интернет. Компьютер 100 может подсоединяться к сети 18 посредством блока сетевого интерфейса 20, подключенного к шине 12. Сетевое соединение может быть беспроводным и/или проводным. Блок сетевого интерфейса 20 может также использоваться для подсоединения к другим типам сетей и удаленным вычислительным системам, таким как сетевая служба(ы) 27. Компьютер 100 может также включать в себя контроллер 22 ввода/вывода для получения и обработки входных данных от ряда других устройств, в том числе, клавиатуру, мышь или электронное перо (не показано на Фиг.1). Аналогично, контроллер 22 ввода/вывода может обеспечивать ввод/вывод в IP-телефон, экран 23 дисплея, принтер или другой тип устройства вывода.
Как упоминалось вкратце выше, ряд программных модулей и файлов данных может сохраняться в запоминающем устройстве 14 и ОЗУ 9 компьютера 100, включая операционную систему 16, пригодную для управления работой компьютера, такую как операционная система WINDOWS 7® от корпорации Майкрософт, Редмонд, Вашингтон. Запоминающее устройство 14 и ОЗУ 9 могут также хранить один или более программных модулей. В частности, запоминающее устройство 14 и ОЗУ 9 могут хранить одну или более прикладных программ, включая приложение 24 электронной таблицы и программные модули 25. Согласно варианту осуществления, приложением 24 электронной таблицы является приложение электронной таблицы EXCEL от корпорации Майкрософт. Также могут использоваться другие приложения электронной таблицы. Пользовательский интерфейс, такой как UI 28, позволяет пользователю взаимодействовать с приложением, таким как приложение 24 электронной таблицы.
Диспетчер 26 форматирования может располагаться внешне от приложения 24 электронной таблицы, как показано, или может являться частью приложения 24 электронной таблицы. Дополнительно все/некоторые из выполняемых функций, обеспечиваемых диспетчером 26 форматирования, могут располагаться внутренне/внешне по отношению к приложению 24 электронной таблицы.
Диспетчер 26 форматирования сконфигурирован формировать одно или более правил форматирования данных для преобразования данных из одной формы в другую форму, основываясь на исходных данных и примерных выходных данных, например пользовательских правках. Согласно варианту осуществления, диспетчер 26 форматирования применяет эвристику машинного обучения к исходным данным, а также примерным выходным данным (пользовательским правкам), чтобы определять правило(а) форматирования данных, которое может применяться к данным. Например, пользователь может осуществлять правки, которые добавляют/удаляют символы из данных, сцепляют данные, извлекают данные, переименовывают данные и тому подобное. В ответ на правки, формируется правило(а) форматирования данных, которое применяется к другим данным в пределах документа (например, электронной таблицы). Форматирование, которое применяется к данным, может допускать ревизию со стороны пользователя, так что пользователь может принимать/отклонять изменения. Форматирование, применяемое к данным, может также содержать форматирование метаданных. Согласно варианту осуществления, уровень достоверности, определяемый из правила форматирования, связан с форматированием, которое применяется к данным, так что пользователь может более легко распознавать, когда данные переформатированы правильно. Например, высокий уровень достоверности показывает что, скорее всего, данные отформатированы правильно, при этом сниженный уровень достоверности может показывать, что пользователь может желать пересмотреть результаты. Эвристика машинного обучения может запускаться автоматически в ответ на событие (например, после выполнения заранее определенного количества правок в отношении одного и того же типа данных) или запускаться вручную (например, путем выбора пункта меню пользовательского интерфейса). На основании дополнительных правок/ревизий, правило форматирования данных может обновляться. Правила форматирования данных могут также сохраняться для более позднего использования и/или модификации. Например, пользователь может модифицировать правило (например, шрифт), вследствие чего применение правила форматирования данных следует модифицированному правилу.
Фиг.2 показывает систему для форматирования данных на основе на правок, произведенных в отношении документа. Как изображено, система 200 включает в себя диспетчер 26 форматирования, прикладную программу 210, ответный код 212 и устройство 215 отображения. Используемым вычислительным устройством(и) может быть любой тип вычислительного устройства, который сконфигурирован выполнять операции, относящиеся к автоматическому форматированию данных, на основании пользовательских правок к документу. Например, некоторыми из вычислительных устройств могут быть: мобильные вычислительные устройства (например, сотовые телефоны, планшеты, смартфоны, лаптопы и тому подобное); настольные вычислительные устройства и серверы.
Для того чтобы облегчить коммуникацию с диспетчером 26 форматирования, могут быть реализованы одна или более процедур обратного вызова (callback), изображенный на Фиг.2 как код 212 обратного вызова. Согласно одному варианту осуществления, прикладная программа 210 является приложением электронной таблицы.
Устройство 215 отображения сконфигурировано отображать документ, такой как документ 220 электронной таблицы, и элементы пользовательского интерфейса, используемые для взаимодействия с документом. Как изображено, электронная таблица 220 показывает три столбца, в том числе, столбец фамилии (А), столбец имени (В) и отредактированный столбец (С). В текущем примере пользователь произвел правки в отношении отредактированного столбца. В ячейке С2 пользователь ввел для той строки, строки 2, фамилию (которая также содержится в ячейке А2), через запятую, после которой идут первые инициалы (которые также содержатся в ячейке В2). В ячейке С3 пользователь ввел для той строки, строки 3, фамилию (которая также содержится в ячейке А3), через запятую, после которой идут первые инициалы (которые также содержатся в ячейке В3).
Как правило, диспетчер 26 форматирования определяет, когда пользователь правит/модифицирует данные, которые соответствуют шаблону, который можно заполнить и применить к дополнительным данным в электронной таблице, и автоматически заполняет столбец результатами, которые получаются после применения правила форматирования данных. В ответ на правки, диспетчер 26 форматирования использует информацию, которая связана с правками, чтобы получить правило форматирования данных, которое применяется к другим данным в пределах электронной таблицы. Согласно варианту осуществления, информация включает в себя примеры выходных данных, которые являются результатом правок к тексту, который отображается в пределах правленых ячеек (например, ячеек С2 и С3), и примеры входных данных, которые связаны с правками. В таком случае, столбец А и столбец В включают в себя примеры входных данных, которые связаны с редактируемыми столбцами (например, ячейки А2 и В2 являются примером входных данных для примера выходных данных С2, а ячейки А3 и В3 являются примером входных данных для примера выходных данных С3). Эти примеры входных/выходных данных определяются диспетчером 26 форматирования и подаются в процесс, который формирует правило форматирования данных для других аналогично форматированных ячеек (например, ячеек С4:С7 (222)). Эвристика машинного обучения получает набор примеров входных/выходных данных, определяет шаблон, формирует правило форматирования данных, а затем диспетчер 26 форматирования применяет правила форматирования данных к диапазону выходных данных, чтобы формировать по-новому отформатированные значения. Согласно варианту осуществления, примерная эвристика машинного обучения описана в «Automatic String Processing in Spreadsheets Using Input-Output Examples» («Автоматическая обработка строк в электронных таблицах с использованием примеров входных-выходных данных»), Sumit Gulwani (Сумит Гулвани), Остин, Техас. Могут использоваться другие эвристики машинного обучения. Как правило, может использоваться любая эвристика, которая берет исходные данные, а также правки данных в качестве входных данных и создает правило форматирования данных, которое может применяться к другим данным, чтобы в результате были получены данные, отформатированные аналогичным образом. Согласно варианту осуществления, функционал эвристики машинного обучения включен в диспетчер 26 форматирования. Функционал может также располагаться в других местах.
Диспетчер 26 форматирования автоматически применяет правило форматирования данных к другим ячейкам в пределах электронной таблицы, которые отформатированы аналогичным образом. Согласно варианту осуществления, правило форматирования данных автоматически применяется к выходному диапазону ячеек, которые заполняют столбец редактируемого столбца. В текущем примере, выходной диапазон включает в себя ячейки C4:C7. Рамка 222 показывает, что применение правил форматирования данных к ячейкам C4:C7 приводит к значениям, размещенным в пределах ячеек C5 и C6. Согласно варианту осуществления, правило форматирования данных, которое применяется к выходному ряду, является динамичным. Другими словами, когда значение правится в пределах выходного диапазона, правило форматирования данных обновляется, используя дополнительный пример(ы) входных/выходных данных.
Правило форматирования данных может формировать ноль или более значений для каждой из ячеек. Например, значение не возвращается для ячеек С4 и С7, так как нет имени в соответствующей ячейке в столбце В. Более чем один потенциальный результат может формироваться посредством правила форматирования данных, когда правило форматирования данных не уверено в результате. Согласно варианту осуществления, перед тем, как автоматически переформатировать данные, правило форматирования данных применяется к предопределенному количеству ячеек, чтобы определить, формирует ли применение правила форматирования результаты, которые соответствуют предопределенному пороговому уровню достоверности или превышают его. Например, если применение правила форматирования к предопределенному количеству ячеек приводит к низкому уровню достоверности, правило форматирования данных не применяется автоматически. Согласно варианту осуществления, правило форматирования данных применяется к ячейкам в выходном диапазоне и определяется процентная доля ячеек, которые имеют один ответ. Согласно варианту осуществления, процентная доля ячеек, которые имеют ноль ответов, исключается из вычисления. Когда процентная доля выше предопределенного порогового значения (например, 70%), ячейки в выходном диапазоне автоматически заполняются, используя результаты, обеспеченные посредством правила форматирования данных. Когда пороговое значение не достигнуто, результаты могут не применяться к ячейке и больше правок получается до того, как будет создано новое правило форматирования данных, или результаты могут применяться к ячейке и к ячейке может применяться индикатор (например, подсвечивание, форматирование), который показывает уровень достоверности ниже порогового значения. Уникальный результат, формируемый применением правила форматирования данных к ячейке, является хорошим показателем того, что правило форматирования данных формирует точные результаты. Другие пороговые значения и/или правила могут использоваться, чтобы определить, формирует ли правило форматирования данных точные результаты.
Много типов правил форматирования данных могут создаваться, основываясь на пользовательских правках, например, сцеплении двух столбцов, извлечении информации из столбца (например, извлечении доменного имени верхнего уровня из адреса, извлечении адреса электронной почты) и тому подобном. Обычно, правило форматирования данных может вычисляться, основываясь на любой деятельности, связанной с редактированием. В некоторых случаях больше, чем два примера входных/выходных данных могут использоваться, чтобы сформировать точные результаты. Например, эвристика машинного обучения может быть только на 50% точной с двумя примерами и быть на 95% точной, при использовании трех примеров.
Правило форматирования данных может также быть получено на основе выбора в пределах пользовательского интерфейса (например, значка (иконки) 224), или какой-нибудь другой пункт меню может быть выбран. Примерные правки могут вручную выбираться пользователем (например, пользователь выбирает примерные ячейки) и/или примеры могут автоматически определяться диспетчером 26 форматирования. Например, диспетчер 26 форматирования может просматривать данные и определять примеры входных/выходных данных из данных (например, столбец с наименьшим количеством значений может рассматриваться как выходной столбец, а остальные столбцы могут рассматриваться как входные столбцы).
Фиг.3-6 показывают примеры ячеек, форматированных на основе на пользовательских правок.
Фиг.3 иллюстрирует определение правила форматирования данных на основании пользовательских правок в отношении столбца и применение правила форматирования данных к другим ячейкам в пределах столбца. Как изображено, пользователь осуществляет правки в отношении столбца «Полное имя» (С) электронной таблицы 310. В текущем примере пользователь ввел первые инициалы, за которыми следует точка и пробел, за которыми следует фамилия. Фамилия содержится в столбце А электронной таблицы 310, и первые инициалы содержатся в столбце В электронной таблицы. В ответ на осуществляемые пользователем правки в отношении ячеек С2 и С3, эвристикой машинного обучения формируется правило форматирования данных, которое может применяться к другим ячейкам в пределах документа.
В текущем примере примеры входных/выходных включают в себя текст в столбце С и текст в столбцах А и В для каждой строки, которая редактировалась. Входные данные могут определяться посредством сканирования документа, чтобы обнаружить данные, которые могут использоваться при применении правила форматирования данных, чтобы создать требуемый результат. В таком случае, правило форматирования данных создает правило, которое получает первые инициалы из столбца В и фамилию из столбца А, а также вставляет знак точки и знак пробела после первых инициалов. Выходной диапазон 312 обозначает ячейки, к которым применяется правило форматирования данных.
Обращаясь к электронной таблице 320, может быть видно, что автоматическое применение правила форматирования данных привело к заполнению ячейки С3:С6 именем, которое включает в себя первые инициалы, затем точку и пробел, за которыми следует фамилия. Ячейка С7 не была заполнена, так как применение правила форматирования данных не привело к точному результату, поскольку столбец с фамилией пустой.
Электронная таблица 320 также показывает элемент 322 пользовательского интерфейса, соответствующий ревизии, который может использоваться для принятия/отклонения изменения, произведенного применением правила форматирования данных. Элемент 324 пользовательского интерфейса, соответствующий коррекции ошибок, также размещается возле места, где правило форматирования данных не применялось (в этом случае отсутствуют данные из первого столбца) или где применение правила форматирования данных может не быть определено как точное (см. Фиг.6 и связанное с ней описание для более детального обсуждения относительно элемента пользовательского интерфейса, соответствующего ревизии, и элемента пользовательского интерфейса, соответствующего коррекции ошибок).
Фиг.4 показывает пример осуществляемых пользователем правок к пунктам в столбце номера социального страхования. Пользователь изменил форматирование номера социального страхования из формата “XXXXXXXXX” в “XXX-XX-XXXX” (где Х является любым числом, 0-9). В других примерах символы могут быть нечисловыми символами. Согласно варианту осуществления, после того, как пользователь осуществил две или более правок, диспетчером форматирования используются входные/выходные примеры для формирования правила форматирования данных, которое применяется к другим данным в столбце. В текущем примере примерами входных данных является исходный текст, который содержался в ячейках А2 и А3, а примерами выходных данных является редактируемый текст, показанный в ячейках А2 и А3. Больше или меньше правок может накопиться до момента предоставления примеров входных/выходных данных. Например, в некоторых случаях (таких как этот) одного примера входных/выходных данных может быть достаточно, чтобы сформировать точное правило форматирования данных. В более сложных сценариях может использоваться редактирования большего количества примеров входных/выходных данных. Далее, любые дополнительные правки, производимые пользователем, могут использоваться диспетчером форматирования для обновления правила форматирования данных. Применение правила форматирования данных к ячейкам А4:А7 приводит к электронной таблице, которая проиллюстрирована экранным изображением 420. Согласно варианту осуществления, ячейки, которые уже содержат данные, не изменяются автоматически. Взамен пользователь может получить запрос утвердительно принять предложенные изменения до того, как они будут выполнены в отношении ячеек, содержащих данные. Ячейки могут также изменяться автоматически, а пользователю может быть предоставлена возможность отменять изменения.
Фиг.5 показывает пример выполнения пользователем правок для изменения форматирования дат. Пользователь изменил форматирование двух дат в электронной таблице 510 с формата “MM/DD/CCYY” на “MM/DD/YY”.
В текущем примере пользователь изменил форматирование дат в ячейках А4 и А3. Входные примеры включают в себя исходный текст в ячейках А3 и А4, а выходные примеры включают в себя отредактированный текст, как показано в ячейках А3 и А4 на экранном изображении 520. Применение сформированного правила форматирования данных приводит к экранному изображению 520. Как показано, правки могут производиться где угодно в пределах аналогично форматированных данных, а применение правила форматирования данных может не только заполнять, как показано на Фиг.2-4, но также применяться к другим ячейкам (например, ячейка А2).
Фиг.6 показывает элементы пользовательского интерфейса, которые можно использовать, чтобы взаимодействовать с форматированием элементов. Как показано, электронная таблица 610 показывает элементы 612 и 618 пользовательского интерфейса, соответствующие ревизии, и элементы 614 и 616 пользовательского интерфейса, соответствующие коррекции ошибок.
Ячейка может быть отмечена элементом пользовательского интерфейса, соответствующим коррекции ошибок, когда ячейка отмечена как имеющая значение, которое несовместимо и/или не определено как точное. Согласно варианту осуществления, ячейка с несовместимыми данными означает, что либо значение ячейки не соответствует тому, что формирует правило форматирования данных, либо значение в пределах ячейки было сформировано правилом форматирования данных, но имеется более одного возможного результата. Как только правило форматирования данных было применено к определенному выходному диапазону, любые результаты, которые являются несовместимыми, помечаются. Согласно варианту осуществления, результат считается несовместимым, когда количество возможных результатов было более или менее одного результата (например, нет результатов или 2 или больше результатов, обеспеченных правилом форматирования данных) или предварительно существующее значение является несовместимым с результатом, обеспечиваемым правилом форматирования данных. Другая эвристика может также использоваться. Например, результат может считаться несовместимым, когда количество результатов превышает заранее определенное количество результатов и/или какое-либо другое условие.
Элемент пользовательского интерфейса, соответствующий коррекции ошибок, может быть выбран. При выборе, элемент пользовательского интерфейса, соответствующий коррекции ошибок, отображает различные выбираемые пункты (630). Согласно варианту осуществления, варианты выбора включают пункт «Следующий», пункт «Предыдущий», пункт «Помощь», пункт «Пропустить», пункт «Принять», пункт «Редактировать в ячейке», пункт «Параметры Проверка ошибок» и пункт «Возможные значения». Больше или меньше пунктов могут быть включены в меню 630. Пункт «Следующий» обеспечивает переход к следующей ячейке, которая отмечена как ошибочная. Пункт «Предыдущий» обеспечивает переход к предыдущей ошибке. Пункт «Помощь» представляет экран помощи. Пункт «Пропустить» пропускает текущую ошибку и убирает элемент пользовательского интерфейса, соответствующий коррекции ошибок, с отображения. Пункт «Принять» убирает состояние ошибки и добавляет ассоциированный пример входных/выходных данных для ячейки, чтобы сформировать новое правило форматирования данных. Пункт «Редактировать в ячейке» обеспечивает перевод пользователя в режим редактирования в ячейке. Когда пользователь редактирует одну или больше таких ошибочных ячеек, то правка интерпретируется как пример входных/выходных данных и вычисляется новое/обновленное правило форматирования данных. Согласно варианту осуществления, обновленное правило форматирования данных применяется к оставшимся ошибочным ячейкам, которые связаны с правилом форматирования данных. Пункт «Параметры Проверка ошибок» предоставляет пользователю различные опции, относящиеся к обнаружению ошибок. Пункт «Возможные значения» при выборе отображает перечень других возможных значений для ячейки при ее переформатировании. Например, может отображаться каждый результат, который формируется посредством правила форматирования данных.
Элемент 612 пользовательского интерфейса, соответствующий ревизии, представляет различные пункты для взаимодействия с ячейками, которые были отформатированы с использованием правила форматирования данных. Согласно варианту осуществления, меню 620 ревизии содержит пункт «Отмена», пункт «Повтор», пункт «Стоп», пункт «Пересмотр», пункт «Пропустить все», пункт «Сохранение» и пункт «Другое». Больше или меньше пунктов может быть включено в меню 620. Операция отмены возвращает документ (например, столбец документа, к которому было применено правило форматирования данных) в состояние, в котором он был непосредственно до применения к ячейкам правила форматирования данных. Пункт «Повтор» восстанавливает данные в ячейках, которые ранее были отменены пользователем. Пункт «Стоп» деактивирует автоматический режим автоматического заполнения при применении правила форматирования данных. Пункт «Пересмотр» назначает активную ячейку в качестве первой ячейки в текущем диапазоне преобразования (например, выходном диапазоне) с пометкой ошибки. Пункт «Пропустить все» убирает пометки ошибок и любое соответствующее форматирование ошибок из ячеек в текущем заполняемом ряду. Пункт «Сохранить» позволяет пользователю сохранить текущее правило форматирования данных. Пункт «Сохранить» сохраняет информацию, связанную с правилом, такую как столбец(ы), который можно ввести, а также любые примеры входных/выходных данных. Пункт «Другое» предоставляет другие опции.
Фиг.7 показывает пользовательский интерфейс для разрешения/запрещения заполнения по образцу. Экранное изображение 700 включает в себя пункт 702, который позволяет пользователю включать/отключать автоматическое заполнение данных по образцу. Другие пункты могут также быть включены в состав пользовательского интерфейса, такие как требуемое количество правок/выборов перед получением правила форматирования данных, следует ли перезаписывать существующие данные с/без подтверждения, и тому подобное.
Далее, со ссылкой на Фиг.8 будет описана иллюстративная последовательность операций форматирования данных по образцу. При чтении описания процедур, представляемых здесь, следует понимать, что логические операции различных вариантов осуществления реализуются (1) как последовательность выполняемых компьютером действий или программных модулей, исполняемых в вычислительной системе, и/или (2) как взаимосвязанные схемы машинной логики или схемные модули внутри вычислительной системы. Реализация является вопросом выбора, зависящим от эксплуатационных требований, налагаемых на вычислительную систему, реализующую изобретение. Соответственно, логические операции, иллюстрирующие и составляющие варианты осуществления, описанные здесь, упоминаются по-разному, как операции, структурные устройства, действия или модули. Эти операции, структурные устройства, действия и модули могут быть реализованы в виде программного обеспечения, встроенного программного обеспечения (Firmware), специализированной цифровой логики, и любых их комбинаций.
После стартового блока процесс 800 переходит к операции 810, где обнаруживаются правки, произведенные с данными внутри документа. Правками могут быть любые правки в документе. Согласно варианту осуществления, правки есть в отношении данных, которые содержатся в пределах ячеек документа (то есть электронной таблицы, таблицы, списка), которые относятся к одному и тому же типу данных и аналогично отформатированы. Обычно, каждая ячейка в пределах колонки может содержать одинаковый тип данных (то есть даты, адреса, имена, номера и подобное). Правки, которые применяются к каждому из элементов, соответствуют шаблону, который может применяться к другим ячейкам, имеющим тот же самый тип элемента.
Перейдя к операции 820 принятия решения, производится определение того, превысило ли количество правок заранее определенное количество правок и инициирован ли процесс получения правила форматирования данных, которое должно применяться к другим аналогично форматированным ячейкам. Согласно варианту осуществления, количество правок для инициирования получения правила форматирования данных составляет два. Точка инициирования может быть установлена в другие значения вручную/автоматически. Например, точка инициирования может основываться на предполагаемой точности применения правила форматирования данных к другим аналогичным элементам данных в пределах документа. В некоторых случаях точка инициирования может быть одна, тогда как в других их может быть три или более.
Когда точка инициирования не была достигнута, процесс возвращается к операции 810, чтобы выявить, когда сделаны последующие правки.
Когда точка инициирования была достигнута, процесс перетекает к операции 830, где примеры входных/выходных данных получаются и подаются в эвристику машинного обучения, чтобы получить правило форматирования данных. Примеры входных/выходных данных обеспечивают примеры данных в состоянии до и состоянии после относительно правок данных. Например, когда есть правки к существующим данным, тогда примерами входных данных являются данные до правки, а примерами выходных данных являются данные после правки. Когда есть правки в отношении новой ячейки, примерами выходных данных являются отредактированные данные в ячейке, а примерами входных данных являются данные, связанные с созданием выходных (например, один или более столбцов данных).
Переходя к операции 840, получают правило форматирования данных. Согласно варианту осуществления, правило форматирования данных является функцией, которая получает текстовый ввод (например, из одной или более ячеек) и производит ноль или более результатов. Правило форматирования данных ориентировано на форматирование других аналогичных элементов в пределах документа (например, других ячеек в пределах столбца), чтобы они соответствовали правкам, сделанным пользователем.
При переходе к операции 850 определяется выходной диапазон. Выходной диапазон определяет элементы, к которым правило форматирования данных должно применяться. Например, другими элементами могут быть все или часть ячеек в столбце, в котором элементы редактировались пользователем и являются основанием для правила форматирования данных. В некоторых примерах выходным диапазоном являются ячейки в пределах столбца, которые имеют тот же тип элемента (например, дата, номер, адрес и тому подобное). В других примерах выходным диапазоном являются все ячейки со значениями, которые являются смежными относительно друг друга, и которые являются смежными с редактируемыми ячейками.
Перейдя к операции 860, правило форматирования данных применяется к каждому из элементов в определенном выходном диапазоне. Любые результаты, производимые посредством применения правила форматирования данных, могут временно сохраняться, прежде чем осуществлять какие-либо изменения в документе.
При перемещении к операции 870 принятия решения, производится определение относительно того, привело ли применение правила форматирования данных к точным результатам. Согласно варианту осуществления, точность оценивается количеством результатов, возвращаемых правилом форматирования данных, когда оно применяется к элементу. Когда количество результатов для элемента равно нулю, правило форматирования данных не имеет достаточно данных, чтобы формировать результат. Когда количество результатов больше одного, точность результатов может быть сомнительной. Когда количество результатов есть единица, тогда результат, вероятнее всего, точный. Количество/процентная доля ячеек, оцененных как имеющие точный результат, может использоваться для определения того, когда превышается предельный уровень достоверности (например, >70%, 80%, 90%). Когда уровень достоверности не превышен, процесс перетекает к операции 810, чтобы выявить больше правок. Обычно, чем больше примеров получается, тем точнее результаты. Когда уровень достоверности превышен, процесс перетекает к операции 880.
При операции 880 документ обновляется результатами, созданными посредством применения правила форматирования данных к каждому из элементов. Например, ячейки, имеющие один результат, обновляются этим результатом. Ячейки, имеющие разное количество результатов, могут маркироваться индикатором ошибки, как обсуждалось ранее. Может также отображаться элемент пользовательского интерфейса, соответствующий ревизии, что позволяет пользователю выполнять различные операции, связанные с применением правила форматирования данных.
Затем процесс следует к блоку окончания и возвращается для обработки других действий.
Вышеприведенные изложение, примеры и сведения представляют полное описание производства и использования состава изобретения. Так как многие варианты осуществления могут осуществляться без отступления от существа и объема изобретения, изобретение заключается в прилагаемой формуле изобретения.

Claims (20)

1. Способ форматирования данных на основе примеров, содержащий этапы, на которых:
определяют, когда правки произведены в отношении множества элементов в пределах документа электронной таблицы, причем каждые из этого множества элементов являются связанными;
автоматически создают правило форматирования данных на основе примеров входных данных, которые относятся к разным столбцам документа электронной таблицы, и примеров выходных данных в одном и том же столбце документа электронной таблицы, причем примеры входных данных и примеры выходных данных ассоциированы с упомянутыми правками;
автоматически применяют правило форматирования данных к другим элементам в пределах документа электронной таблицы, которые относятся к одному и тому же типу данных; при этом правило форматирования данных стремится форматировать эти другие элементы в формат, как определено примерами входных данных и примерами выходных данных, причем упомянутые другие элементы отличаются от упомянутого множества элементов; и
отображают упомянутые другие элементы, отражая применение правила форматирования данных.
2. Способ по п. 1, в котором при упомянутом автоматическом создании правила форматирования данных на основе примеров входных данных и примеров выходных данных подают информацию, относящуюся к каждому из примеров, в эвристику машинного обучения, которая создает правило форматирования данных.
3. Способ по п. 1, в котором правки производятся в отношении разных ячеек в пределах одного и того же столбца электронной таблицы.
4. Способ по п. 1, дополнительно содержащий этап, на котором отображают графический пользовательский интерфейс рядом с по меньшей мере одним из упомянутых других элементов, форматированных согласно правилу форматирования данных, который, будучи выбранным, предоставляет опции для выполнения операций, относящихся к форматированному элементу.
5. Способ по п. 4, в котором отображение графического пользовательского интерфейса содержит отображение меню, содержащего опции для отмены форматирования, повторения форматирования, останова форматирования, просмотра потенциально возможных ошибок и игнорирования ошибок.
6. Способ по п. 1, дополнительно содержащий этап, на котором отображают индикатор с форматированным элементом, когда уровень достоверности находится ниже заранее определенного порогового значения.
7. Способ по п. 1, в котором при упомянутом применении правила форматирования данных к другим элементам данных применяют правило форматирования данных к другим элементам в пределах по меньшей мере одного из одного и того же столбца и одной и той же строки.
8. Способ по п. 1, в котором при упомянутом определении того, когда правки произведены в отношении элементов одного и того же типа данных, определяют, когда правки произведены в отношении первого столбца, который включает в себя данные, которые также включены во второй столбец и третий столбец.
9. Способ по п. 1, дополнительно содержащий этап, на котором отображают элемент пользовательского интерфейса, который позволяет сохранить правило форматирования данных для последующего использования.
10. Машиночитаемый носитель данных, на котором сохранены машиноисполняемые команды для форматирования данных на основе примеров, содержащие:
определение примеров выходных данных по множеству элементов в пределах одного и того же столбца документа электронной таблицы;
автоматическое создание правила форматирования данных на основе примеров входных данных, которые относятся к разным столбцам документа электронной таблицы, и упомянутых примеров выходных данных в пределах одного и того же столбца документа электронной таблицы;
автоматическое применение правила форматирования данных к другим элементам в пределах упомянутого одного и того же столбца документа электронной таблицы; при этом правило форматирования данных стремится форматировать эти другие элементы в формат, как определено примерами входных данных и примерами выходных данных, причем упомянутые другие элементы отличаются от упомянутого множества элементов; и
отображение упомянутых других элементов, отражая применение правила форматирования данных.
11. Машиночитаемый носитель данных по п. 10, при этом упомянутое автоматическое создание правила форматирования данных на основе примеров входных данных и примеров выходных данных содержит подачу информации, относящейся к каждому из примеров, в эвристику машинного обучения, которая создает правило форматирования данных на основе примеров.
12. Машиночитаемый носитель данных по п. 10, в котором машиноисполняемые команды дополнительно содержат отображение графического пользовательского интерфейса рядом с по меньшей мере одним из упомянутых других элементов, форматированных согласно правилу форматирования данных, который, будучи выбранным, предоставляет опции для просмотра изменений форматирования.
13. Машиночитаемый носитель данных по п. 10, в котором машиноисполняемые команды дополнительно содержат отображение элемента пользовательского интерфейса в упомянутом одном и том же столбце, когда уровень достоверности находится ниже заранее определенного порогового значения.
14. Машиночитаемый носитель данных по п. 10, при этом упомянутое определение примеров выходных данных содержит анализ первого столбца, который включает в себя данные, которые также включены во второй столбец и третий столбец.
15. Машиночитаемый носитель данных по п. 10, в котором машиноисполняемые команды дополнительно содержат отображение элемента пользовательского интерфейса, который позволяет сохранить правило форматирования данных для последующего использования.
16. Система для форматирования данных на основе примеров, содержащая:
сетевое соединение, которое сконфигурировано для соединения с сетью;
процессор, память и машиночитаемый носитель данных;
операционную среду, хранимую на машиночитаемом носителе данных и исполняющуюся на процессоре;
устройство отображения;
приложение электронной таблицы;
электронную таблицу; при этом электронная таблица содержит элементы, скомпонованные в строках и столбцах; и
диспетчер форматирования, работающий вместе с приложением электронной таблицы, который выполнен с возможностью осуществлять действия, содержащие:
определение того, когда правки произведены в отношении множества элементов в пределах одного и того же столбца электронной таблицы;
автоматическое создание правила форматирования данных, при этом правило форматирования данных основывается на примерах входных данных, которые относятся к разным столбцам электронной таблицы, и примерах выходных данных в пределах одного и того же столбца электронной таблицы, причем примеры входных данных и примеры выходных данных ассоциированы с упомянутыми правками;
автоматическое применение правила форматирования данных к другим элементам в пределах упомянутого одного и того же столбца электронной таблицы; при этом правило форматирования данных стремится форматировать эти другие элементы в формат, как определено примерами входных данных и примерами выходных данных, причем упомянутые другие элементы отличаются от упомянутого множества элементов; и
отображение упомянутых элементов на устройстве отображения, отражая применение правила форматирования данных.
17. Система по п. 16, в которой упомянутые действия дополнительно содержат отображение графического пользовательского интерфейса рядом с по меньшей мере одним из элементов, форматированных согласно правилу форматирования данных, который, будучи выбранным, предоставляет опции для просмотра изменений форматирования.
18. Система по п. 16, в которой упомянутые действия дополнительно содержат отображение элемента пользовательского интерфейса в упомянутом одном и том же столбце, когда уровень достоверности находится ниже заранее определенного порогового значения.
19. Система по п. 16, в которой упомянутое определение того, когда правки произведены в отношении множества элементов одного и того же типа данных, содержит определение того, когда правки произведены в отношении первого столбца, который включает в себя данные, которые также включены во второй столбец и третий столбец.
20. Система по п. 16, в которой упомянутые действия дополнительно содержат отображение элемента пользовательского интерфейса, который позволяет сохранить правило форматирования данных для последующего использования.
RU2013135003/08A 2011-01-26 2012-01-24 Форматирование данных по образцу RU2602786C2 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US13/014,520 US10409892B2 (en) 2011-01-26 2011-01-26 Formatting data by example
US13/014,520 2011-01-26
PCT/US2012/022454 WO2012103159A2 (en) 2011-01-26 2012-01-24 Formatting data by example

Publications (2)

Publication Number Publication Date
RU2013135003A RU2013135003A (ru) 2015-01-27
RU2602786C2 true RU2602786C2 (ru) 2016-11-20

Family

ID=46526787

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2013135003/08A RU2602786C2 (ru) 2011-01-26 2012-01-24 Форматирование данных по образцу

Country Status (20)

Country Link
US (1) US10409892B2 (ru)
EP (1) EP2668594B1 (ru)
JP (1) JP6033235B2 (ru)
KR (1) KR101999409B1 (ru)
CN (1) CN102609403B (ru)
AR (1) AR085036A1 (ru)
AU (1) AU2012209157B2 (ru)
BR (1) BR112013018693A2 (ru)
CA (1) CA2824922C (ru)
CL (1) CL2013002093A1 (ru)
CO (1) CO6731131A2 (ru)
HK (1) HK1173816A1 (ru)
IL (1) IL227218A (ru)
MX (1) MX346269B (ru)
MY (1) MY165937A (ru)
RU (1) RU2602786C2 (ru)
SG (2) SG10201510611UA (ru)
TW (1) TWI582616B (ru)
WO (1) WO2012103159A2 (ru)
ZA (1) ZA201304847B (ru)

Families Citing this family (55)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9213682B1 (en) * 2011-03-31 2015-12-15 Bank Of America Corporation Method and apparatus for auditing a business document
US20140046923A1 (en) 2012-08-10 2014-02-13 Microsoft Corporation Generating queries based upon data points in a spreadsheet application
US11361246B2 (en) * 2012-08-31 2022-06-14 DataRobot, Inc. Methods for automating aspects of machine learning, and related systems and apparatus
US9495641B2 (en) 2012-08-31 2016-11-15 Nutomian, Inc. Systems and method for data set submission, searching, and retrieval
US9524473B2 (en) 2012-08-31 2016-12-20 Nutonian, Inc. System and method for auto-query generation
US9002758B2 (en) * 2012-10-17 2015-04-07 Microsoft Technology Licensing, Llc Ranking for inductive synthesis of string transformations
US10140269B2 (en) * 2013-03-12 2018-11-27 Microsoft Technology Licensing, Llc Viewing effects of proposed change in document before committing change
CN104239283A (zh) * 2013-06-13 2014-12-24 富泰华工业(深圳)有限公司 文字编辑系统及方法
US10229101B2 (en) 2013-06-14 2019-03-12 Microsoft Technology Licensing, Llc Smart fill
US10019432B2 (en) 2013-06-15 2018-07-10 Microsoft Technology Licensing, Llc Conversion of data ranges to table objects
US10366346B2 (en) 2014-05-23 2019-07-30 DataRobot, Inc. Systems and techniques for determining the predictive value of a feature
US10496927B2 (en) 2014-05-23 2019-12-03 DataRobot, Inc. Systems for time-series predictive data analytics, and related methods and apparatus
US10558924B2 (en) 2014-05-23 2020-02-11 DataRobot, Inc. Systems for second-order predictive data analytics, and related methods and apparatus
GB2541625A (en) 2014-05-23 2017-02-22 Datarobot Systems and techniques for predictive data analytics
US10824799B2 (en) 2014-06-30 2020-11-03 Microsoft Technology Licensing, Llc Summary data autofill
US10191895B2 (en) * 2014-11-03 2019-01-29 Adobe Systems Incorporated Adaptive modification of content presented in electronic forms
US10685173B2 (en) 2015-08-17 2020-06-16 International Business Machines Corporation Formatting tables with complex patterns
US20170139893A1 (en) * 2015-11-12 2017-05-18 SmartSheet.com, Inc. Automatically adjusting spreadsheet formulas and/or formatting
EP3398080A4 (en) * 2015-12-29 2019-07-31 Microsoft Technology Licensing, LLC FORMATTING DOCUMENT OBJECTS BY VISUAL SUGGESTIONS
US9864732B2 (en) * 2016-05-02 2018-01-09 Google Inc. User interfaces that facilitate management of formatting of digital content
US10621195B2 (en) * 2016-09-20 2020-04-14 Microsoft Technology Licensing, Llc Facilitating data transformations
US10706066B2 (en) 2016-10-17 2020-07-07 Microsoft Technology Licensing, Llc Extensible data transformations
US11892987B2 (en) 2016-10-20 2024-02-06 Microsoft Technology Licensing, Llc Automatic splitting of a column into multiple columns
US11256710B2 (en) 2016-10-20 2022-02-22 Microsoft Technology Licensing, Llc String transformation sub-program suggestion
US11620304B2 (en) * 2016-10-20 2023-04-04 Microsoft Technology Licensing, Llc Example management for string transformation
US10776380B2 (en) 2016-10-21 2020-09-15 Microsoft Technology Licensing, Llc Efficient transformation program generation
US10846298B2 (en) 2016-10-28 2020-11-24 Microsoft Technology Licensing, Llc Record profiling for dataset sampling
US11170020B2 (en) 2016-11-04 2021-11-09 Microsoft Technology Licensing, Llc Collecting and annotating transformation tools for use in generating transformation programs
US11163788B2 (en) 2016-11-04 2021-11-02 Microsoft Technology Licensing, Llc Generating and ranking transformation programs
US20180143957A1 (en) * 2016-11-18 2018-05-24 Business Objects Software Limited Using format patterns for numeric formatting
US10387900B2 (en) 2017-04-17 2019-08-20 DataRobot, Inc. Methods and apparatus for self-adaptive time series forecasting engine
US11182548B2 (en) * 2017-07-10 2021-11-23 Adaptam Inc. Methods and systems for providing selective multi-way replication and atomization of cell blocks and other elements in spreadsheets and presentations
US11080462B2 (en) * 2017-11-13 2021-08-03 Workshare Ltd. Method of comparing two data tables and displaying the results without source formatting
US10241992B1 (en) * 2018-04-27 2019-03-26 Open Text Sa Ulc Table item information extraction with continuous machine learning through local and global models
US10977433B2 (en) * 2018-10-09 2021-04-13 Oracle International Corporation System and method for input data validation and conversion
US20200160303A1 (en) * 2018-11-19 2020-05-21 Rylti, LLC Method and system for audit, verification, and settlement of royalty and license fees in the music industry
JPWO2020213288A1 (ru) * 2019-04-17 2020-10-22
JP2021026567A (ja) * 2019-08-06 2021-02-22 株式会社三菱Ufj銀行 フォーマット変換装置及びプログラム
WO2021051046A1 (en) 2019-09-14 2021-03-18 Bytedance Inc. Quantization parameter for chroma deblocking filtering
WO2021072177A1 (en) 2019-10-09 2021-04-15 Bytedance Inc. Cross-component adaptive loop filtering in video coding
CN114586370B (zh) * 2019-10-14 2024-01-23 字节跳动有限公司 在视频编解码中使用色度量化参数的方法、装置及介质
EP4055827A4 (en) 2019-12-09 2023-01-18 ByteDance Inc. USING QUANTIFICATION GROUPS IN VIDEO CODING
CN114902657A (zh) 2019-12-31 2022-08-12 字节跳动有限公司 视频编解码中的自适应颜色变换
US11074048B1 (en) 2020-04-28 2021-07-27 Microsoft Technology Licensing, Llc Autosynthesized sublanguage snippet presentation
US11327728B2 (en) 2020-05-07 2022-05-10 Microsoft Technology Licensing, Llc Source code text replacement by example
CN112784560A (zh) * 2020-05-26 2021-05-11 珠海金山办公软件有限公司 一种数据显示方法及装置
US11481195B2 (en) 2020-06-09 2022-10-25 Google Llc Synthesizing programs in a spreadsheet programming language
US11657217B2 (en) 2020-06-26 2023-05-23 Adaptam Inc. Methods and systems for presenting drop-down, pop-up or other presentation of a multi-value data set in a spreadsheet cell
US11900080B2 (en) 2020-07-09 2024-02-13 Microsoft Technology Licensing, Llc Software development autocreated suggestion provenance
CN112908392B (zh) * 2021-02-09 2023-09-15 东芯半导体股份有限公司 控制非易失性存储器参数的控制方法
US11875136B2 (en) 2021-04-01 2024-01-16 Microsoft Technology Licensing, Llc Edit automation using a temporal edit pattern
US11941372B2 (en) 2021-04-01 2024-03-26 Microsoft Technology Licensing, Llc Edit automation using an anchor target list
US11977835B2 (en) 2021-05-24 2024-05-07 Adaptam Inc. Method and system for spreadsheet error identification and avoidance
US11663399B1 (en) 2022-08-29 2023-05-30 Bank Of America Corporation Platform for generating published reports with position mapping identification and template carryover reporting
US11900054B1 (en) 2022-08-29 2024-02-13 Bank Of America Corporation Platform for generating published reports using report and worksheet building with position mapping identification

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2439683A (en) * 1946-09-14 1948-04-13 Ernest N Broderick Sanitary receptacle and supporter
US6697999B1 (en) * 1999-10-20 2004-02-24 Sun Microsystems, Inc. Computer-based automatic document formatting method
US7222294B2 (en) * 1998-12-31 2007-05-22 Microsoft Corporation Extension of formulas and formatting in an electronic spreadsheet

Family Cites Families (68)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5231577A (en) * 1990-04-06 1993-07-27 Microsoft Corporation Method and system for processing formatting information in a spreadsheet
US5701499A (en) 1992-03-25 1997-12-23 Microsoft Corporation Method and system for automatically entering a data series into contiguous cells of an electronic spreadsheet program or the like
US5613131A (en) * 1993-01-29 1997-03-18 Microsoft Corporation Auto-formatting of tables in a spreadsheet program
US5621875A (en) * 1993-10-26 1997-04-15 Microsoft Corp. Method and system for automatic formatting of user selected text
US5598519A (en) * 1994-11-08 1997-01-28 Microsoft Corporation Method and system for direct cell formatting in a spreadsheet
US5778402A (en) * 1995-06-07 1998-07-07 Microsoft Corporation Method and system for auto-formatting a document using an event-based rule engine to format a document as the user types
US5805158A (en) 1996-08-22 1998-09-08 International Business Machines Corporation Copying predicted input between computer systems
US6038567A (en) * 1998-02-19 2000-03-14 Microsoft Corporation Method and system for propagating object properties in a desktop publishing program
US6731309B1 (en) 1998-08-28 2004-05-04 Corel Corporation Real time preview
US7069508B1 (en) * 2000-07-13 2006-06-27 Language Technologies, Inc. System and method for formatting text according to linguistic, visual and psychological variables
TW498221B (en) 1999-08-20 2002-08-11 Ibm Method and system in an electronic spreadsheet for introducing new elements in a cell named range according to different modes
JP4091726B2 (ja) 2000-02-23 2008-05-28 インターナショナル・ビジネス・マシーンズ・コーポレーション 構造化文書の表示規則の生成方法、システムおよびプログラムが記録された媒体ならびに構造化文書およびその文書型定義の変更方法、システムおよびプログラムが記録された媒体
US6981028B1 (en) 2000-04-28 2005-12-27 Obongo, Inc. Method and system of implementing recorded data for automating internet interactions
EP1202206A3 (en) * 2000-10-24 2004-01-21 International Business Machines Corporation Method and system in an electronic spreadsheet for persistently self-replicating multiple ranges of cells through a copy-paste operation
TW518509B (en) 2000-11-28 2003-01-21 Ibm Method and system in an electronic spreadsheet for persistently filling by samples a range of cells
US20020156816A1 (en) 2001-02-13 2002-10-24 Mark Kantrowitz Method and apparatus for learning from user self-corrections, revisions and modifications
US6968504B2 (en) * 2001-06-29 2005-11-22 Microsoft Corporation Automated document formatting tool
US7089298B2 (en) 2001-08-20 2006-08-08 Nokia Corporation Naming distribution method for ad hoc networks
US7343551B1 (en) 2002-11-27 2008-03-11 Adobe Systems Incorporated Autocompleting form fields based on previously entered values
US7305129B2 (en) 2003-01-29 2007-12-04 Microsoft Corporation Methods and apparatus for populating electronic forms from scanned documents
US7426496B2 (en) 2004-03-03 2008-09-16 Microsoft Corporation Assisted form filling
US7350187B1 (en) 2003-04-30 2008-03-25 Google Inc. System and methods for automatically creating lists
US7660779B2 (en) 2004-05-12 2010-02-09 Microsoft Corporation Intelligent autofill
US7584422B2 (en) 2004-07-12 2009-09-01 Informatica Corporation System and method for data format transformation
US7707486B2 (en) 2004-08-06 2010-04-27 The Board Of Trustees Of The Leland Stanford Junior University Logical spreadsheets
US7933862B2 (en) 2004-09-27 2011-04-26 Microsoft Corporation One click conditional formatting method and system for software programs
US8745483B2 (en) 2004-10-07 2014-06-03 International Business Machines Corporation Methods, systems and computer program products for facilitating visualization of interrelationships in a spreadsheet
US7451397B2 (en) 2004-12-15 2008-11-11 Microsoft Corporation System and method for automatically completing spreadsheet formulas
US8621340B2 (en) * 2004-12-20 2013-12-31 Microsoft Corporation Block properties and calculated columns in a spreadsheet application
KR20070024771A (ko) 2005-08-30 2007-03-08 엔에이치엔(주) 질의어 자동변환을 이용한 자동완성 질의어 제공 시스템 및방법
US7792814B2 (en) 2005-09-30 2010-09-07 Sap, Ag Apparatus and method for parsing unstructured data
US7627812B2 (en) * 2005-10-27 2009-12-01 Microsoft Corporation Variable formatting of cells
US7640158B2 (en) 2005-11-08 2009-12-29 Multimodal Technologies, Inc. Automatic detection and application of editing patterns in draft documents
US7590608B2 (en) 2005-12-02 2009-09-15 Microsoft Corporation Electronic mail data cleaning
US7634717B2 (en) 2006-01-23 2009-12-15 Microsoft Corporation Multiple conditional formatting
US7770100B2 (en) 2006-02-27 2010-08-03 Microsoft Corporation Dynamic thresholds for conditional formats
US7689904B2 (en) 2006-03-06 2010-03-30 Sap Ag Template-based creation of electronic document
US20070220415A1 (en) 2006-03-16 2007-09-20 Morgan Mao Cheng Excel spreadsheet parsing to share cells, formulas, tables or entire spreadsheets across an enterprise with other users
US10345922B2 (en) 2006-04-21 2019-07-09 International Business Machines Corporation Office system prediction configuration sharing
US8600916B2 (en) 2006-04-21 2013-12-03 International Business Machines Corporation Office system content prediction based on regular expression pattern analysis
US8005806B2 (en) 2006-11-15 2011-08-23 Yahoo! Inc. System and method for information retrieval using context information
CN101105814A (zh) 2007-09-11 2008-01-16 金蝶软件(中国)有限公司 一种将Script语言转换成SQL语言的方法及装置
US20090089653A1 (en) 2007-09-28 2009-04-02 Microsoft Corporation Auto-generation and syndication of tables as forms
US8640024B2 (en) * 2007-10-30 2014-01-28 Adobe Systems Incorporated Visually distinct text formatting
CN101158900B (zh) 2007-11-19 2010-09-08 北京大学 一种基于模板系列的报表生成系统及方法
US20090228776A1 (en) 2008-03-05 2009-09-10 Microsoft Corporation Dynamic formulas for spreadsheet cells
US20090319542A1 (en) 2008-06-19 2009-12-24 Pierre Jean Le Brazidec Systems and methods to automatically replace content in a range of spreadsheet cells with information from a database
US9032283B2 (en) * 2008-09-29 2015-05-12 Apple Inc. Rendering common cell formatting for adjacent cells
US8255789B2 (en) * 2008-09-30 2012-08-28 Apple Inc. Providing spreadsheet features
US8150814B2 (en) 2009-04-07 2012-04-03 Business Objects Software Ltd. System and method of data cleansing using rule based formatting
US20100325173A1 (en) 2009-06-23 2010-12-23 The Board Of Regents Of The The University Of Texas System Rapid development of informatics systems for collaborative data management
US8386406B2 (en) 2009-07-08 2013-02-26 Ebay Inc. Systems and methods for making contextual recommendations
US20110066933A1 (en) 2009-09-02 2011-03-17 Ludwig Lester F Value-driven visualization primitives for spreadsheets, tabular data, and advanced spreadsheet visualization
CN101661512B (zh) 2009-09-25 2012-01-11 万斌 一种识别传统表单信息并创建对应Web表单的系统及方法
US8140533B1 (en) 2010-01-26 2012-03-20 Google Inc. Harvesting relational tables from lists on the web
US9489366B2 (en) 2010-02-19 2016-11-08 Microsoft Technology Licensing, Llc Interactive synchronization of web data and spreadsheets
US20120003619A1 (en) 2010-06-23 2012-01-05 Canadian National Railway Company Method and system for assigning jobs to prevent employee qualifications from lapsing
US8510373B2 (en) 2010-08-30 2013-08-13 Sap Ag Data synchronization and disablement of dependent data fields
EP2506155A1 (en) 2011-03-30 2012-10-03 Siemens Aktiengesellschaft Auto-fill functionality within engineering software for automation systems
US8645825B1 (en) 2011-08-31 2014-02-04 Google Inc. Providing autocomplete suggestions
US20130124957A1 (en) 2011-11-11 2013-05-16 Microsoft Corporation Structured modeling of data in a spreadsheet
US8799760B2 (en) 2011-12-08 2014-08-05 Xerox Corporation Smart macros using zone selection information and pattern discovery
US20130191714A1 (en) 2012-01-25 2013-07-25 Microsoft Corporation Fill by example animation and visuals
CA2793667A1 (en) 2012-02-24 2013-08-24 Research In Motion Limited Retrieval and presentation of contact data at an electronic device
US8819574B2 (en) 2012-10-22 2014-08-26 Google Inc. Space prediction for text input
US9244977B2 (en) 2012-12-31 2016-01-26 Google Inc. Using content identification as context for search
US10229101B2 (en) 2013-06-14 2019-03-12 Microsoft Technology Licensing, Llc Smart fill
US9652446B2 (en) * 2014-08-22 2017-05-16 Smartsheet Inc. Automatically adjusting spreadsheet formulas and/or formatting

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2439683A (en) * 1946-09-14 1948-04-13 Ernest N Broderick Sanitary receptacle and supporter
US7222294B2 (en) * 1998-12-31 2007-05-22 Microsoft Corporation Extension of formulas and formatting in an electronic spreadsheet
US6697999B1 (en) * 1999-10-20 2004-02-24 Sun Microsystems, Inc. Computer-based automatic document formatting method

Also Published As

Publication number Publication date
CN102609403A (zh) 2012-07-25
CA2824922C (en) 2019-02-19
AR085036A1 (es) 2013-08-07
AU2012209157A1 (en) 2013-07-25
ZA201304847B (en) 2014-09-25
SG191850A1 (en) 2013-08-30
US20120192051A1 (en) 2012-07-26
WO2012103159A2 (en) 2012-08-02
JP2014507029A (ja) 2014-03-20
WO2012103159A3 (en) 2012-09-20
RU2013135003A (ru) 2015-01-27
AU2012209157B2 (en) 2016-07-21
KR20140009297A (ko) 2014-01-22
JP6033235B2 (ja) 2016-11-30
EP2668594B1 (en) 2021-07-07
IL227218A (en) 2016-07-31
CN102609403B (zh) 2015-05-20
CA2824922A1 (en) 2012-08-02
SG10201510611UA (en) 2016-01-28
US10409892B2 (en) 2019-09-10
EP2668594A2 (en) 2013-12-04
KR101999409B1 (ko) 2019-07-11
EP2668594A4 (en) 2018-01-24
TW201232294A (en) 2012-08-01
TWI582616B (zh) 2017-05-11
HK1173816A1 (en) 2013-05-24
BR112013018693A2 (pt) 2016-10-18
CL2013002093A1 (es) 2013-12-13
MY165937A (en) 2018-05-18
MX2013008441A (es) 2013-08-12
CO6731131A2 (es) 2013-08-15
MX346269B (es) 2017-03-13

Similar Documents

Publication Publication Date Title
RU2602786C2 (ru) Форматирование данных по образцу
JP6282116B2 (ja) キャプチャーされた画像データのスプレッドシートとの関連付け
US20200233847A1 (en) Incremental dynamic document index generation
US8782557B2 (en) Ordered multiple selection user interface
US20150178259A1 (en) Annotation hint display
US20130290837A1 (en) Method and Apparatus for Correcting Document Formatting Based on Source Document
US20090248740A1 (en) Database form and report creation and reuse
JP5637143B2 (ja) 共同開発支援システム、共同開発支援方法及びプログラム
CN114072787A (zh) 用于促进文档审核的快速数据输入的系统和方法
NZ711979B2 (en) Formatting data by example
NZ711979A (en) Formatting data by example
KR101049895B1 (ko) 전자문서 작성기
US9898449B1 (en) System and method for automatically replacing information in a plurality electronic documents
US20130290835A1 (en) Method and Apparatus for the Selection and Reformat of Portions of a Document
CN104462164A (zh) 要件定义工序支援方法

Legal Events

Date Code Title Description
HZ9A Changing address for correspondence with an applicant
MM4A The patent is invalid due to non-payment of fees

Effective date: 20200125