RU2602786C2 - Форматирование данных по образцу - Google Patents
Форматирование данных по образцу Download PDFInfo
- Publication number
- RU2602786C2 RU2602786C2 RU2013135003/08A RU2013135003A RU2602786C2 RU 2602786 C2 RU2602786 C2 RU 2602786C2 RU 2013135003/08 A RU2013135003/08 A RU 2013135003/08A RU 2013135003 A RU2013135003 A RU 2013135003A RU 2602786 C2 RU2602786 C2 RU 2602786C2
- Authority
- RU
- Russia
- Prior art keywords
- data
- examples
- elements
- formatting rule
- formatting
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/26—Visual data mining; Browsing structured data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/14—Digital output to display device ; Cooperation and interconnection of the display device with other functional units
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- User Interface Of Digital Computer (AREA)
- Character Discrimination (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
Изобретение относится к средствам форматирования данных на основе примеров. Технический результат заключается в обеспечении возможности автоматического форматирования данных электронной таблицы. Определяют, когда правки произведены в отношении множества элементов в пределах документа электронной таблицы, причем каждые из этого множества элементов являются связанными. Автоматически создают правило форматирования данных на основе примеров входных данных, которые относятся к разным столбцам документа электронной таблицы, и примеров выходных данных в одном и том же столбце документа электронной таблицы, причем примеры входных данных и примеры выходных данных ассоциированы с упомянутыми правками. Автоматически применяют правило форматирования данных к другим элементам в пределах документа электронной таблицы, которые относятся к одному и тому же типу данных, при этом правило форматирования данных стремится форматировать эти другие элементы в формат, как определено примерами входных данных и примерами выходных данных, причем упомянутые другие элементы отличаются от упомянутого множества элементов. Отображают упомянутые другие элементы, отражая применение правила форматирования данных. 3 н. и 17 з.п. ф-лы, 8 ил.
Description
УРОВЕНЬ ТЕХНИКИ
Одинаковый тип данных часто вводится и сохраняется во многих разных форматах. Например, некоторые даты существуют в форме ВВГГММДД (19990101), другие даты в формате ММ/ДД/ВВГГ (01/01/1999), помимо этого, другие даты в формате М/Д/ГГ (1/1/99). Чтобы выполнять анализ над данными, они преобразуются в одинаковый формат. Например, некоторый анализ может предписывать, что телефонные номера должны форматироваться, придерживаясь формы (206) 555-1212, тогда как другой анализ может предписывать, чтобы форматирование было снято с телефонных номеров (т.е. 2065551212). Разные способы могут использоваться для преобразования данных. Например, могут быть использованы разные функции преобразования и/или может быть разработана управляющая программа для преобразования данных.
СУЩНОСТЬ ИЗОБРЕТЕНИЯ
Это краткое изложение сущности изобретения приведено, чтобы предоставить подборку концепций в упрощенной форме, которые дополнительно описаны ниже в подробном описании. Это краткое изложение сущность изобретения не предназначено для идентификации ключевых признаков или существенных признаков заявленного изобретения, и не предназначено для использования в качестве содействия в определении объема заявленного изобретения.
Правила форматирования данных для преобразования элементов данных из одной формы в другую форму определяются автоматически на основании примерного набора выходных данных, например, пользовательских правок. Эвристика машинного обучения применяется к исходным данным, а так же и примерным выходным данным (например, пользовательским правкам), чтобы определять правило форматирования данных, которое может применяться к дополнительным элементам данных. Например, пользователь может осуществлять правки, которые добавляют/удаляют символы из данных, сцепляют данные, извлекают данные, переименовывают данные и тому подобное. Посредством изучения исходных значений наряду с отредактированными значениями, может выводиться правило, которое заключает в себе этот тип преобразования, а затем такое правило может применяться в отношении дополнительных исходных значений, чтобы автоматически формировать требуемые отредактированные значения или выходные данные. Эвристика машинного обучения может запускаться автоматически в ответ на событие (например, после предопределенного количества правок, произведенных в отношении одного и того же типа данных), или запускаться вручную (например, путем выбора опции пользовательского интерфейса). Правило форматирования данных может быть применено к другим данным, а результаты форматирования - допускать ревизию со стороны пользователя. На основании дальнейших правок/ревизий, правило форматирования данных может обновляться. Правила форматирования данных могут сохраняться для более позднего использования и/или модификации. Также может быть представлен уровень достоверности, чтобы содействовать пользователю в определении того, был ли элемент(ы) переформатирован правильно.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
Фиг.1 иллюстрирует примерное вычислительное окружение;
Фиг.2 показывает систему для форматирования данных на основании правок, произведенных в отношении документа;
Фиг.3 иллюстрирует определение правила форматирования данных на основании пользовательских правок в отношении столбца и применение правила форматирования данных к другим ячейкам в пределах столбца;
Фиг.4 показывает пример осуществления пользователем правок в отношении элементов в столбце номера социального страхования;
Фиг.5 иллюстрирует пример осуществления пользователем правок для изменения форматирования дат;
Фиг.6 показывает элементы пользовательского интерфейса, которые можно использовать, чтобы взаимодействовать с форматированием элементов;
Фиг.7 показывает пользовательский интерфейс для разрешения/запрета заполнения по образцу;
Фиг.8 показывает иллюстративную последовательность операций для форматирования данных по образцу.
ПОДРОБНОЕ ОПИСАНИЕ
Далее, со ссылкой на чертежи, на которых одинаковые номера представляют подобные элементы, будут описаны различные варианты осуществления. В частности, Фиг.1 и соответствующее обсуждение предназначены для представления краткого общего описания пригодной вычислительной среды, в которой могут быть реализованы варианты осуществления.
Обычно, программные модули включают в себя процедуры, программы, компоненты, структуры данных и другие типы структур, которые выполняют конкретные задачи или реализуют конкретные абстрактные типы данных. Другие конфигурации компьютерной системы также могут использоваться, в том числе, карманные устройства, многопроцессорные системы, основанную на микропроцессоре или программируемую бытовую электронику, миникомпьютеры, универсальные вычислительные машины и тому подобное. Распределенные вычислительные среды также могут использоваться в тех случаях, когда задачи выполняются удаленными вычислительными устройствами, которые связаны через сети связи. В распределенном компьютерном окружении, программные модули могут быть расположены как в локальных, так и в удаленных запоминающих устройствах.
Далее, со ссылкой на Фиг.1, будет описано иллюстративное компьютерное окружение для компьютера 100, используемого в различных вариантах осуществления. Компьютерное окружение, показанное на Фиг.1, включает в себя вычислительные устройства, каждое из которых может быть сконфигурировано в качестве сервера, настольного или мобильного компьютера, либо некоторого другого типа вычислительного устройства, и включает в себя центральное процессорное устройство 5 («ЦПУ», «CPU»), системную память 7, включающую в себя оперативное запоминающее устройство 9 («ОЗУ», «RAM») и постоянное запоминающее устройство 10 («ПЗУ», «ROM»), и системную шину 12, которая присоединяет память к центральному процессорному устройству 5 («ЦПУ»).
Базовая система ввода-вывода, содержащая базовые процедуры, которые помогают пересылать информацию между элементами в пределах компьютера, к примеру, во время запуска, хранится в ПЗУ 10. Компьютер 100 дополнительно включает в себя запоминающее устройство 14 большой емкости для хранения операционной системы 16, электронной таблицы 11, приложения 24 электронных таблиц, других программных модулей 25 и диспетчера 26 форматирования, который будет подробнее описан ниже.
Запоминающее устройство 14 большой емкости присоединено к ЦПУ 5 через контроллер запоминающего устройства (не показан), присоединенный к шине 12. Запоминающее устройство 14 большой емкости и связанные с ним машинно-читаемые носители обеспечивают энергонезависимое хранилище для компьютера 100. Хотя описание машинно-читаемых носителей, содержащееся в материалах настоящей заявки, ссылается на запоминающее устройство большой емкости, такое как жесткий диск или привод CD-ROM (ПЗУ на компакт-диске), машинно-читаемые носителем могут быть любыми доступными носителями, которые могут подвергаться доступу компьютером 100.
В качестве примера, а не ограничения, машинно-читаемые носители могут содержать компьютерные носители данных и среды связи. Компьютерные носители данных включают в себя энергозависимые и энергонезависимые, съемные и несъемные носители, реализованные любым способом или технологией для хранения информации, такой как машинно-читаемые команды, структуры данных, программные модули или другие данные. Машинно-читаемые носители включают в себя, но не в качестве ограничения, ОЗУ, ПЗУ, стираемое программируемое запоминающее устройство («EPROM»), электрически стираемое программируемое запоминающее устройство («EEPROM»), флэш-память или другую технологию твердотельной памяти, CD-ROM, цифровой многофункциональный диск («DVD») или другое оптическое запоминающее устройство, магнитные кассеты, магнитную ленту, накопитель на магнитных дисках или другие магнитные запоминающие устройства, либо любой другой носитель, который может использоваться для хранения требуемой информации и который может подвергаться доступу компьютером 100.
Компьютер 100 работает в сетевом окружении, используя логические соединения с удаленными компьютерами посредством сети 18, такой как Интернет. Компьютер 100 может подсоединяться к сети 18 посредством блока сетевого интерфейса 20, подключенного к шине 12. Сетевое соединение может быть беспроводным и/или проводным. Блок сетевого интерфейса 20 может также использоваться для подсоединения к другим типам сетей и удаленным вычислительным системам, таким как сетевая служба(ы) 27. Компьютер 100 может также включать в себя контроллер 22 ввода/вывода для получения и обработки входных данных от ряда других устройств, в том числе, клавиатуру, мышь или электронное перо (не показано на Фиг.1). Аналогично, контроллер 22 ввода/вывода может обеспечивать ввод/вывод в IP-телефон, экран 23 дисплея, принтер или другой тип устройства вывода.
Как упоминалось вкратце выше, ряд программных модулей и файлов данных может сохраняться в запоминающем устройстве 14 и ОЗУ 9 компьютера 100, включая операционную систему 16, пригодную для управления работой компьютера, такую как операционная система WINDOWS 7® от корпорации Майкрософт, Редмонд, Вашингтон. Запоминающее устройство 14 и ОЗУ 9 могут также хранить один или более программных модулей. В частности, запоминающее устройство 14 и ОЗУ 9 могут хранить одну или более прикладных программ, включая приложение 24 электронной таблицы и программные модули 25. Согласно варианту осуществления, приложением 24 электронной таблицы является приложение электронной таблицы EXCEL от корпорации Майкрософт. Также могут использоваться другие приложения электронной таблицы. Пользовательский интерфейс, такой как UI 28, позволяет пользователю взаимодействовать с приложением, таким как приложение 24 электронной таблицы.
Диспетчер 26 форматирования может располагаться внешне от приложения 24 электронной таблицы, как показано, или может являться частью приложения 24 электронной таблицы. Дополнительно все/некоторые из выполняемых функций, обеспечиваемых диспетчером 26 форматирования, могут располагаться внутренне/внешне по отношению к приложению 24 электронной таблицы.
Диспетчер 26 форматирования сконфигурирован формировать одно или более правил форматирования данных для преобразования данных из одной формы в другую форму, основываясь на исходных данных и примерных выходных данных, например пользовательских правках. Согласно варианту осуществления, диспетчер 26 форматирования применяет эвристику машинного обучения к исходным данным, а также примерным выходным данным (пользовательским правкам), чтобы определять правило(а) форматирования данных, которое может применяться к данным. Например, пользователь может осуществлять правки, которые добавляют/удаляют символы из данных, сцепляют данные, извлекают данные, переименовывают данные и тому подобное. В ответ на правки, формируется правило(а) форматирования данных, которое применяется к другим данным в пределах документа (например, электронной таблицы). Форматирование, которое применяется к данным, может допускать ревизию со стороны пользователя, так что пользователь может принимать/отклонять изменения. Форматирование, применяемое к данным, может также содержать форматирование метаданных. Согласно варианту осуществления, уровень достоверности, определяемый из правила форматирования, связан с форматированием, которое применяется к данным, так что пользователь может более легко распознавать, когда данные переформатированы правильно. Например, высокий уровень достоверности показывает что, скорее всего, данные отформатированы правильно, при этом сниженный уровень достоверности может показывать, что пользователь может желать пересмотреть результаты. Эвристика машинного обучения может запускаться автоматически в ответ на событие (например, после выполнения заранее определенного количества правок в отношении одного и того же типа данных) или запускаться вручную (например, путем выбора пункта меню пользовательского интерфейса). На основании дополнительных правок/ревизий, правило форматирования данных может обновляться. Правила форматирования данных могут также сохраняться для более позднего использования и/или модификации. Например, пользователь может модифицировать правило (например, шрифт), вследствие чего применение правила форматирования данных следует модифицированному правилу.
Фиг.2 показывает систему для форматирования данных на основе на правок, произведенных в отношении документа. Как изображено, система 200 включает в себя диспетчер 26 форматирования, прикладную программу 210, ответный код 212 и устройство 215 отображения. Используемым вычислительным устройством(и) может быть любой тип вычислительного устройства, который сконфигурирован выполнять операции, относящиеся к автоматическому форматированию данных, на основании пользовательских правок к документу. Например, некоторыми из вычислительных устройств могут быть: мобильные вычислительные устройства (например, сотовые телефоны, планшеты, смартфоны, лаптопы и тому подобное); настольные вычислительные устройства и серверы.
Для того чтобы облегчить коммуникацию с диспетчером 26 форматирования, могут быть реализованы одна или более процедур обратного вызова (callback), изображенный на Фиг.2 как код 212 обратного вызова. Согласно одному варианту осуществления, прикладная программа 210 является приложением электронной таблицы.
Устройство 215 отображения сконфигурировано отображать документ, такой как документ 220 электронной таблицы, и элементы пользовательского интерфейса, используемые для взаимодействия с документом. Как изображено, электронная таблица 220 показывает три столбца, в том числе, столбец фамилии (А), столбец имени (В) и отредактированный столбец (С). В текущем примере пользователь произвел правки в отношении отредактированного столбца. В ячейке С2 пользователь ввел для той строки, строки 2, фамилию (которая также содержится в ячейке А2), через запятую, после которой идут первые инициалы (которые также содержатся в ячейке В2). В ячейке С3 пользователь ввел для той строки, строки 3, фамилию (которая также содержится в ячейке А3), через запятую, после которой идут первые инициалы (которые также содержатся в ячейке В3).
Как правило, диспетчер 26 форматирования определяет, когда пользователь правит/модифицирует данные, которые соответствуют шаблону, который можно заполнить и применить к дополнительным данным в электронной таблице, и автоматически заполняет столбец результатами, которые получаются после применения правила форматирования данных. В ответ на правки, диспетчер 26 форматирования использует информацию, которая связана с правками, чтобы получить правило форматирования данных, которое применяется к другим данным в пределах электронной таблицы. Согласно варианту осуществления, информация включает в себя примеры выходных данных, которые являются результатом правок к тексту, который отображается в пределах правленых ячеек (например, ячеек С2 и С3), и примеры входных данных, которые связаны с правками. В таком случае, столбец А и столбец В включают в себя примеры входных данных, которые связаны с редактируемыми столбцами (например, ячейки А2 и В2 являются примером входных данных для примера выходных данных С2, а ячейки А3 и В3 являются примером входных данных для примера выходных данных С3). Эти примеры входных/выходных данных определяются диспетчером 26 форматирования и подаются в процесс, который формирует правило форматирования данных для других аналогично форматированных ячеек (например, ячеек С4:С7 (222)). Эвристика машинного обучения получает набор примеров входных/выходных данных, определяет шаблон, формирует правило форматирования данных, а затем диспетчер 26 форматирования применяет правила форматирования данных к диапазону выходных данных, чтобы формировать по-новому отформатированные значения. Согласно варианту осуществления, примерная эвристика машинного обучения описана в «Automatic String Processing in Spreadsheets Using Input-Output Examples» («Автоматическая обработка строк в электронных таблицах с использованием примеров входных-выходных данных»), Sumit Gulwani (Сумит Гулвани), Остин, Техас. Могут использоваться другие эвристики машинного обучения. Как правило, может использоваться любая эвристика, которая берет исходные данные, а также правки данных в качестве входных данных и создает правило форматирования данных, которое может применяться к другим данным, чтобы в результате были получены данные, отформатированные аналогичным образом. Согласно варианту осуществления, функционал эвристики машинного обучения включен в диспетчер 26 форматирования. Функционал может также располагаться в других местах.
Диспетчер 26 форматирования автоматически применяет правило форматирования данных к другим ячейкам в пределах электронной таблицы, которые отформатированы аналогичным образом. Согласно варианту осуществления, правило форматирования данных автоматически применяется к выходному диапазону ячеек, которые заполняют столбец редактируемого столбца. В текущем примере, выходной диапазон включает в себя ячейки C4:C7. Рамка 222 показывает, что применение правил форматирования данных к ячейкам C4:C7 приводит к значениям, размещенным в пределах ячеек C5 и C6. Согласно варианту осуществления, правило форматирования данных, которое применяется к выходному ряду, является динамичным. Другими словами, когда значение правится в пределах выходного диапазона, правило форматирования данных обновляется, используя дополнительный пример(ы) входных/выходных данных.
Правило форматирования данных может формировать ноль или более значений для каждой из ячеек. Например, значение не возвращается для ячеек С4 и С7, так как нет имени в соответствующей ячейке в столбце В. Более чем один потенциальный результат может формироваться посредством правила форматирования данных, когда правило форматирования данных не уверено в результате. Согласно варианту осуществления, перед тем, как автоматически переформатировать данные, правило форматирования данных применяется к предопределенному количеству ячеек, чтобы определить, формирует ли применение правила форматирования результаты, которые соответствуют предопределенному пороговому уровню достоверности или превышают его. Например, если применение правила форматирования к предопределенному количеству ячеек приводит к низкому уровню достоверности, правило форматирования данных не применяется автоматически. Согласно варианту осуществления, правило форматирования данных применяется к ячейкам в выходном диапазоне и определяется процентная доля ячеек, которые имеют один ответ. Согласно варианту осуществления, процентная доля ячеек, которые имеют ноль ответов, исключается из вычисления. Когда процентная доля выше предопределенного порогового значения (например, 70%), ячейки в выходном диапазоне автоматически заполняются, используя результаты, обеспеченные посредством правила форматирования данных. Когда пороговое значение не достигнуто, результаты могут не применяться к ячейке и больше правок получается до того, как будет создано новое правило форматирования данных, или результаты могут применяться к ячейке и к ячейке может применяться индикатор (например, подсвечивание, форматирование), который показывает уровень достоверности ниже порогового значения. Уникальный результат, формируемый применением правила форматирования данных к ячейке, является хорошим показателем того, что правило форматирования данных формирует точные результаты. Другие пороговые значения и/или правила могут использоваться, чтобы определить, формирует ли правило форматирования данных точные результаты.
Много типов правил форматирования данных могут создаваться, основываясь на пользовательских правках, например, сцеплении двух столбцов, извлечении информации из столбца (например, извлечении доменного имени верхнего уровня из адреса, извлечении адреса электронной почты) и тому подобном. Обычно, правило форматирования данных может вычисляться, основываясь на любой деятельности, связанной с редактированием. В некоторых случаях больше, чем два примера входных/выходных данных могут использоваться, чтобы сформировать точные результаты. Например, эвристика машинного обучения может быть только на 50% точной с двумя примерами и быть на 95% точной, при использовании трех примеров.
Правило форматирования данных может также быть получено на основе выбора в пределах пользовательского интерфейса (например, значка (иконки) 224), или какой-нибудь другой пункт меню может быть выбран. Примерные правки могут вручную выбираться пользователем (например, пользователь выбирает примерные ячейки) и/или примеры могут автоматически определяться диспетчером 26 форматирования. Например, диспетчер 26 форматирования может просматривать данные и определять примеры входных/выходных данных из данных (например, столбец с наименьшим количеством значений может рассматриваться как выходной столбец, а остальные столбцы могут рассматриваться как входные столбцы).
Фиг.3-6 показывают примеры ячеек, форматированных на основе на пользовательских правок.
Фиг.3 иллюстрирует определение правила форматирования данных на основании пользовательских правок в отношении столбца и применение правила форматирования данных к другим ячейкам в пределах столбца. Как изображено, пользователь осуществляет правки в отношении столбца «Полное имя» (С) электронной таблицы 310. В текущем примере пользователь ввел первые инициалы, за которыми следует точка и пробел, за которыми следует фамилия. Фамилия содержится в столбце А электронной таблицы 310, и первые инициалы содержатся в столбце В электронной таблицы. В ответ на осуществляемые пользователем правки в отношении ячеек С2 и С3, эвристикой машинного обучения формируется правило форматирования данных, которое может применяться к другим ячейкам в пределах документа.
В текущем примере примеры входных/выходных включают в себя текст в столбце С и текст в столбцах А и В для каждой строки, которая редактировалась. Входные данные могут определяться посредством сканирования документа, чтобы обнаружить данные, которые могут использоваться при применении правила форматирования данных, чтобы создать требуемый результат. В таком случае, правило форматирования данных создает правило, которое получает первые инициалы из столбца В и фамилию из столбца А, а также вставляет знак точки и знак пробела после первых инициалов. Выходной диапазон 312 обозначает ячейки, к которым применяется правило форматирования данных.
Обращаясь к электронной таблице 320, может быть видно, что автоматическое применение правила форматирования данных привело к заполнению ячейки С3:С6 именем, которое включает в себя первые инициалы, затем точку и пробел, за которыми следует фамилия. Ячейка С7 не была заполнена, так как применение правила форматирования данных не привело к точному результату, поскольку столбец с фамилией пустой.
Электронная таблица 320 также показывает элемент 322 пользовательского интерфейса, соответствующий ревизии, который может использоваться для принятия/отклонения изменения, произведенного применением правила форматирования данных. Элемент 324 пользовательского интерфейса, соответствующий коррекции ошибок, также размещается возле места, где правило форматирования данных не применялось (в этом случае отсутствуют данные из первого столбца) или где применение правила форматирования данных может не быть определено как точное (см. Фиг.6 и связанное с ней описание для более детального обсуждения относительно элемента пользовательского интерфейса, соответствующего ревизии, и элемента пользовательского интерфейса, соответствующего коррекции ошибок).
Фиг.4 показывает пример осуществляемых пользователем правок к пунктам в столбце номера социального страхования. Пользователь изменил форматирование номера социального страхования из формата “XXXXXXXXX” в “XXX-XX-XXXX” (где Х является любым числом, 0-9). В других примерах символы могут быть нечисловыми символами. Согласно варианту осуществления, после того, как пользователь осуществил две или более правок, диспетчером форматирования используются входные/выходные примеры для формирования правила форматирования данных, которое применяется к другим данным в столбце. В текущем примере примерами входных данных является исходный текст, который содержался в ячейках А2 и А3, а примерами выходных данных является редактируемый текст, показанный в ячейках А2 и А3. Больше или меньше правок может накопиться до момента предоставления примеров входных/выходных данных. Например, в некоторых случаях (таких как этот) одного примера входных/выходных данных может быть достаточно, чтобы сформировать точное правило форматирования данных. В более сложных сценариях может использоваться редактирования большего количества примеров входных/выходных данных. Далее, любые дополнительные правки, производимые пользователем, могут использоваться диспетчером форматирования для обновления правила форматирования данных. Применение правила форматирования данных к ячейкам А4:А7 приводит к электронной таблице, которая проиллюстрирована экранным изображением 420. Согласно варианту осуществления, ячейки, которые уже содержат данные, не изменяются автоматически. Взамен пользователь может получить запрос утвердительно принять предложенные изменения до того, как они будут выполнены в отношении ячеек, содержащих данные. Ячейки могут также изменяться автоматически, а пользователю может быть предоставлена возможность отменять изменения.
Фиг.5 показывает пример выполнения пользователем правок для изменения форматирования дат. Пользователь изменил форматирование двух дат в электронной таблице 510 с формата “MM/DD/CCYY” на “MM/DD/YY”.
В текущем примере пользователь изменил форматирование дат в ячейках А4 и А3. Входные примеры включают в себя исходный текст в ячейках А3 и А4, а выходные примеры включают в себя отредактированный текст, как показано в ячейках А3 и А4 на экранном изображении 520. Применение сформированного правила форматирования данных приводит к экранному изображению 520. Как показано, правки могут производиться где угодно в пределах аналогично форматированных данных, а применение правила форматирования данных может не только заполнять, как показано на Фиг.2-4, но также применяться к другим ячейкам (например, ячейка А2).
Фиг.6 показывает элементы пользовательского интерфейса, которые можно использовать, чтобы взаимодействовать с форматированием элементов. Как показано, электронная таблица 610 показывает элементы 612 и 618 пользовательского интерфейса, соответствующие ревизии, и элементы 614 и 616 пользовательского интерфейса, соответствующие коррекции ошибок.
Ячейка может быть отмечена элементом пользовательского интерфейса, соответствующим коррекции ошибок, когда ячейка отмечена как имеющая значение, которое несовместимо и/или не определено как точное. Согласно варианту осуществления, ячейка с несовместимыми данными означает, что либо значение ячейки не соответствует тому, что формирует правило форматирования данных, либо значение в пределах ячейки было сформировано правилом форматирования данных, но имеется более одного возможного результата. Как только правило форматирования данных было применено к определенному выходному диапазону, любые результаты, которые являются несовместимыми, помечаются. Согласно варианту осуществления, результат считается несовместимым, когда количество возможных результатов было более или менее одного результата (например, нет результатов или 2 или больше результатов, обеспеченных правилом форматирования данных) или предварительно существующее значение является несовместимым с результатом, обеспечиваемым правилом форматирования данных. Другая эвристика может также использоваться. Например, результат может считаться несовместимым, когда количество результатов превышает заранее определенное количество результатов и/или какое-либо другое условие.
Элемент пользовательского интерфейса, соответствующий коррекции ошибок, может быть выбран. При выборе, элемент пользовательского интерфейса, соответствующий коррекции ошибок, отображает различные выбираемые пункты (630). Согласно варианту осуществления, варианты выбора включают пункт «Следующий», пункт «Предыдущий», пункт «Помощь», пункт «Пропустить», пункт «Принять», пункт «Редактировать в ячейке», пункт «Параметры Проверка ошибок» и пункт «Возможные значения». Больше или меньше пунктов могут быть включены в меню 630. Пункт «Следующий» обеспечивает переход к следующей ячейке, которая отмечена как ошибочная. Пункт «Предыдущий» обеспечивает переход к предыдущей ошибке. Пункт «Помощь» представляет экран помощи. Пункт «Пропустить» пропускает текущую ошибку и убирает элемент пользовательского интерфейса, соответствующий коррекции ошибок, с отображения. Пункт «Принять» убирает состояние ошибки и добавляет ассоциированный пример входных/выходных данных для ячейки, чтобы сформировать новое правило форматирования данных. Пункт «Редактировать в ячейке» обеспечивает перевод пользователя в режим редактирования в ячейке. Когда пользователь редактирует одну или больше таких ошибочных ячеек, то правка интерпретируется как пример входных/выходных данных и вычисляется новое/обновленное правило форматирования данных. Согласно варианту осуществления, обновленное правило форматирования данных применяется к оставшимся ошибочным ячейкам, которые связаны с правилом форматирования данных. Пункт «Параметры Проверка ошибок» предоставляет пользователю различные опции, относящиеся к обнаружению ошибок. Пункт «Возможные значения» при выборе отображает перечень других возможных значений для ячейки при ее переформатировании. Например, может отображаться каждый результат, который формируется посредством правила форматирования данных.
Элемент 612 пользовательского интерфейса, соответствующий ревизии, представляет различные пункты для взаимодействия с ячейками, которые были отформатированы с использованием правила форматирования данных. Согласно варианту осуществления, меню 620 ревизии содержит пункт «Отмена», пункт «Повтор», пункт «Стоп», пункт «Пересмотр», пункт «Пропустить все», пункт «Сохранение» и пункт «Другое». Больше или меньше пунктов может быть включено в меню 620. Операция отмены возвращает документ (например, столбец документа, к которому было применено правило форматирования данных) в состояние, в котором он был непосредственно до применения к ячейкам правила форматирования данных. Пункт «Повтор» восстанавливает данные в ячейках, которые ранее были отменены пользователем. Пункт «Стоп» деактивирует автоматический режим автоматического заполнения при применении правила форматирования данных. Пункт «Пересмотр» назначает активную ячейку в качестве первой ячейки в текущем диапазоне преобразования (например, выходном диапазоне) с пометкой ошибки. Пункт «Пропустить все» убирает пометки ошибок и любое соответствующее форматирование ошибок из ячеек в текущем заполняемом ряду. Пункт «Сохранить» позволяет пользователю сохранить текущее правило форматирования данных. Пункт «Сохранить» сохраняет информацию, связанную с правилом, такую как столбец(ы), который можно ввести, а также любые примеры входных/выходных данных. Пункт «Другое» предоставляет другие опции.
Фиг.7 показывает пользовательский интерфейс для разрешения/запрещения заполнения по образцу. Экранное изображение 700 включает в себя пункт 702, который позволяет пользователю включать/отключать автоматическое заполнение данных по образцу. Другие пункты могут также быть включены в состав пользовательского интерфейса, такие как требуемое количество правок/выборов перед получением правила форматирования данных, следует ли перезаписывать существующие данные с/без подтверждения, и тому подобное.
Далее, со ссылкой на Фиг.8 будет описана иллюстративная последовательность операций форматирования данных по образцу. При чтении описания процедур, представляемых здесь, следует понимать, что логические операции различных вариантов осуществления реализуются (1) как последовательность выполняемых компьютером действий или программных модулей, исполняемых в вычислительной системе, и/или (2) как взаимосвязанные схемы машинной логики или схемные модули внутри вычислительной системы. Реализация является вопросом выбора, зависящим от эксплуатационных требований, налагаемых на вычислительную систему, реализующую изобретение. Соответственно, логические операции, иллюстрирующие и составляющие варианты осуществления, описанные здесь, упоминаются по-разному, как операции, структурные устройства, действия или модули. Эти операции, структурные устройства, действия и модули могут быть реализованы в виде программного обеспечения, встроенного программного обеспечения (Firmware), специализированной цифровой логики, и любых их комбинаций.
После стартового блока процесс 800 переходит к операции 810, где обнаруживаются правки, произведенные с данными внутри документа. Правками могут быть любые правки в документе. Согласно варианту осуществления, правки есть в отношении данных, которые содержатся в пределах ячеек документа (то есть электронной таблицы, таблицы, списка), которые относятся к одному и тому же типу данных и аналогично отформатированы. Обычно, каждая ячейка в пределах колонки может содержать одинаковый тип данных (то есть даты, адреса, имена, номера и подобное). Правки, которые применяются к каждому из элементов, соответствуют шаблону, который может применяться к другим ячейкам, имеющим тот же самый тип элемента.
Перейдя к операции 820 принятия решения, производится определение того, превысило ли количество правок заранее определенное количество правок и инициирован ли процесс получения правила форматирования данных, которое должно применяться к другим аналогично форматированным ячейкам. Согласно варианту осуществления, количество правок для инициирования получения правила форматирования данных составляет два. Точка инициирования может быть установлена в другие значения вручную/автоматически. Например, точка инициирования может основываться на предполагаемой точности применения правила форматирования данных к другим аналогичным элементам данных в пределах документа. В некоторых случаях точка инициирования может быть одна, тогда как в других их может быть три или более.
Когда точка инициирования не была достигнута, процесс возвращается к операции 810, чтобы выявить, когда сделаны последующие правки.
Когда точка инициирования была достигнута, процесс перетекает к операции 830, где примеры входных/выходных данных получаются и подаются в эвристику машинного обучения, чтобы получить правило форматирования данных. Примеры входных/выходных данных обеспечивают примеры данных в состоянии до и состоянии после относительно правок данных. Например, когда есть правки к существующим данным, тогда примерами входных данных являются данные до правки, а примерами выходных данных являются данные после правки. Когда есть правки в отношении новой ячейки, примерами выходных данных являются отредактированные данные в ячейке, а примерами входных данных являются данные, связанные с созданием выходных (например, один или более столбцов данных).
Переходя к операции 840, получают правило форматирования данных. Согласно варианту осуществления, правило форматирования данных является функцией, которая получает текстовый ввод (например, из одной или более ячеек) и производит ноль или более результатов. Правило форматирования данных ориентировано на форматирование других аналогичных элементов в пределах документа (например, других ячеек в пределах столбца), чтобы они соответствовали правкам, сделанным пользователем.
При переходе к операции 850 определяется выходной диапазон. Выходной диапазон определяет элементы, к которым правило форматирования данных должно применяться. Например, другими элементами могут быть все или часть ячеек в столбце, в котором элементы редактировались пользователем и являются основанием для правила форматирования данных. В некоторых примерах выходным диапазоном являются ячейки в пределах столбца, которые имеют тот же тип элемента (например, дата, номер, адрес и тому подобное). В других примерах выходным диапазоном являются все ячейки со значениями, которые являются смежными относительно друг друга, и которые являются смежными с редактируемыми ячейками.
Перейдя к операции 860, правило форматирования данных применяется к каждому из элементов в определенном выходном диапазоне. Любые результаты, производимые посредством применения правила форматирования данных, могут временно сохраняться, прежде чем осуществлять какие-либо изменения в документе.
При перемещении к операции 870 принятия решения, производится определение относительно того, привело ли применение правила форматирования данных к точным результатам. Согласно варианту осуществления, точность оценивается количеством результатов, возвращаемых правилом форматирования данных, когда оно применяется к элементу. Когда количество результатов для элемента равно нулю, правило форматирования данных не имеет достаточно данных, чтобы формировать результат. Когда количество результатов больше одного, точность результатов может быть сомнительной. Когда количество результатов есть единица, тогда результат, вероятнее всего, точный. Количество/процентная доля ячеек, оцененных как имеющие точный результат, может использоваться для определения того, когда превышается предельный уровень достоверности (например, >70%, 80%, 90%). Когда уровень достоверности не превышен, процесс перетекает к операции 810, чтобы выявить больше правок. Обычно, чем больше примеров получается, тем точнее результаты. Когда уровень достоверности превышен, процесс перетекает к операции 880.
При операции 880 документ обновляется результатами, созданными посредством применения правила форматирования данных к каждому из элементов. Например, ячейки, имеющие один результат, обновляются этим результатом. Ячейки, имеющие разное количество результатов, могут маркироваться индикатором ошибки, как обсуждалось ранее. Может также отображаться элемент пользовательского интерфейса, соответствующий ревизии, что позволяет пользователю выполнять различные операции, связанные с применением правила форматирования данных.
Затем процесс следует к блоку окончания и возвращается для обработки других действий.
Вышеприведенные изложение, примеры и сведения представляют полное описание производства и использования состава изобретения. Так как многие варианты осуществления могут осуществляться без отступления от существа и объема изобретения, изобретение заключается в прилагаемой формуле изобретения.
Claims (20)
1. Способ форматирования данных на основе примеров, содержащий этапы, на которых:
определяют, когда правки произведены в отношении множества элементов в пределах документа электронной таблицы, причем каждые из этого множества элементов являются связанными;
автоматически создают правило форматирования данных на основе примеров входных данных, которые относятся к разным столбцам документа электронной таблицы, и примеров выходных данных в одном и том же столбце документа электронной таблицы, причем примеры входных данных и примеры выходных данных ассоциированы с упомянутыми правками;
автоматически применяют правило форматирования данных к другим элементам в пределах документа электронной таблицы, которые относятся к одному и тому же типу данных; при этом правило форматирования данных стремится форматировать эти другие элементы в формат, как определено примерами входных данных и примерами выходных данных, причем упомянутые другие элементы отличаются от упомянутого множества элементов; и
отображают упомянутые другие элементы, отражая применение правила форматирования данных.
определяют, когда правки произведены в отношении множества элементов в пределах документа электронной таблицы, причем каждые из этого множества элементов являются связанными;
автоматически создают правило форматирования данных на основе примеров входных данных, которые относятся к разным столбцам документа электронной таблицы, и примеров выходных данных в одном и том же столбце документа электронной таблицы, причем примеры входных данных и примеры выходных данных ассоциированы с упомянутыми правками;
автоматически применяют правило форматирования данных к другим элементам в пределах документа электронной таблицы, которые относятся к одному и тому же типу данных; при этом правило форматирования данных стремится форматировать эти другие элементы в формат, как определено примерами входных данных и примерами выходных данных, причем упомянутые другие элементы отличаются от упомянутого множества элементов; и
отображают упомянутые другие элементы, отражая применение правила форматирования данных.
2. Способ по п. 1, в котором при упомянутом автоматическом создании правила форматирования данных на основе примеров входных данных и примеров выходных данных подают информацию, относящуюся к каждому из примеров, в эвристику машинного обучения, которая создает правило форматирования данных.
3. Способ по п. 1, в котором правки производятся в отношении разных ячеек в пределах одного и того же столбца электронной таблицы.
4. Способ по п. 1, дополнительно содержащий этап, на котором отображают графический пользовательский интерфейс рядом с по меньшей мере одним из упомянутых других элементов, форматированных согласно правилу форматирования данных, который, будучи выбранным, предоставляет опции для выполнения операций, относящихся к форматированному элементу.
5. Способ по п. 4, в котором отображение графического пользовательского интерфейса содержит отображение меню, содержащего опции для отмены форматирования, повторения форматирования, останова форматирования, просмотра потенциально возможных ошибок и игнорирования ошибок.
6. Способ по п. 1, дополнительно содержащий этап, на котором отображают индикатор с форматированным элементом, когда уровень достоверности находится ниже заранее определенного порогового значения.
7. Способ по п. 1, в котором при упомянутом применении правила форматирования данных к другим элементам данных применяют правило форматирования данных к другим элементам в пределах по меньшей мере одного из одного и того же столбца и одной и той же строки.
8. Способ по п. 1, в котором при упомянутом определении того, когда правки произведены в отношении элементов одного и того же типа данных, определяют, когда правки произведены в отношении первого столбца, который включает в себя данные, которые также включены во второй столбец и третий столбец.
9. Способ по п. 1, дополнительно содержащий этап, на котором отображают элемент пользовательского интерфейса, который позволяет сохранить правило форматирования данных для последующего использования.
10. Машиночитаемый носитель данных, на котором сохранены машиноисполняемые команды для форматирования данных на основе примеров, содержащие:
определение примеров выходных данных по множеству элементов в пределах одного и того же столбца документа электронной таблицы;
автоматическое создание правила форматирования данных на основе примеров входных данных, которые относятся к разным столбцам документа электронной таблицы, и упомянутых примеров выходных данных в пределах одного и того же столбца документа электронной таблицы;
автоматическое применение правила форматирования данных к другим элементам в пределах упомянутого одного и того же столбца документа электронной таблицы; при этом правило форматирования данных стремится форматировать эти другие элементы в формат, как определено примерами входных данных и примерами выходных данных, причем упомянутые другие элементы отличаются от упомянутого множества элементов; и
отображение упомянутых других элементов, отражая применение правила форматирования данных.
определение примеров выходных данных по множеству элементов в пределах одного и того же столбца документа электронной таблицы;
автоматическое создание правила форматирования данных на основе примеров входных данных, которые относятся к разным столбцам документа электронной таблицы, и упомянутых примеров выходных данных в пределах одного и того же столбца документа электронной таблицы;
автоматическое применение правила форматирования данных к другим элементам в пределах упомянутого одного и того же столбца документа электронной таблицы; при этом правило форматирования данных стремится форматировать эти другие элементы в формат, как определено примерами входных данных и примерами выходных данных, причем упомянутые другие элементы отличаются от упомянутого множества элементов; и
отображение упомянутых других элементов, отражая применение правила форматирования данных.
11. Машиночитаемый носитель данных по п. 10, при этом упомянутое автоматическое создание правила форматирования данных на основе примеров входных данных и примеров выходных данных содержит подачу информации, относящейся к каждому из примеров, в эвристику машинного обучения, которая создает правило форматирования данных на основе примеров.
12. Машиночитаемый носитель данных по п. 10, в котором машиноисполняемые команды дополнительно содержат отображение графического пользовательского интерфейса рядом с по меньшей мере одним из упомянутых других элементов, форматированных согласно правилу форматирования данных, который, будучи выбранным, предоставляет опции для просмотра изменений форматирования.
13. Машиночитаемый носитель данных по п. 10, в котором машиноисполняемые команды дополнительно содержат отображение элемента пользовательского интерфейса в упомянутом одном и том же столбце, когда уровень достоверности находится ниже заранее определенного порогового значения.
14. Машиночитаемый носитель данных по п. 10, при этом упомянутое определение примеров выходных данных содержит анализ первого столбца, который включает в себя данные, которые также включены во второй столбец и третий столбец.
15. Машиночитаемый носитель данных по п. 10, в котором машиноисполняемые команды дополнительно содержат отображение элемента пользовательского интерфейса, который позволяет сохранить правило форматирования данных для последующего использования.
16. Система для форматирования данных на основе примеров, содержащая:
сетевое соединение, которое сконфигурировано для соединения с сетью;
процессор, память и машиночитаемый носитель данных;
операционную среду, хранимую на машиночитаемом носителе данных и исполняющуюся на процессоре;
устройство отображения;
приложение электронной таблицы;
электронную таблицу; при этом электронная таблица содержит элементы, скомпонованные в строках и столбцах; и
диспетчер форматирования, работающий вместе с приложением электронной таблицы, который выполнен с возможностью осуществлять действия, содержащие:
определение того, когда правки произведены в отношении множества элементов в пределах одного и того же столбца электронной таблицы;
автоматическое создание правила форматирования данных, при этом правило форматирования данных основывается на примерах входных данных, которые относятся к разным столбцам электронной таблицы, и примерах выходных данных в пределах одного и того же столбца электронной таблицы, причем примеры входных данных и примеры выходных данных ассоциированы с упомянутыми правками;
автоматическое применение правила форматирования данных к другим элементам в пределах упомянутого одного и того же столбца электронной таблицы; при этом правило форматирования данных стремится форматировать эти другие элементы в формат, как определено примерами входных данных и примерами выходных данных, причем упомянутые другие элементы отличаются от упомянутого множества элементов; и
отображение упомянутых элементов на устройстве отображения, отражая применение правила форматирования данных.
сетевое соединение, которое сконфигурировано для соединения с сетью;
процессор, память и машиночитаемый носитель данных;
операционную среду, хранимую на машиночитаемом носителе данных и исполняющуюся на процессоре;
устройство отображения;
приложение электронной таблицы;
электронную таблицу; при этом электронная таблица содержит элементы, скомпонованные в строках и столбцах; и
диспетчер форматирования, работающий вместе с приложением электронной таблицы, который выполнен с возможностью осуществлять действия, содержащие:
определение того, когда правки произведены в отношении множества элементов в пределах одного и того же столбца электронной таблицы;
автоматическое создание правила форматирования данных, при этом правило форматирования данных основывается на примерах входных данных, которые относятся к разным столбцам электронной таблицы, и примерах выходных данных в пределах одного и того же столбца электронной таблицы, причем примеры входных данных и примеры выходных данных ассоциированы с упомянутыми правками;
автоматическое применение правила форматирования данных к другим элементам в пределах упомянутого одного и того же столбца электронной таблицы; при этом правило форматирования данных стремится форматировать эти другие элементы в формат, как определено примерами входных данных и примерами выходных данных, причем упомянутые другие элементы отличаются от упомянутого множества элементов; и
отображение упомянутых элементов на устройстве отображения, отражая применение правила форматирования данных.
17. Система по п. 16, в которой упомянутые действия дополнительно содержат отображение графического пользовательского интерфейса рядом с по меньшей мере одним из элементов, форматированных согласно правилу форматирования данных, который, будучи выбранным, предоставляет опции для просмотра изменений форматирования.
18. Система по п. 16, в которой упомянутые действия дополнительно содержат отображение элемента пользовательского интерфейса в упомянутом одном и том же столбце, когда уровень достоверности находится ниже заранее определенного порогового значения.
19. Система по п. 16, в которой упомянутое определение того, когда правки произведены в отношении множества элементов одного и того же типа данных, содержит определение того, когда правки произведены в отношении первого столбца, который включает в себя данные, которые также включены во второй столбец и третий столбец.
20. Система по п. 16, в которой упомянутые действия дополнительно содержат отображение элемента пользовательского интерфейса, который позволяет сохранить правило форматирования данных для последующего использования.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US13/014,520 US10409892B2 (en) | 2011-01-26 | 2011-01-26 | Formatting data by example |
US13/014,520 | 2011-01-26 | ||
PCT/US2012/022454 WO2012103159A2 (en) | 2011-01-26 | 2012-01-24 | Formatting data by example |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2013135003A RU2013135003A (ru) | 2015-01-27 |
RU2602786C2 true RU2602786C2 (ru) | 2016-11-20 |
Family
ID=46526787
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2013135003/08A RU2602786C2 (ru) | 2011-01-26 | 2012-01-24 | Форматирование данных по образцу |
Country Status (20)
Country | Link |
---|---|
US (1) | US10409892B2 (ru) |
EP (1) | EP2668594B1 (ru) |
JP (1) | JP6033235B2 (ru) |
KR (1) | KR101999409B1 (ru) |
CN (1) | CN102609403B (ru) |
AR (1) | AR085036A1 (ru) |
AU (1) | AU2012209157B2 (ru) |
BR (1) | BR112013018693A2 (ru) |
CA (1) | CA2824922C (ru) |
CL (1) | CL2013002093A1 (ru) |
CO (1) | CO6731131A2 (ru) |
HK (1) | HK1173816A1 (ru) |
IL (1) | IL227218A (ru) |
MX (1) | MX346269B (ru) |
MY (1) | MY165937A (ru) |
RU (1) | RU2602786C2 (ru) |
SG (2) | SG10201510611UA (ru) |
TW (1) | TWI582616B (ru) |
WO (1) | WO2012103159A2 (ru) |
ZA (1) | ZA201304847B (ru) |
Families Citing this family (55)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9213682B1 (en) * | 2011-03-31 | 2015-12-15 | Bank Of America Corporation | Method and apparatus for auditing a business document |
US20140046923A1 (en) | 2012-08-10 | 2014-02-13 | Microsoft Corporation | Generating queries based upon data points in a spreadsheet application |
US11361246B2 (en) * | 2012-08-31 | 2022-06-14 | DataRobot, Inc. | Methods for automating aspects of machine learning, and related systems and apparatus |
US9495641B2 (en) | 2012-08-31 | 2016-11-15 | Nutomian, Inc. | Systems and method for data set submission, searching, and retrieval |
US9524473B2 (en) | 2012-08-31 | 2016-12-20 | Nutonian, Inc. | System and method for auto-query generation |
US9002758B2 (en) * | 2012-10-17 | 2015-04-07 | Microsoft Technology Licensing, Llc | Ranking for inductive synthesis of string transformations |
US10140269B2 (en) * | 2013-03-12 | 2018-11-27 | Microsoft Technology Licensing, Llc | Viewing effects of proposed change in document before committing change |
CN104239283A (zh) * | 2013-06-13 | 2014-12-24 | 富泰华工业(深圳)有限公司 | 文字编辑系统及方法 |
US10229101B2 (en) | 2013-06-14 | 2019-03-12 | Microsoft Technology Licensing, Llc | Smart fill |
US10019432B2 (en) | 2013-06-15 | 2018-07-10 | Microsoft Technology Licensing, Llc | Conversion of data ranges to table objects |
US10366346B2 (en) | 2014-05-23 | 2019-07-30 | DataRobot, Inc. | Systems and techniques for determining the predictive value of a feature |
US10496927B2 (en) | 2014-05-23 | 2019-12-03 | DataRobot, Inc. | Systems for time-series predictive data analytics, and related methods and apparatus |
US10558924B2 (en) | 2014-05-23 | 2020-02-11 | DataRobot, Inc. | Systems for second-order predictive data analytics, and related methods and apparatus |
GB2541625A (en) | 2014-05-23 | 2017-02-22 | Datarobot | Systems and techniques for predictive data analytics |
US10824799B2 (en) | 2014-06-30 | 2020-11-03 | Microsoft Technology Licensing, Llc | Summary data autofill |
US10191895B2 (en) * | 2014-11-03 | 2019-01-29 | Adobe Systems Incorporated | Adaptive modification of content presented in electronic forms |
US10685173B2 (en) | 2015-08-17 | 2020-06-16 | International Business Machines Corporation | Formatting tables with complex patterns |
US20170139893A1 (en) * | 2015-11-12 | 2017-05-18 | SmartSheet.com, Inc. | Automatically adjusting spreadsheet formulas and/or formatting |
EP3398080A4 (en) * | 2015-12-29 | 2019-07-31 | Microsoft Technology Licensing, LLC | FORMATTING DOCUMENT OBJECTS BY VISUAL SUGGESTIONS |
US9864732B2 (en) * | 2016-05-02 | 2018-01-09 | Google Inc. | User interfaces that facilitate management of formatting of digital content |
US10621195B2 (en) * | 2016-09-20 | 2020-04-14 | Microsoft Technology Licensing, Llc | Facilitating data transformations |
US10706066B2 (en) | 2016-10-17 | 2020-07-07 | Microsoft Technology Licensing, Llc | Extensible data transformations |
US11892987B2 (en) | 2016-10-20 | 2024-02-06 | Microsoft Technology Licensing, Llc | Automatic splitting of a column into multiple columns |
US11256710B2 (en) | 2016-10-20 | 2022-02-22 | Microsoft Technology Licensing, Llc | String transformation sub-program suggestion |
US11620304B2 (en) * | 2016-10-20 | 2023-04-04 | Microsoft Technology Licensing, Llc | Example management for string transformation |
US10776380B2 (en) | 2016-10-21 | 2020-09-15 | Microsoft Technology Licensing, Llc | Efficient transformation program generation |
US10846298B2 (en) | 2016-10-28 | 2020-11-24 | Microsoft Technology Licensing, Llc | Record profiling for dataset sampling |
US11170020B2 (en) | 2016-11-04 | 2021-11-09 | Microsoft Technology Licensing, Llc | Collecting and annotating transformation tools for use in generating transformation programs |
US11163788B2 (en) | 2016-11-04 | 2021-11-02 | Microsoft Technology Licensing, Llc | Generating and ranking transformation programs |
US20180143957A1 (en) * | 2016-11-18 | 2018-05-24 | Business Objects Software Limited | Using format patterns for numeric formatting |
US10387900B2 (en) | 2017-04-17 | 2019-08-20 | DataRobot, Inc. | Methods and apparatus for self-adaptive time series forecasting engine |
US11182548B2 (en) * | 2017-07-10 | 2021-11-23 | Adaptam Inc. | Methods and systems for providing selective multi-way replication and atomization of cell blocks and other elements in spreadsheets and presentations |
US11080462B2 (en) * | 2017-11-13 | 2021-08-03 | Workshare Ltd. | Method of comparing two data tables and displaying the results without source formatting |
US10241992B1 (en) * | 2018-04-27 | 2019-03-26 | Open Text Sa Ulc | Table item information extraction with continuous machine learning through local and global models |
US10977433B2 (en) * | 2018-10-09 | 2021-04-13 | Oracle International Corporation | System and method for input data validation and conversion |
US20200160303A1 (en) * | 2018-11-19 | 2020-05-21 | Rylti, LLC | Method and system for audit, verification, and settlement of royalty and license fees in the music industry |
JPWO2020213288A1 (ru) * | 2019-04-17 | 2020-10-22 | ||
JP2021026567A (ja) * | 2019-08-06 | 2021-02-22 | 株式会社三菱Ufj銀行 | フォーマット変換装置及びプログラム |
WO2021051046A1 (en) | 2019-09-14 | 2021-03-18 | Bytedance Inc. | Quantization parameter for chroma deblocking filtering |
WO2021072177A1 (en) | 2019-10-09 | 2021-04-15 | Bytedance Inc. | Cross-component adaptive loop filtering in video coding |
CN114586370B (zh) * | 2019-10-14 | 2024-01-23 | 字节跳动有限公司 | 在视频编解码中使用色度量化参数的方法、装置及介质 |
EP4055827A4 (en) | 2019-12-09 | 2023-01-18 | ByteDance Inc. | USING QUANTIFICATION GROUPS IN VIDEO CODING |
CN114902657A (zh) | 2019-12-31 | 2022-08-12 | 字节跳动有限公司 | 视频编解码中的自适应颜色变换 |
US11074048B1 (en) | 2020-04-28 | 2021-07-27 | Microsoft Technology Licensing, Llc | Autosynthesized sublanguage snippet presentation |
US11327728B2 (en) | 2020-05-07 | 2022-05-10 | Microsoft Technology Licensing, Llc | Source code text replacement by example |
CN112784560A (zh) * | 2020-05-26 | 2021-05-11 | 珠海金山办公软件有限公司 | 一种数据显示方法及装置 |
US11481195B2 (en) | 2020-06-09 | 2022-10-25 | Google Llc | Synthesizing programs in a spreadsheet programming language |
US11657217B2 (en) | 2020-06-26 | 2023-05-23 | Adaptam Inc. | Methods and systems for presenting drop-down, pop-up or other presentation of a multi-value data set in a spreadsheet cell |
US11900080B2 (en) | 2020-07-09 | 2024-02-13 | Microsoft Technology Licensing, Llc | Software development autocreated suggestion provenance |
CN112908392B (zh) * | 2021-02-09 | 2023-09-15 | 东芯半导体股份有限公司 | 控制非易失性存储器参数的控制方法 |
US11875136B2 (en) | 2021-04-01 | 2024-01-16 | Microsoft Technology Licensing, Llc | Edit automation using a temporal edit pattern |
US11941372B2 (en) | 2021-04-01 | 2024-03-26 | Microsoft Technology Licensing, Llc | Edit automation using an anchor target list |
US11977835B2 (en) | 2021-05-24 | 2024-05-07 | Adaptam Inc. | Method and system for spreadsheet error identification and avoidance |
US11663399B1 (en) | 2022-08-29 | 2023-05-30 | Bank Of America Corporation | Platform for generating published reports with position mapping identification and template carryover reporting |
US11900054B1 (en) | 2022-08-29 | 2024-02-13 | Bank Of America Corporation | Platform for generating published reports using report and worksheet building with position mapping identification |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US2439683A (en) * | 1946-09-14 | 1948-04-13 | Ernest N Broderick | Sanitary receptacle and supporter |
US6697999B1 (en) * | 1999-10-20 | 2004-02-24 | Sun Microsystems, Inc. | Computer-based automatic document formatting method |
US7222294B2 (en) * | 1998-12-31 | 2007-05-22 | Microsoft Corporation | Extension of formulas and formatting in an electronic spreadsheet |
Family Cites Families (68)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5231577A (en) * | 1990-04-06 | 1993-07-27 | Microsoft Corporation | Method and system for processing formatting information in a spreadsheet |
US5701499A (en) | 1992-03-25 | 1997-12-23 | Microsoft Corporation | Method and system for automatically entering a data series into contiguous cells of an electronic spreadsheet program or the like |
US5613131A (en) * | 1993-01-29 | 1997-03-18 | Microsoft Corporation | Auto-formatting of tables in a spreadsheet program |
US5621875A (en) * | 1993-10-26 | 1997-04-15 | Microsoft Corp. | Method and system for automatic formatting of user selected text |
US5598519A (en) * | 1994-11-08 | 1997-01-28 | Microsoft Corporation | Method and system for direct cell formatting in a spreadsheet |
US5778402A (en) * | 1995-06-07 | 1998-07-07 | Microsoft Corporation | Method and system for auto-formatting a document using an event-based rule engine to format a document as the user types |
US5805158A (en) | 1996-08-22 | 1998-09-08 | International Business Machines Corporation | Copying predicted input between computer systems |
US6038567A (en) * | 1998-02-19 | 2000-03-14 | Microsoft Corporation | Method and system for propagating object properties in a desktop publishing program |
US6731309B1 (en) | 1998-08-28 | 2004-05-04 | Corel Corporation | Real time preview |
US7069508B1 (en) * | 2000-07-13 | 2006-06-27 | Language Technologies, Inc. | System and method for formatting text according to linguistic, visual and psychological variables |
TW498221B (en) | 1999-08-20 | 2002-08-11 | Ibm | Method and system in an electronic spreadsheet for introducing new elements in a cell named range according to different modes |
JP4091726B2 (ja) | 2000-02-23 | 2008-05-28 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 構造化文書の表示規則の生成方法、システムおよびプログラムが記録された媒体ならびに構造化文書およびその文書型定義の変更方法、システムおよびプログラムが記録された媒体 |
US6981028B1 (en) | 2000-04-28 | 2005-12-27 | Obongo, Inc. | Method and system of implementing recorded data for automating internet interactions |
EP1202206A3 (en) * | 2000-10-24 | 2004-01-21 | International Business Machines Corporation | Method and system in an electronic spreadsheet for persistently self-replicating multiple ranges of cells through a copy-paste operation |
TW518509B (en) | 2000-11-28 | 2003-01-21 | Ibm | Method and system in an electronic spreadsheet for persistently filling by samples a range of cells |
US20020156816A1 (en) | 2001-02-13 | 2002-10-24 | Mark Kantrowitz | Method and apparatus for learning from user self-corrections, revisions and modifications |
US6968504B2 (en) * | 2001-06-29 | 2005-11-22 | Microsoft Corporation | Automated document formatting tool |
US7089298B2 (en) | 2001-08-20 | 2006-08-08 | Nokia Corporation | Naming distribution method for ad hoc networks |
US7343551B1 (en) | 2002-11-27 | 2008-03-11 | Adobe Systems Incorporated | Autocompleting form fields based on previously entered values |
US7305129B2 (en) | 2003-01-29 | 2007-12-04 | Microsoft Corporation | Methods and apparatus for populating electronic forms from scanned documents |
US7426496B2 (en) | 2004-03-03 | 2008-09-16 | Microsoft Corporation | Assisted form filling |
US7350187B1 (en) | 2003-04-30 | 2008-03-25 | Google Inc. | System and methods for automatically creating lists |
US7660779B2 (en) | 2004-05-12 | 2010-02-09 | Microsoft Corporation | Intelligent autofill |
US7584422B2 (en) | 2004-07-12 | 2009-09-01 | Informatica Corporation | System and method for data format transformation |
US7707486B2 (en) | 2004-08-06 | 2010-04-27 | The Board Of Trustees Of The Leland Stanford Junior University | Logical spreadsheets |
US7933862B2 (en) | 2004-09-27 | 2011-04-26 | Microsoft Corporation | One click conditional formatting method and system for software programs |
US8745483B2 (en) | 2004-10-07 | 2014-06-03 | International Business Machines Corporation | Methods, systems and computer program products for facilitating visualization of interrelationships in a spreadsheet |
US7451397B2 (en) | 2004-12-15 | 2008-11-11 | Microsoft Corporation | System and method for automatically completing spreadsheet formulas |
US8621340B2 (en) * | 2004-12-20 | 2013-12-31 | Microsoft Corporation | Block properties and calculated columns in a spreadsheet application |
KR20070024771A (ko) | 2005-08-30 | 2007-03-08 | 엔에이치엔(주) | 질의어 자동변환을 이용한 자동완성 질의어 제공 시스템 및방법 |
US7792814B2 (en) | 2005-09-30 | 2010-09-07 | Sap, Ag | Apparatus and method for parsing unstructured data |
US7627812B2 (en) * | 2005-10-27 | 2009-12-01 | Microsoft Corporation | Variable formatting of cells |
US7640158B2 (en) | 2005-11-08 | 2009-12-29 | Multimodal Technologies, Inc. | Automatic detection and application of editing patterns in draft documents |
US7590608B2 (en) | 2005-12-02 | 2009-09-15 | Microsoft Corporation | Electronic mail data cleaning |
US7634717B2 (en) | 2006-01-23 | 2009-12-15 | Microsoft Corporation | Multiple conditional formatting |
US7770100B2 (en) | 2006-02-27 | 2010-08-03 | Microsoft Corporation | Dynamic thresholds for conditional formats |
US7689904B2 (en) | 2006-03-06 | 2010-03-30 | Sap Ag | Template-based creation of electronic document |
US20070220415A1 (en) | 2006-03-16 | 2007-09-20 | Morgan Mao Cheng | Excel spreadsheet parsing to share cells, formulas, tables or entire spreadsheets across an enterprise with other users |
US10345922B2 (en) | 2006-04-21 | 2019-07-09 | International Business Machines Corporation | Office system prediction configuration sharing |
US8600916B2 (en) | 2006-04-21 | 2013-12-03 | International Business Machines Corporation | Office system content prediction based on regular expression pattern analysis |
US8005806B2 (en) | 2006-11-15 | 2011-08-23 | Yahoo! Inc. | System and method for information retrieval using context information |
CN101105814A (zh) | 2007-09-11 | 2008-01-16 | 金蝶软件(中国)有限公司 | 一种将Script语言转换成SQL语言的方法及装置 |
US20090089653A1 (en) | 2007-09-28 | 2009-04-02 | Microsoft Corporation | Auto-generation and syndication of tables as forms |
US8640024B2 (en) * | 2007-10-30 | 2014-01-28 | Adobe Systems Incorporated | Visually distinct text formatting |
CN101158900B (zh) | 2007-11-19 | 2010-09-08 | 北京大学 | 一种基于模板系列的报表生成系统及方法 |
US20090228776A1 (en) | 2008-03-05 | 2009-09-10 | Microsoft Corporation | Dynamic formulas for spreadsheet cells |
US20090319542A1 (en) | 2008-06-19 | 2009-12-24 | Pierre Jean Le Brazidec | Systems and methods to automatically replace content in a range of spreadsheet cells with information from a database |
US9032283B2 (en) * | 2008-09-29 | 2015-05-12 | Apple Inc. | Rendering common cell formatting for adjacent cells |
US8255789B2 (en) * | 2008-09-30 | 2012-08-28 | Apple Inc. | Providing spreadsheet features |
US8150814B2 (en) | 2009-04-07 | 2012-04-03 | Business Objects Software Ltd. | System and method of data cleansing using rule based formatting |
US20100325173A1 (en) | 2009-06-23 | 2010-12-23 | The Board Of Regents Of The The University Of Texas System | Rapid development of informatics systems for collaborative data management |
US8386406B2 (en) | 2009-07-08 | 2013-02-26 | Ebay Inc. | Systems and methods for making contextual recommendations |
US20110066933A1 (en) | 2009-09-02 | 2011-03-17 | Ludwig Lester F | Value-driven visualization primitives for spreadsheets, tabular data, and advanced spreadsheet visualization |
CN101661512B (zh) | 2009-09-25 | 2012-01-11 | 万斌 | 一种识别传统表单信息并创建对应Web表单的系统及方法 |
US8140533B1 (en) | 2010-01-26 | 2012-03-20 | Google Inc. | Harvesting relational tables from lists on the web |
US9489366B2 (en) | 2010-02-19 | 2016-11-08 | Microsoft Technology Licensing, Llc | Interactive synchronization of web data and spreadsheets |
US20120003619A1 (en) | 2010-06-23 | 2012-01-05 | Canadian National Railway Company | Method and system for assigning jobs to prevent employee qualifications from lapsing |
US8510373B2 (en) | 2010-08-30 | 2013-08-13 | Sap Ag | Data synchronization and disablement of dependent data fields |
EP2506155A1 (en) | 2011-03-30 | 2012-10-03 | Siemens Aktiengesellschaft | Auto-fill functionality within engineering software for automation systems |
US8645825B1 (en) | 2011-08-31 | 2014-02-04 | Google Inc. | Providing autocomplete suggestions |
US20130124957A1 (en) | 2011-11-11 | 2013-05-16 | Microsoft Corporation | Structured modeling of data in a spreadsheet |
US8799760B2 (en) | 2011-12-08 | 2014-08-05 | Xerox Corporation | Smart macros using zone selection information and pattern discovery |
US20130191714A1 (en) | 2012-01-25 | 2013-07-25 | Microsoft Corporation | Fill by example animation and visuals |
CA2793667A1 (en) | 2012-02-24 | 2013-08-24 | Research In Motion Limited | Retrieval and presentation of contact data at an electronic device |
US8819574B2 (en) | 2012-10-22 | 2014-08-26 | Google Inc. | Space prediction for text input |
US9244977B2 (en) | 2012-12-31 | 2016-01-26 | Google Inc. | Using content identification as context for search |
US10229101B2 (en) | 2013-06-14 | 2019-03-12 | Microsoft Technology Licensing, Llc | Smart fill |
US9652446B2 (en) * | 2014-08-22 | 2017-05-16 | Smartsheet Inc. | Automatically adjusting spreadsheet formulas and/or formatting |
-
2011
- 2011-01-26 US US13/014,520 patent/US10409892B2/en active Active
- 2011-12-29 TW TW100149580A patent/TWI582616B/zh not_active IP Right Cessation
-
2012
- 2012-01-20 CN CN201210019215.9A patent/CN102609403B/zh active Active
- 2012-01-24 KR KR1020137019749A patent/KR101999409B1/ko active IP Right Grant
- 2012-01-24 AU AU2012209157A patent/AU2012209157B2/en not_active Ceased
- 2012-01-24 SG SG10201510611UA patent/SG10201510611UA/en unknown
- 2012-01-24 RU RU2013135003/08A patent/RU2602786C2/ru not_active IP Right Cessation
- 2012-01-24 WO PCT/US2012/022454 patent/WO2012103159A2/en active Application Filing
- 2012-01-24 SG SG2013051768A patent/SG191850A1/en unknown
- 2012-01-24 MX MX2013008441A patent/MX346269B/es active IP Right Grant
- 2012-01-24 JP JP2013551298A patent/JP6033235B2/ja active Active
- 2012-01-24 CA CA2824922A patent/CA2824922C/en not_active Expired - Fee Related
- 2012-01-24 BR BR112013018693A patent/BR112013018693A2/pt not_active IP Right Cessation
- 2012-01-24 MY MYPI2013701301A patent/MY165937A/en unknown
- 2012-01-24 EP EP12739249.6A patent/EP2668594B1/en active Active
- 2012-01-25 AR ARP120100249A patent/AR085036A1/es not_active Application Discontinuation
-
2013
- 2013-01-23 HK HK13101016.3A patent/HK1173816A1/xx not_active IP Right Cessation
- 2013-06-27 IL IL227218A patent/IL227218A/en active IP Right Grant
- 2013-06-28 ZA ZA2013/04847A patent/ZA201304847B/en unknown
- 2013-07-22 CL CL2013002093A patent/CL2013002093A1/es unknown
- 2013-07-25 CO CO13176231A patent/CO6731131A2/es active IP Right Grant
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US2439683A (en) * | 1946-09-14 | 1948-04-13 | Ernest N Broderick | Sanitary receptacle and supporter |
US7222294B2 (en) * | 1998-12-31 | 2007-05-22 | Microsoft Corporation | Extension of formulas and formatting in an electronic spreadsheet |
US6697999B1 (en) * | 1999-10-20 | 2004-02-24 | Sun Microsystems, Inc. | Computer-based automatic document formatting method |
Also Published As
Publication number | Publication date |
---|---|
CN102609403A (zh) | 2012-07-25 |
CA2824922C (en) | 2019-02-19 |
AR085036A1 (es) | 2013-08-07 |
AU2012209157A1 (en) | 2013-07-25 |
ZA201304847B (en) | 2014-09-25 |
SG191850A1 (en) | 2013-08-30 |
US20120192051A1 (en) | 2012-07-26 |
WO2012103159A2 (en) | 2012-08-02 |
JP2014507029A (ja) | 2014-03-20 |
WO2012103159A3 (en) | 2012-09-20 |
RU2013135003A (ru) | 2015-01-27 |
AU2012209157B2 (en) | 2016-07-21 |
KR20140009297A (ko) | 2014-01-22 |
JP6033235B2 (ja) | 2016-11-30 |
EP2668594B1 (en) | 2021-07-07 |
IL227218A (en) | 2016-07-31 |
CN102609403B (zh) | 2015-05-20 |
CA2824922A1 (en) | 2012-08-02 |
SG10201510611UA (en) | 2016-01-28 |
US10409892B2 (en) | 2019-09-10 |
EP2668594A2 (en) | 2013-12-04 |
KR101999409B1 (ko) | 2019-07-11 |
EP2668594A4 (en) | 2018-01-24 |
TW201232294A (en) | 2012-08-01 |
TWI582616B (zh) | 2017-05-11 |
HK1173816A1 (en) | 2013-05-24 |
BR112013018693A2 (pt) | 2016-10-18 |
CL2013002093A1 (es) | 2013-12-13 |
MY165937A (en) | 2018-05-18 |
MX2013008441A (es) | 2013-08-12 |
CO6731131A2 (es) | 2013-08-15 |
MX346269B (es) | 2017-03-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2602786C2 (ru) | Форматирование данных по образцу | |
JP6282116B2 (ja) | キャプチャーされた画像データのスプレッドシートとの関連付け | |
US20200233847A1 (en) | Incremental dynamic document index generation | |
US8782557B2 (en) | Ordered multiple selection user interface | |
US20150178259A1 (en) | Annotation hint display | |
US20130290837A1 (en) | Method and Apparatus for Correcting Document Formatting Based on Source Document | |
US20090248740A1 (en) | Database form and report creation and reuse | |
JP5637143B2 (ja) | 共同開発支援システム、共同開発支援方法及びプログラム | |
CN114072787A (zh) | 用于促进文档审核的快速数据输入的系统和方法 | |
NZ711979B2 (en) | Formatting data by example | |
NZ711979A (en) | Formatting data by example | |
KR101049895B1 (ko) | 전자문서 작성기 | |
US9898449B1 (en) | System and method for automatically replacing information in a plurality electronic documents | |
US20130290835A1 (en) | Method and Apparatus for the Selection and Reformat of Portions of a Document | |
CN104462164A (zh) | 要件定义工序支援方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
HZ9A | Changing address for correspondence with an applicant | ||
MM4A | The patent is invalid due to non-payment of fees |
Effective date: 20200125 |