JP6033235B2 - 類例によるデーターのフォーマット処理 - Google Patents

類例によるデーターのフォーマット処理 Download PDF

Info

Publication number
JP6033235B2
JP6033235B2 JP2013551298A JP2013551298A JP6033235B2 JP 6033235 B2 JP6033235 B2 JP 6033235B2 JP 2013551298 A JP2013551298 A JP 2013551298A JP 2013551298 A JP2013551298 A JP 2013551298A JP 6033235 B2 JP6033235 B2 JP 6033235B2
Authority
JP
Japan
Prior art keywords
data
format
items
rules
spreadsheet
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013551298A
Other languages
English (en)
Other versions
JP2014507029A (ja
JP2014507029A5 (ja
Inventor
ロスシラー,チャド
バッタジン,ダニエル
ベネディクト,クリストファー
モレイラ−シルベイラ,ロドリーゴ
コーエン,エリック
グルワーニ,スミット
ローハナ,ダニー
シン,リシャブー
ゾーン,ベンジャミン・ゴス
ベンカテサン,ラマラスナム
ダニロブ,ディミトリー・オー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of JP2014507029A publication Critical patent/JP2014507029A/ja
Publication of JP2014507029A5 publication Critical patent/JP2014507029A5/ja
Application granted granted Critical
Publication of JP6033235B2 publication Critical patent/JP6033235B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/26Visual data mining; Browsing structured data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/14Digital output to display device ; Cooperation and interconnection of the display device with other functional units

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • User Interface Of Digital Computer (AREA)
  • Character Discrimination (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Description

[0001] 同じタイプのデーターが多くの異なるフォーマットで入力され格納されることが多い。例えば、日付けはCCYYMMDD(19990101)という形式になっている場合もあり、他の日付けはMM/DD/CCYY(01/01/1999)というフォーマットになっている場合もあり、更に他の日付けはM/D/YY(1/1/99)となっている場合もある。データーの分析を行うためには、これを同じフォーマットに変換する。例えば、ある分析では、電話番号は形式(206)555−1212にしたがってフォーマットすることを指定する場合があるが、一方他の分析では、電話番号からフォーマット処理を外す(即ち、2065551212)ことを指定する場合もある。データーを変換するためには、異なる方法を用いることができる。例えば、異なる変換機能を用いることができ、および/またはデーターを変換するためにコードを開発することもできる。
[0002] この摘要は、詳細な説明の章において以下で更に説明する概念から選択したものを簡略化された形式で紹介するために、設けられている。この摘要は、特許請求する主題の主要な特徴や必須の特徴を特定することを意図するのではなく、特許請求する主題の範囲を判断するときに補助として使用されることを意図するのでもない。
[0003] データー項目を1つの形式から他の形式に変換するためのデーター・フォーマット規則を、1組の出力例、例えば、ユーザーの編集(edit)に基づいて自動的に判断する。機械学習発見的方法を出力例(例えば、ユーザーの編集)だけでなくソース・データーにも適用して、追加のデーター項目に適用することができるデーター・フォーマット規則を決定する。例えば、ユーザーは、データーに/からキャラクターを追加/除去する、データーを繋げる、データーを抽出する、データーの名称を変更する等の編集を行うことができる。編集された値と共に元の値を調べることによって、このタイプの変換をカプセル化する(encapsulate)規則を導き出すことができ、この規則を追加の元の値に対して実行して(run)、所望の編集値または出力を自動的に生成することができる。この機械学習発見的方法は、イベントに応答して(例えば、所定の回数の編集が同じタイプのデーターに対して行われた後)自動的にトリガーすることができ、または手動でトリガーする(例えば、ユーザー・インターフェースの選択肢を選択する)こともできる。データー・フォーマット規則は、他のデーターにも適用することができ、このフォーマット処理の結果は、ユーザーによって見直すことができる。更に他の編集/見直しに基づいて、データー・フォーマット規則を更新することもできる。データー・フォーマット規則は、後に使用するためおよび/または変更のために格納することもできる。また、項目(1つまたは複数)が正しく再フォーマットされているか否か判断するときにユーザーを補助するために、信頼度を提示することもできる。
図1は、計算環境の一例を示す。 図2は、文書に対して行われた編集に基づいてデーターをフォーマットするシステムを示す。 図3は、列に対するユーザーの編集に基づいてデーター・フォーマット規則を決定し、このデーター・フォーマット規則をこの列の中にある他のセル(cell)に適用することを示す。 図4は、ユーザーが社会保障番号列における項目に編集を行う例を示す。 図5は、ユーザーが日付けのフォーマットを変更する編集を行う例を示す。 図6は、項目のフォーマットと対話処理するために用いることができるユーザー・インターフェースのエレメントを示す。 図7は、類例による記入(fill by example)を可能/不能にするユーザー・インターフェースを示す。 図8は、類例によるデーターのフォーマット処理(formatting data by example)のプロセス例を示す。
[0012] これより図面を参照して、種々の実施形態について説明する。図面では、同様の番号は同様の要素を表す。具体的には、図1および対応する論述は、実施形態を実現することができる、適した計算環境の端的な総合的説明を行うことを意図している。
[0013] 一般に、プログラム・モジュールは、ルーチン、プログラム、コンポーネント、データー構造、および特定のタスクを実行するまたは特定の抽象的データー・タイプを実現する他のタイプの構造を含む。他のコンピューター・システム構成を用いることもでき、ハンドヘルド・デバイス、マルチプロセッサー・システム、マイクロプロセッサーに基づくまたはプログラマブル消費者用電子機器、ミニコンピューター、メインフレーム・コンピューター等が含まれる。分散型計算環境も用いることができ、この場合、通信ネットワークを通じてリンクされている、離れた処理デバイスによってタスクを実行する。分散型計算環境では、プログラム・モジュールは、ローカルおよびリモート双方のメモリー記憶デバイスに配置することができる。
[0014] これより図1を参照して、種々の実施形態において利用するコンピューター100のコンピューター環境例について説明する。図1に示すコンピューター環境は、計算デバイスを含む。その各々は、サーバー、デスクトップまたは移動体コンピューター、あるいは他の何らかのタイプの計算デバイスとして構成することができ、中央演算装置5(「CPU」)、ランダム・アクセス・メモリー9(RAM)およびリード・オンリー・メモリー(「ROM」)10を含むシステム・メモリー7、ならびにこのメモリーを中央演算装置(「CPU」)5に結合するシステム・バス12を含む。
[0015] 基本入力/出力システムは、起動中のようなときにコンピューター内部におけるエレメント間で情報を転送するのに役立つ基本的なルーチンを収容し、ROM10に格納されている。更に、コンピューター100は、オペレーティング・システム16、スプレッドシート11、スプレッドシート・アプリケーション24、他のプログラム・モジュール25、およびフォーマット処理マネージャー26を格納する大容量記憶デバイス14も含む。フォーマット処理マネージャー26については、以下で更に詳しく説明する。
[0016] 大容量記憶デバイス14は、バス12に接続されている大容量記憶コントローラー(図示せず)を介してCPU5に接続されている。大容量記憶デバイス14およびそれに付随するコンピューター読み取り可能媒体は、不揮発性ストレージをコンピューター100に設ける。この中に収容されるコンピューター読み取り可能媒体の記述は、ハード・ディスクまたはCD−ROMドライブのような、大容量記憶デバイスに言及するが、コンピューター読み取り可能媒体は、コンピューター100によってアクセスできる入手可能な媒体であればいずれでも可能である。
[0017] 一例として、そして限定ではなく、コンピューター読み取り可能媒体は、コンピューター記憶媒体および通信媒体を含むことができる。コンピューター記憶媒体は、揮発性および不揮発性、リムーバブルおよびリムーバブル以外の媒体を含み、コンピューター読み取り可能命令、データー構造、プログラム・モジュール、または他のデーターというような情報の記憶方法または技術のいずれかで実現する。コンピューター記憶媒体は、RAM、ROM、消去可能プログラマブブル・リード・オンリー・メモリー(「EPROM」)、電気的消去可能プログラマブル・リード・オンリー・メモリー(「EEPROM」)、フラッシュ・メモリーまたはその他のソリッド・ステート・メモリー技術、CD−ROM、ディジタル・バーサタイル・ディスク(「DVD」)、あるいはその他の光学ストレージ、磁気カセット、磁気テープ、磁気ディスク記憶デバイスまたは他の磁気記憶デバイス、あるいは所望の情報を格納するために用いることができコンピューター100によってアクセスすることができる他のあらゆる媒体が含まれるが、これらに限定されるのではない。
[0018] コンピューター100は、インターネットのような、ネットワーク18を通じて、リモート・コンピューターへの論理接続を用いて、ネットワーク接続環境において動作する。コンピューター100は、バス12に接続されているネットワーク・インターフェース・ユニット20を介して、ネットワーク18に接続することができる。ネットワーク接続は、ワイヤレス接続および/または有線接続であってもよい。ネットワーク・インターフェース・ユニット20は、他のタイプのコンピューターや、ネットワーク・サービス(1つまたは複数)27のような、リモート・コンピューター・システムに接続するためにも利用できるとよい。また、コンピューター100は、キーボード、マウス、または電子スタイラス(図1には示されていない)を含む多数の他のデバイスからの入力を受け取って処理する入力/出力コントローラー22も含むことができる。同様に、入力/出力コントローラー22は、入力/出力をIPフォン、表示画面23、プリンター、または他のタイプの出力デバイスに供給することもできる。
[0019] 先に手短に述べたように、多数のプログラム・モジュールおよびデーター・ファイルをコンピューター100の大容量記憶デバイス14およびRAM9に格納することができ、その中には、ワシントン州、RedmondのMICROSOFT CORPORATIONのWINDOWS 7(登録商標)オペレーティング・システムのような、コンピューターの動作を制御するのに適したオペレーティング・システム16が含まれる。また、大容量記憶デバイス14およびRAM9は、1つ以上のプログラム・モジュールも格納することができる。具体的には、大容量記憶デバイス14およびRAM9は、スプレッドシート・アプリケーション24およびプログラム・モジュール25を含む1つ以上のアプリケーション・プログラムを格納することができる。一実施形態によれば、スプレッドシート・アプリケーション24は、MICROSOFT EXCELスプレッドシート・アプリケーションである。他のスプレッドシート・アプリケーションも用いてもよい。UI28のようなユーザー・インターフェースは、ユーザーが、スプレッドシート・アプリケーション24のような、アプリケーションと対話処理することを可能にする。
[0020] フォーマット処理マネージャー26は、図示のように、スプレッドシート・アプリケーション24の外部に配置してもよく、またはスプレッドシート・アプリケーション24の一部であってもよい。更に、フォーマット処理マネージャー26によって設けられる機能の全部/一部は、スプレッドシート・アプリケーション24の内部/外部に配置してもよい。
[0021] フォーマット処理マネージャー26は、元のデーターおよび出力例、例えば、ユーザーの編集に基づいてデーターを1つの形式から他の形式に変換するための1つ以上のデーター・フォーマット規則を生成するように構成されている。一実施形態によれば、フォーマット処理マネージャー26は、機械学習法を元のデーターおよび出力例、即ち、ユーザーの編集に適用して、データーに適用することができるデーター・フォーマット規則(1つまたは複数)を決定する。例えば、ユーザーは、キャラクターをデーターに/から追加/除去する、データーを繋げる、データーを抽出する、データーの名称を変更する等の編集を行うことができる。編集に応答して、文書(例えば、スプレッドシート)内にある他のデーターに適用するデーター・フォーマット規則(1つまたは複数)を生成する。データーに適用するフォーマット処理は、ユーザーが変更を受け入れる/拒否することができるように、ユーザーによって検討可能にするとよい。また、データーに適用するフォーマット処理は、メタデーターのフォーマット処理も含むことができる。一実施形態によれば、フォーマット規則から判定される信頼度を、データーに適用したフォーマット処理と関連付けて、データーが適正に再フォーマットされたときをユーザーが一層容易に識別できるようにするとよい。例えば、高い信頼度は、データーが適正にフォーマットされた可能性が高いことを示し、一方低い信頼度は、ユーザーが結果を見直すことを望むかもしれないことを示すことができる。機械学習経験法は、イベントに応答して(例えば、所定の回数の編集が同じタイプのデーターに対して行われた後)自動的にトリガーすることができ、または手動でトリガーすることもできる(例えば、ユーザー・インターフェースの選択肢を選択する)。更に他の編集/検討に基づいて、データー・フォーマット規則を更新することもできる。データー・フォーマット規則は、後に使用するためおよび/または変更のために格納することもできる。例えば、ユーザーは、データー・フォーマット規則の適用が、変更した規則に従うように、規則(例えば、スクリプト)を変更することができる。
[0022] 図2は、文書に対して行われた編集に基づいてデーターをフォーマットするシステムを示す。図示のように、システム200は、フォーマット処理マネージャー26、アプリケーション・プログラム210、コールバック・コード(callback code)212、およびディスプレイ215を含む。用いられる計算デバイス(1つまたは複数)は、文書に対するユーザーの編集に基づいてデーターを自動的にフォーマットすることに関係する動作を実行するように構成された計算デバイスであればいずれのタイプでもよい。例えば、計算デバイスの一部が、移動体計算デバイス(例えば、セル・フォン、タブレット、スマート・フォン、ラップトップ等)、デスクトップ計算デバイス、およびサーバーであってもよい。
[0023] フォーマット処理マネージャー26との通信をし易くするために、図2ではコールバック・コード212として示されている、1つ以上のコールバック・ルーチンを実装することができる。一実施形態によれば、アプリケーション・プログラム210はスプレッドシート・アプリケーションである。
[0024] ディスプレイ215は、スプレッドシート文書220のような文書、および文書と対話処理するために用いられるユーザー・インターフェース・エレメントを表示するように構成されている。図示のように、スプレッドシート220は、名の列(A)、姓の列(B)、および編集後の列(C)を含む3つの列を示す。この例では、ユーザーは編集後の列に編集を行ったところである。セルC2において、ユーザーはその行、即ち、行2に名(セルA2にも収容されている)を入力し、その後にカンマを入力し、更にその後に姓のイニシャル(セルB2にも収容されている)を入力した。セルC3において、ユーザーは、その行、即ち、行3に、名(セルA3にも収容されている)を入力し、その後にカンマを入力し、更にその後に姓のイニシャル(セルB3にも収容されている)を入力した。
[0025] 一般に、フォーマット処理マネージャー26は、あるパターンに当てはまるデーターをユーザーが編集/変更しているときを検出し、このパターンでスプレッドシート内において追加のデーターを記入する(fill down)ことができ更にこれらのデーターに適用することができる場合、データー・フォーマット規則を適用したことから得られた結果で、列に自動的に記入する。編集に応答して、フォーマット処理マネージャー26は、この編集に伴う情報を用いて、データー・フォーマット規則を得て、これをスプレッドシート内の他のデーターに適用する。一実施形態によれば、この情報は、編集されたセル(例えば、セルC2およびC3)内に表示されているテキストに対する編集から得られた出力例と、この編集に関連がある入力例とを含む。この場合、列Aおよび列Bは、編集列(例えば、セルA2およびB2は出力例C2に対する入力例であり、セルA3およびB3は出力例C3に対する入力例である)に関係がある入力例を含む。これらの入力/出力例は、フォーマット処理マネージャー26によって決定され、他の同様にフォーマットされたセル(例えば、セルC4:C7(222))にデーター・フォーマット規則を生成するプロセスに供給される。機械学習発見的方法は、これら1組の入力/出力例を得て、パターンを決定し、データー・フォーマット規則を生成し、次いで、フォーマット処理マネージャー26がこのデーター・フォーマット規則を出力範囲に適用して、新たにフォーマットされた値を生成する。一実施形態によれば、機械学習発見的方法の一例が、"Automating String Processing in Spreadsheets Using Input-Output Examples"(入力−出力例を用いたスプレッドシートにおける文字列処理の自動化)(Sumit Gulwani, PoPL'11, January 26-28, 2011, Austin Texas)に記載されている。他の機械学習発見的方法も利用することができる。一般に、元のデーターおよびデーター編集を取り込み、同様にフォーマットされたデーターを得るために他のデーターに適用することができるデーター・フォーマット規則を生成する発見的方法であればいずれでも用いることができる。一実施形態によれば、機械学習発見的方法の機能は、フォーマット処理マネージャー26に含まれる。この機能は、他の場所に配置してもよい。
[0026] フォーマット処理マネージャー26は、自動的にデーター・フォーマット規則を、スプレッドシート内部で同様にフォーマットされている他のセルに適用する。一実施形態によれば、データー・フォーマット規則は、編集列の内、この列で記入されるセルの出力範囲に自動的に適用される。現在の例では、出力範囲はセルC4:C7を含む。ボックス222は、データー・フォーマット規則をセルC4:C7に適用した結果、セルC5およびC6の中に値が入力されたことを示す。一実施形態によれば、出力範囲に適用するデーター・フォーマット規則は動的である。言い換えると、出力範囲内で値が編集されると、追加の入力/出力例(1つまたは複数)を用いてデーター・フォーマット規則が更新される。
[0027] データー・フォーマット規則は、セルの各々に0個以上の値を生成することができる。例えば、セルC4およびC7には値は戻されない。何故なら、B列の対応するセルには名前がないからである。データー・フォーマット規則が値に確信がない場合、データー・フォーマット規則によって1つよりも多い潜在的な結果を生成することもできる。一実施形態によれば、データーを自動的に再フォーマットする前に、所定数のセルにデーター・フォーマット規則を適用して、フォーマット規則を適用することによって、所定の信頼度閾値を満たすまたはこれを超える結果を生成しているか否か判断する。例えば、所定数のセルにフォーマット規則を適用した結果、低い信頼度しか得られない場合、このデーター・フォーマット規則を自動的に適用しない。一実施形態によれば、データー・フォーマット規則を出力範囲内にあるセルに適用し、1の答えを有するセルの割合を判定する。一実施形態によれば、ゼロの答えを有するセルの割合を、計算から除外する。割合が所定の閾値(例えば、70%)よりも高い場合、データー・フォーマット規則によって得られた結果を用いて、出力範囲におけるセルに自動的に記入する。閾値が満たされない場合、結果をセルに適用してはならず、新たなデーター・フォーマット規則を作成する前に更に多くの編集を求める。あるいは、結果を適用してもよく、信頼度が閾値よりも低いことを示すセルに、セルおよびインディケーター(例えば、強調、フォーマット)を適用すればよい。データー・フォーマット規則をセルに適用することによって一意の結果が得られたなら、これは、そのデーター・フォーマット規則が精度高い結果を生成していることの正しいインディケーターになる。データー・フォーマット規則が精度高い結果を生成しているか否か判断するためには、他の閾値および/または規則を用いてもよい。
[0028] ユーザーの編集に基づいて、多くのタイプのデーター・フォーマット規則を作成することができる。例えば、2つの列の連結、列からの情報抽出(例えば、アドレスから最上位ドメイン・ネームを抽出する、電子メール・アドレスを抽出する)等があげられる。一般に、データー・フォーマット規則は、いずれの編集活動に基づいても計算することができる。場合によっては、2つ以上の入力/出力例を用いて、精度が高い結果を生成することもできる。例えば、機械学習発見的方法は、2つの例を用いる場合には、50%の精度に過ぎないが、3つの例を用いると95%の精度になることもある。
[0029] また、データー・フォーマット規則は、ユーザー・インターフェース内における選択(例えば、アイコン224)に基づいて得ることもでき、または他の何らかのメニュー選択肢を選択することもできる。編集例は、ユーザーによって手作業で選択してもよく(例えば、ユーザーがセルの例を選択する)、および/またはフォーマット処理マネージャー26によって例を自動的に決定してもよい。例えば、フォーマット処理マネージャー26がデーターを監視し、そのデーターから入力/出力例を決定するのでもよい(例えば、値の個数が最も少ない列を出力列として考慮することができ、残りの列を入力列として考慮することができる)。
[0030] 図3から図6は、ユーザーの編集に基づいてセルをフォーマットする例を示す。
[0031] 図3は、ユーザーの列に対する編集に基づいてデーター・フォーマット規則を決定し、その列内にある他のセルにこのデーター・フォーマット規則を適用することを示す。図示のように、ユーザーはスプレッドシート310の姓名列(C)に対して編集を行っている。この例では、ユーザーは名のイニシャルをタイプ入力し、それに続いてピリオドおよび空白をタイプ入力し、その後に姓をタイプ入力した。姓は、スプレッドシート310の列Aに収容されており、名のイニシャルはスプレッドシートの列Bに収容されている。ユーザーがセルC2およびC3に対して編集を行ったことに応答して、機械学習発見的方法によってデーター・フォーマット規則が生成され、この文書内における他のセルに適用することができる。
[0032] この例では、入力/出力例は、編集された行毎に、C列におけるテキストと、AおよびB列におけるテキストとを含む。入力データーを決定するには、この文書を操作して、データー・フォーマット規則の適用において用いることができるデーターを突き止め、所望の結果を作成するとよい。この場合、データー・フォーマット規則は、列Bから名のイニシャルおよび列Aから姓を得て、更に名のイニシャルの後にピリオド・キャラクターと空白キャラクターとを挿入する規則を作成する。出力範囲312は、このデーター・フォーマット規則を適用すべきセルを示す。
[0033] スプレッドシート320を参照すると、データー・フォーマット規則を自動的に適用することによって、セルC3:C6に、名のイニシャル、それに続くピリオドおよび空白、更にこれらに続く姓を含む姓名(name)が得られることが分かる。セルC7には記入されない。何故なら、名(first name)の列が空白であるので、このデーター・フォーマット規則を適用しても、精度高い結果が得られなかったからである。
[0034] また、スプレッドシート320は、ユーザー・インターフェース・エレメントの検討322も示す。これは、データー・フォーマット規則の適用によって行われた変更を受け入れる/拒否するために用いることができる。また、誤りユーザー・インターフェース・エレメント324も、データー・フォーマット規則が適用されなかった場所(この場合、名前の列からのデーターがない)、またはデーター・フォーマット規則の適用が高精度であるとは判断されなかった位置の近くに置かれている(ユーザー・インターフェース・エレメントの検討および誤り補正ユーザー・インターフェース・エレメントに関するこれ以上の論述については、図6および関連する論述を参照のこと)。
[0035] 図4は、社会保障番号の列の中にある項目に対してユーザーが編集を行う例を示す。ユーザーは、社会保障番号のフォーマットを「XXXXXXXXX」から「XXX−XX−XXXX」に変更した(ここで、Xは0から9まえのいずれかの数値である)。他の例では、キャラクターは、数値以外のキャラクターでもよい。一実施形態によれば、ユーザーが2通り以上の編集を行った後、フォーマット処理マネージャーによって入力/出力例が用いられて、この列における他のデーターに適用されるデーター・フォーマット規則を生成する。この例では、入力例は、セルA2およびA3に収容されていた元のテキストであり、出力例は、セルA2およびA3に示される編集済みのテキストである。入力/出力例を提出する前に、これよりも多い編集または少ない編集を収集してもよい。例えば、場合によっては(この例のような)、1つの入力/出力例でも、精度高いデーター・フォーマット規則を生成するには十分なこともある。更に複雑な編集のシナリオでは、もっと多くの入力/出力例を用いてもよい。更に、ユーザーによって行われた追加の編集を、フォーマット処理マネージャーによってデーター・フォーマット規則を更新するために用いてもよい。データー・フォーマット規則をセルA4:A7に適用すると、ディスプレイ420によって示されるようなスプレッドシートが得られる。一実施形態によれば、既にデーターを収容しているセルは、自動的に変更されない。代わりに、提案された変更が、データーを収容しているセルに行われる前に、これらの変更を肯定的に受け入れることをユーザーに要請することもできる。これらのセルも自動的に変更して、ユーザーにはこの変更を元に戻す機会を与えるのでもよい。
[0036] 図5は、ユーザーが日付けのフォーマットを変更する編集を行う例を示す。ユーザーは、スプレッドシート510において2つの日付けのフォーマットを、「MM/DD/CCYY」から「MM/DD/YY」というフォーマットに変更した。
[0037] この例では、ユーザーは、セルA4およびA3における日付けのフォーマットを変更した。この入力例は、セルA3およびA4における元のテキストを含み、出力例は、ディスプレイ520のセルA3およびA4に示されているような、編集後のテキストを含む。生成されたデーター・フォーマット規則を適用すると、ディスプレイ520が得られる。図示のように、この編集は、同様にフォーマットされたデーターの範囲内ではどこにでも行うことができ、このデーター・フォーマット規則を適用すると、図2から図4において示したように記入する(fill down)だけでなく、他のセル(例えば、セルA2)にも適用することができる。
[0038] 図6は、項目のフォーマット処理において対話話処理するために用いることができるユーザー・インターフェース・エレメントを示す。図示のように、スプレッドシート610は、検討ユーザー・インターフェース・エレメント612および618、ならびに誤り訂正ユーザー・インターフェース・エレメント614および616を示す。
[0039] セルが一貫性のない値を有するとき、および/または精度が高いと判断されないというフラグが立てられたとき、このセルには誤り訂正ユーザー・インターフェース・エレメントを付けることができる。一実施形態によれば、データーに一貫性がないセルとは、セルの値がデーター・フォーマット規則が生成したはずのものと一致しない、またはセルの中にある値はデーター・フォーマット規則によって生成されたが1つよりも多い可能な結果があることを意味する。決定した出力範囲にデーター・フォーマット規則を適用したなら直ちに、一貫性のない結果にはいずれもフラグが立てられる。一実施形態によれば、結果に一貫性がないと見なされるのは、可能な結果の数が1つ以上または以下であるとき(例えば、結果がないか、またはデーター・フォーマット規則によって2つ以上の結果が得られる)、あるいは既存の値が、データー・フォーマット規則によって与えられる結果と一貫性がないときである。他の発見的方法を用いることもできる。例えば、結果の数が所定数の結果よりも多いときに結果を一貫性がないと見なすこともでき、および/または他の何らかの条件によって結果を一貫性がないと見なすこともできる。
[0040] 誤り訂正ユーザー・インターフェース・エレメントを選択することができる。選択すると、誤り訂正ユーザー・インターフェース・エレメントは、種々の選択可能な選択肢(630)を表示する。一実施形態によれば、これらの選択項目は、「次」選択肢、「前」選択肢、「ヘルプ」選択肢、「無視」選択肢、「受け入れ」選択肢、「セル内編集」選択肢、「誤りチェック」選択肢、および「可能な値」選択肢を含む。メニュー630内には、これよりも多い選択肢または少ない選択肢を含むこともできる。「次」選択肢は、誤りの印が付けられた次のセルに移動する。「前」選択肢は、直前の誤りに移動する。「ヘルプ」選択肢は、ヘルプの表示を行う。「無視」選択肢は、現在の誤りを無視して、誤り訂正ユーザー・インターフェース・エレメントをディスプレイから消す。「受け入れ」選択肢は、誤り状態を取り払い、そのセルに対して関連する入力/出力例を追加して、新たなデーター・フォーマット規則を生成する。「セル内編集」選択肢は、ユーザーをこのセルにおける編集モードに導く。ユーザーがこれらの誤りセルの1つ以上を編集すると、この編集は入力/出力例として扱われ、新たな/更新フォーマット規則を計算する。一実施形態によれば、更新データー・フォーマット規則がこのデーター・フォーマット規則に関係する残りの誤りセルに適用される。「誤りチェック」選択肢は、ユーザーに、誤りチェックに関する種々の選択肢を提供する。「可能な値」選択肢は、選択すると、セルを再フォーマットするときに、他の可能な値のリストを表示する。例えば、データー・フォーマット規則によって生成される各結果を表示することができる。
[0041] 検討ユーザー・インターフェース・エレメント612は、データー・フォーマット規則を用いてフォーマットしたセルと対話処理するための種々の選択肢を提示する。一実施形態によれば、検討メニュー620は、「取り消し」選択肢、「やり直し」選択肢、「中止」選択肢、「検討」選択肢、「全部無視」選択肢、「保存」選択肢、および「その他」選択肢を備えている。メニュー620には、これらよりも多いまたは少ない選択肢が含まれてもよい。「取り消し」選択肢は、データー・フォーマット規則をセルに適用する直前にあった状態に、 文書(例えば、データー・フォーマット規則を適用した文書の列)を 戻す。「やり直し」選択肢は、ユーザーによって以前に取り消されたセルにおいてデーターを復元する。「中止」選択肢は、データー・フォーマット規則を適用して自動的に記入する自動挙動を不能にする。「検討」選択肢は、有効なセル(active cell)を現在の変換範囲(例えば、出力範囲)内における最初のセルに、誤りタグと共に設定する。「無視」選択肢は、誤りタグおよび関係のあるあらゆる誤りフォーマットを、現在の記入(fill down)範囲から取り除く。「保存」選択肢は、ユーザーが現在のデーター・フォーマット規則を保存することを可能にする。「保存」選択肢は、入力することができる列(1つまたは複数)、およびいずれかの入力/出力例というような、規則に関する情報を保存する。「その他」選択肢は、他の選択肢を提供する。
[0042] 図7は、類例による記入(fill by example)を可能/不能にするユーザー・インターフェースを示す。ディスプレイ700は、ユーザーが類例によるデーター自動記入をオン/オフに切り替えることを可能にする選択肢702を含む。ユーザー・インターフェースには、データー・フォーマット規則を得る前の所望数の編集/選択項目、既存のデーターを確認して/確認せずに上書きするか否か等というような、他の選択肢も含むことができる。
[0043] これより図8を参照して、類例によるデーター・フォーマット処理プロセスの一例について説明する。本明細書において提示するルーチンの論述を読むとき、種々の実施形態の論理動作は、(1)計算システム上で実行するコンピューター実装動作のシーケンスまたはプログラム・モジュールとして、および/または(2)計算システム内部において相互接続された機械の論理回路または回路モジュールとして実現されることは認められてしかるべきである。この実施態様は、本発明を実現する計算システムの性能要件に依存する選択事項である。したがって、例示する論理動作は、本明細書において説明した実施形態を構成するが、動作(operation)、構造的デバイス、作用(act)、またはモジュールと、様々に呼ぶことがある。これらの動作、構造的デバイス、作用、およびモジュールは、ソフトウェア、ファームウェア、特殊目的ディジタル・ロジック、およびそのあらゆる組み合わせで実現することができる。
[0044] 開始ブロックの後、プロセス800は動作810に移り、文書内にあるデーターに対して行われた編集を検出する。この編集は、文書に対する編集であればいずれでもよい。一実施形態によれば、編集は、文書(即ち、スプレッドシート、表、リスト)のセルの内、同じデーター・タイプであり同様にフォーマットされたものに収容されているデーターに対して行われる。一般に、列内にある各セルは、同じタイプのデーター(即ち、日付け、住所、名前、番号等)を収容する。これらの項目の各々に適用される編集は、同じタイプの項目を有する他のセルに適用することができるパターンを当てはめる。
[0045] 判断動作820に移り、編集の数が所定数の編集を超過し、同様にフォーマットされた他のセルに適用するデーター・フォーマット規則を得るプロセスをトリガーしたか否か判定を行う。一実施形態によれば、データー・フォーマット規則を得ることをトリガーする編集の数は2つである。トリガー点は、他の値に手作業/自動で設定することができる。例えば、トリガー点は、データー・フォーマット規則を文書内にある他の同様のデーター項目に適用する精度の予測に基づくことができる。場合によっては、トリガー点は1にするとよく、一方他の場合では、3以上であるとよいこともある。
[0046] トリガー点に達していないとき、本プロセスは動作810に戻り、他の編集が行われたときを検出する。
[0047] トリガー点に達したとき、本プロセスは動作830に進み、入力/出力例を得て、機械発見的方法に供給してデーター・フォーマット規則を求める。入力/出力例は、以前の状態におけるデーターの例、およびデーターの編集に関する後状態におけるデーターの例を与える。例えば、編集が既存のデーターに対するものであるとき、入力例は、編集前のデーターとなり、出力例は編集後のデーターとなる。編集が新たなセルに対するものであるとき、出力例はそのセルにおいて編集されたデーターであり、入力例は、出力の作成に関するデーター(例えば、1つ以上の他の列のデーター)である。
[0048] 動作840に移り、データー・フォーマット規則を得る。一実施形態によれば、データー・フォーマット規則は、テキスト入力を(例えば、1つ以上のセルから)受け取りゼロ以上の結果を生成する関数である。データー・フォーマット規則は、ユーザーが行った編集と一致するように、文書内にある同様の項目(例えば、列内にある他のセル)をフォーマットすることを目的とする。
[0049] 動作850に移り、出力範囲を決定する。出力範囲は、データー・フォーマット規則を適用すべき項目を特定する。例えば、他の項目は、ユーザーによって項目が編集され、データー・フォーマット規則の基本となった列の中にあるセルの全部または一部であってもよい。例の中には、出力範囲が、列内において同じ項目タイプ(例えば、日付け、数、アドレス等)を有するセルである場合もある。他の例では、出力範囲は、互いに隣接する値を有し、編集されたセルに隣接する全てのセルである。
[0050] 動作860に進み、データー・フォーマット規則を、決定した出力範囲における項目の各々に適用する。データー・フォーマット規則を適用することによって生成された結果はいずれも、文書に対していかなる変更が行われる前にも、一時的に格納することができる。
[0051] 判断動作870に移り、データー・フォーマット規則を適用した結果、精度が高い結果が得られたか否か判定を行う。一実施形態によれば、データー・フォーマット規則を項目に適用したときに戻される結果の数によって、精度を推定する。ある項目についての結果の数がゼロである場合、データー・フォーマット規則は結果を生成するための十分なデーターを有していなかったことになる。結果の数が1よりも大きいとき、結果の精度には問題があることもあり得る。結果の数が1であるとき、その結果は精度が高いと考えられる。高い精度の結果を有すると推定されたセルの数/割合は、信頼閾値を超えたとき(例えば、>70%、80%、90%)を判定するために用いることができる。この信頼度を超えていないとき、本プロセスは動作810に戻り他の編集を検出する。一般に、得られる例が多い程、結果の精度も高くなる。信頼度レベルを超えたとき、本プロセスは動作880に進む。
[0052] 動作880において、データー・フォーマット規則を項目の各々に適用したことによって作成された結果を用いて文書を更新する。例えば、1つの結果を有するセルは、その結果を用いて更新される。異なる数の結果を有するセルには、先に論じたように、誤りインディケーターを付けることができる。また、ユーザーがデーター・フォーマット規則の適用に関する種々の動作を実行することを可能にする検討ユーザー・インターフェース・エレメントも表示することができる。
[0053] 次いで、本プロセスは終了ブロックに進み、他の動作の処理に戻る。
[0054] 以上の明細書、例、およびデーターは、本発明の構成物(composition)の製造および使用について完全な説明に備えたものである。本発明の多くの実施形態は、本発明の主旨および範囲から逸脱することなく形成することができるので、本発明は以下に添付する特許請求の範囲に属するものとする。

Claims (10)

  1. 編集に基づいてデーターをフォーマットするための方法であって、
    スプレッドシート文書内のそれぞれ関連を有する複数の項目に対して編集が行われたときを判定するステップと、
    前記スプレッドシート文書の異なる列に関連する入力例と、前記スプレッドシート文書の同じ列内の出力例とに基づいてデーター・フォーマット規則を自動的に作成するステップと、
    前記データー・フォーマット規則をデーター・タイプが同じであり前記複数の項目とは異なる前記スプレッドシート文書内の他の項目に自動的に適用するステップであって、前記データー・フォーマット規則は、前記複数の項目に対して行われた前記編集によって定義されるフォーマットに前記他の項目をフォーマットすることを試みるものである、ステップと、
    前記データー・フォーマット規則の適用を反映した前記他の項目を表示するステップと、
    を含む、方法。
  2. 請求項1記載の方法において、前記編集に基づいて前記データー・フォーマット規則を得るステップは、前記編集の各々に関係する情報を、前記データー・フォーマット規則を作成する機械学習発見的方法に提出するステップを含む、方法。
  3. 請求項1記載の方法において、前記編集は、前記スプレッドシートの同じ列内にある異なるセルに対して行われる、方法。
  4. 請求項1記載の方法であって、更に、前記データー・フォーマット規則によってフォーマットされた前記他の項目の少なくとも1つの隣りにグラフィカル・ユーザー・インターフェースを表示し、前記グラフィカル・ユーザー・インターフェースが選択されると、前記フォーマットされた項目に関する動作を実行する選択肢を提示するステップを含み、前記フォーマットの取り消し、前記フォーマットのやり直し、前記フォーマットの中止、潜在的な誤りの検討、および誤りの無視を行うための選択肢を含む、方法。
  5. 請求項1記載の方法であって、更に、信頼度が所定の閾値よりも低いとき、前記フォーマットした項目と共にインディケーターを表示するステップを含む、方法。
  6. 請求項1記載の方法において、前記データー・フォーマット規則を前記他の項目に適用するステップは、同じ列および同じ行の少なくとも1つの中にある他の項目にデーター・フォーマット規則を適用するステップを含む、方法。
  7. 請求項1記載の方法において、前記編集が同じデーター・タイプの前記複数の項目に対して行われたときを判定するステップは、第2列および第3列にも含まれているデーターを含む第1列に対して前記編集が行われたときを判定するステップを含む、方法。
  8. 例に基づいてデーターをフォーマットするためのコンピューター実行可能命令を格納するコンピューター読み取り可能記憶媒体であって、前記命令は、
    スプレッドシート文書の同じ列内の複数の項目から出力例を決定するステップと、
    前記スプレッドシート文書の異なる列に関連する入力例と、前記スプレッドシート文書の前記同じ列内の前記出力例とに基づいてデーター・フォーマット規則を自動的に作成するステップと、
    前記複数の項目とは異なる、前記スプレッドシート文書の前記同じ列内の他の項目に前記データー・フォーマット規則を自動的に適用するステップであって、前記データー・フォーマット規則は、前記出力例によって定義されるフォーマットに前記他の項目をフォーマットすることを試みるものである、ステップと、
    前記データー・フォーマット規則の適用を反映した前記他の項目を表示するステップと、
    を含む、コンピューター読み取り可能記憶媒体。
  9. 編集に基づいてデーターをフォーマットするためのシステムであって、
    ネットワークに接続するように構成されたネットワーク接続と、
    プロセッサー、メモリー、およびコンピューター読み取り可能記憶媒体と、
    前記コンピューター読み取り可能記憶媒体上に格納され前記プロセッサー上で実行する動作環境と、
    ディスプレイと、
    スプレッドシート・アプリケーションと、
    行および列に配列された項目を含むスプレッドシートと、
    前記スプレッドシート・アプリケーションと共に動作するフォーマット処理マネージャーと、
    を備え、前記フォーマット処理マネージャーは、
    前記スプレッドシートの同じ列内の複数の項目に対して編集が行われたときを判定する動作と、
    前記スプレッドシートの異なる列に関連する入力例と、前記スプレッドシートの前記同じ列内の出力例とに基づいてデーター・フォーマット規則を自動的に作成する動作と、
    前記複数の項目とは異なる、前記スプレッドシートの前記同じ列内の他の項目に前記データー・フォーマット規則を自動的に適用する動作であって、前記データー・フォーマット規則は、前記スプレッドシートの前記同じ列内の前記複数の項目に対して行われた前記編集によって定義されるフォーマットに前記他の項目をフォーマットすることを試みるものである、動作と、
    前記データー・フォーマット規則の適用を反映した前記他の項目を前記ディスプレイ上に表示する動作と、
    を実行するように構成されている、システム。
  10. 請求項9記載のシステムであって、前記データー・フォーマット規則によってフォーマットされた前記他の項目の少なくとも1つの隣りにグラフィカル・ユーザー・インターフェースを表示する動作であって、前記グラフィカル・ユーザー・インターフェースは、選択されると、フォーマット変更を検討するための選択肢を提示する、動作を更に含む、システム。
JP2013551298A 2011-01-26 2012-01-24 類例によるデーターのフォーマット処理 Active JP6033235B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US13/014,520 2011-01-26
US13/014,520 US10409892B2 (en) 2011-01-26 2011-01-26 Formatting data by example
PCT/US2012/022454 WO2012103159A2 (en) 2011-01-26 2012-01-24 Formatting data by example

Publications (3)

Publication Number Publication Date
JP2014507029A JP2014507029A (ja) 2014-03-20
JP2014507029A5 JP2014507029A5 (ja) 2015-03-19
JP6033235B2 true JP6033235B2 (ja) 2016-11-30

Family

ID=46526787

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013551298A Active JP6033235B2 (ja) 2011-01-26 2012-01-24 類例によるデーターのフォーマット処理

Country Status (20)

Country Link
US (1) US10409892B2 (ja)
EP (1) EP2668594B1 (ja)
JP (1) JP6033235B2 (ja)
KR (1) KR101999409B1 (ja)
CN (1) CN102609403B (ja)
AR (1) AR085036A1 (ja)
AU (1) AU2012209157B2 (ja)
BR (1) BR112013018693A2 (ja)
CA (1) CA2824922C (ja)
CL (1) CL2013002093A1 (ja)
CO (1) CO6731131A2 (ja)
HK (1) HK1173816A1 (ja)
IL (1) IL227218A (ja)
MX (1) MX346269B (ja)
MY (1) MY165937A (ja)
RU (1) RU2602786C2 (ja)
SG (2) SG191850A1 (ja)
TW (1) TWI582616B (ja)
WO (1) WO2012103159A2 (ja)
ZA (1) ZA201304847B (ja)

Families Citing this family (56)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9213682B1 (en) * 2011-03-31 2015-12-15 Bank Of America Corporation Method and apparatus for auditing a business document
US20140046923A1 (en) * 2012-08-10 2014-02-13 Microsoft Corporation Generating queries based upon data points in a spreadsheet application
US9495641B2 (en) 2012-08-31 2016-11-15 Nutomian, Inc. Systems and method for data set submission, searching, and retrieval
US11361246B2 (en) * 2012-08-31 2022-06-14 DataRobot, Inc. Methods for automating aspects of machine learning, and related systems and apparatus
US9524473B2 (en) 2012-08-31 2016-12-20 Nutonian, Inc. System and method for auto-query generation
US9002758B2 (en) * 2012-10-17 2015-04-07 Microsoft Technology Licensing, Llc Ranking for inductive synthesis of string transformations
US10140269B2 (en) * 2013-03-12 2018-11-27 Microsoft Technology Licensing, Llc Viewing effects of proposed change in document before committing change
CN104239283A (zh) * 2013-06-13 2014-12-24 富泰华工业(深圳)有限公司 文字编辑系统及方法
US10229101B2 (en) * 2013-06-14 2019-03-12 Microsoft Technology Licensing, Llc Smart fill
US10019432B2 (en) * 2013-06-15 2018-07-10 Microsoft Technology Licensing, Llc Conversion of data ranges to table objects
US10366346B2 (en) 2014-05-23 2019-07-30 DataRobot, Inc. Systems and techniques for determining the predictive value of a feature
US10558924B2 (en) 2014-05-23 2020-02-11 DataRobot, Inc. Systems for second-order predictive data analytics, and related methods and apparatus
JP6444494B2 (ja) 2014-05-23 2018-12-26 データロボット, インコーポレイテッド 予測データ分析のためのシステムおよび技術
US10496927B2 (en) 2014-05-23 2019-12-03 DataRobot, Inc. Systems for time-series predictive data analytics, and related methods and apparatus
US10824799B2 (en) 2014-06-30 2020-11-03 Microsoft Technology Licensing, Llc Summary data autofill
US10191895B2 (en) * 2014-11-03 2019-01-29 Adobe Systems Incorporated Adaptive modification of content presented in electronic forms
US10685173B2 (en) 2015-08-17 2020-06-16 International Business Machines Corporation Formatting tables with complex patterns
US20170139893A1 (en) * 2015-11-12 2017-05-18 SmartSheet.com, Inc. Automatically adjusting spreadsheet formulas and/or formatting
CN108475258B (zh) 2015-12-29 2021-07-27 微软技术许可有限责任公司 用于格式化文档对象的方法、设备和介质
US9864732B2 (en) * 2016-05-02 2018-01-09 Google Inc. User interfaces that facilitate management of formatting of digital content
US10621195B2 (en) * 2016-09-20 2020-04-14 Microsoft Technology Licensing, Llc Facilitating data transformations
US10706066B2 (en) 2016-10-17 2020-07-07 Microsoft Technology Licensing, Llc Extensible data transformations
US11892987B2 (en) 2016-10-20 2024-02-06 Microsoft Technology Licensing, Llc Automatic splitting of a column into multiple columns
US11620304B2 (en) * 2016-10-20 2023-04-04 Microsoft Technology Licensing, Llc Example management for string transformation
US11256710B2 (en) 2016-10-20 2022-02-22 Microsoft Technology Licensing, Llc String transformation sub-program suggestion
US10776380B2 (en) 2016-10-21 2020-09-15 Microsoft Technology Licensing, Llc Efficient transformation program generation
US10846298B2 (en) 2016-10-28 2020-11-24 Microsoft Technology Licensing, Llc Record profiling for dataset sampling
US11170020B2 (en) 2016-11-04 2021-11-09 Microsoft Technology Licensing, Llc Collecting and annotating transformation tools for use in generating transformation programs
US11163788B2 (en) 2016-11-04 2021-11-02 Microsoft Technology Licensing, Llc Generating and ranking transformation programs
US20180143957A1 (en) * 2016-11-18 2018-05-24 Business Objects Software Limited Using format patterns for numeric formatting
US10387900B2 (en) 2017-04-17 2019-08-20 DataRobot, Inc. Methods and apparatus for self-adaptive time series forecasting engine
US11354494B2 (en) * 2017-07-10 2022-06-07 Adaptam Inc. Methods and systems for connecting a spreadsheet to external data sources with formulaic specification of data retrieval
US11080462B2 (en) * 2017-11-13 2021-08-03 Workshare Ltd. Method of comparing two data tables and displaying the results without source formatting
US10241992B1 (en) * 2018-04-27 2019-03-26 Open Text Sa Ulc Table item information extraction with continuous machine learning through local and global models
US10977433B2 (en) * 2018-10-09 2021-04-13 Oracle International Corporation System and method for input data validation and conversion
US20200160303A1 (en) * 2018-11-19 2020-05-21 Rylti, LLC Method and system for audit, verification, and settlement of royalty and license fees in the music industry
JPWO2020213288A1 (ja) * 2019-04-17 2020-10-22
JP2021026567A (ja) * 2019-08-06 2021-02-22 株式会社三菱Ufj銀行 フォーマット変換装置及びプログラム
JP7321364B2 (ja) 2019-09-14 2023-08-04 バイトダンス インコーポレイテッド ビデオコーディングにおけるクロマ量子化パラメータ
WO2021072177A1 (en) 2019-10-09 2021-04-15 Bytedance Inc. Cross-component adaptive loop filtering in video coding
JP7443509B2 (ja) * 2019-10-14 2024-03-05 バイトダンス インコーポレイテッド ビデオコーディングにおけるクロマ量子化パラメータの使用
JP7508558B2 (ja) 2019-12-09 2024-07-01 バイトダンス インコーポレイテッド ビデオコーディングにおける量子化グループの使用
CN114902657A (zh) 2019-12-31 2022-08-12 字节跳动有限公司 视频编解码中的自适应颜色变换
US11074048B1 (en) 2020-04-28 2021-07-27 Microsoft Technology Licensing, Llc Autosynthesized sublanguage snippet presentation
US11327728B2 (en) 2020-05-07 2022-05-10 Microsoft Technology Licensing, Llc Source code text replacement by example
CN112784560B (zh) * 2020-05-26 2024-07-23 珠海金山办公软件有限公司 一种数据显示方法及装置
US11481195B2 (en) 2020-06-09 2022-10-25 Google Llc Synthesizing programs in a spreadsheet programming language
US11836444B2 (en) 2020-06-26 2023-12-05 Adaptam Inc. Methods and systems for constructing a complex formula in a spreadsheet cell
US11900080B2 (en) 2020-07-09 2024-02-13 Microsoft Technology Licensing, Llc Software development autocreated suggestion provenance
CN112908392B (zh) * 2021-02-09 2023-09-15 东芯半导体股份有限公司 控制非易失性存储器参数的控制方法
US11941372B2 (en) 2021-04-01 2024-03-26 Microsoft Technology Licensing, Llc Edit automation using an anchor target list
US11875136B2 (en) 2021-04-01 2024-01-16 Microsoft Technology Licensing, Llc Edit automation using a temporal edit pattern
US11977835B2 (en) 2021-05-24 2024-05-07 Adaptam Inc. Method and system for spreadsheet error identification and avoidance
CN114004221A (zh) * 2021-10-26 2022-02-01 珠海金山办公软件有限公司 一种表格内容的校正方法及装置
US11900054B1 (en) 2022-08-29 2024-02-13 Bank Of America Corporation Platform for generating published reports using report and worksheet building with position mapping identification
US11663399B1 (en) 2022-08-29 2023-05-30 Bank Of America Corporation Platform for generating published reports with position mapping identification and template carryover reporting

Family Cites Families (71)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2439683A (en) * 1946-09-14 1948-04-13 Ernest N Broderick Sanitary receptacle and supporter
US5231577A (en) * 1990-04-06 1993-07-27 Microsoft Corporation Method and system for processing formatting information in a spreadsheet
US5701499A (en) 1992-03-25 1997-12-23 Microsoft Corporation Method and system for automatically entering a data series into contiguous cells of an electronic spreadsheet program or the like
US5613131A (en) * 1993-01-29 1997-03-18 Microsoft Corporation Auto-formatting of tables in a spreadsheet program
US5621875A (en) * 1993-10-26 1997-04-15 Microsoft Corp. Method and system for automatic formatting of user selected text
US5598519A (en) * 1994-11-08 1997-01-28 Microsoft Corporation Method and system for direct cell formatting in a spreadsheet
US5778402A (en) * 1995-06-07 1998-07-07 Microsoft Corporation Method and system for auto-formatting a document using an event-based rule engine to format a document as the user types
US5805158A (en) 1996-08-22 1998-09-08 International Business Machines Corporation Copying predicted input between computer systems
US6038567A (en) * 1998-02-19 2000-03-14 Microsoft Corporation Method and system for propagating object properties in a desktop publishing program
US6731309B1 (en) 1998-08-28 2004-05-04 Corel Corporation Real time preview
US6640234B1 (en) 1998-12-31 2003-10-28 Microsoft Corporation Extension of formulas and formatting in an electronic spreadsheet
US7069508B1 (en) * 2000-07-13 2006-06-27 Language Technologies, Inc. System and method for formatting text according to linguistic, visual and psychological variables
TW498221B (en) 1999-08-20 2002-08-11 Ibm Method and system in an electronic spreadsheet for introducing new elements in a cell named range according to different modes
EP1094402A1 (en) 1999-10-20 2001-04-25 Sun Microsystems, Inc. Automatic document formatting method
JP4091726B2 (ja) 2000-02-23 2008-05-28 インターナショナル・ビジネス・マシーンズ・コーポレーション 構造化文書の表示規則の生成方法、システムおよびプログラムが記録された媒体ならびに構造化文書およびその文書型定義の変更方法、システムおよびプログラムが記録された媒体
US6981028B1 (en) 2000-04-28 2005-12-27 Obongo, Inc. Method and system of implementing recorded data for automating internet interactions
EP1202206A3 (en) * 2000-10-24 2004-01-21 International Business Machines Corporation Method and system in an electronic spreadsheet for persistently self-replicating multiple ranges of cells through a copy-paste operation
TW518509B (en) 2000-11-28 2003-01-21 Ibm Method and system in an electronic spreadsheet for persistently filling by samples a range of cells
US20020156816A1 (en) 2001-02-13 2002-10-24 Mark Kantrowitz Method and apparatus for learning from user self-corrections, revisions and modifications
US6968504B2 (en) * 2001-06-29 2005-11-22 Microsoft Corporation Automated document formatting tool
US7089298B2 (en) 2001-08-20 2006-08-08 Nokia Corporation Naming distribution method for ad hoc networks
US7343551B1 (en) 2002-11-27 2008-03-11 Adobe Systems Incorporated Autocompleting form fields based on previously entered values
US7305129B2 (en) 2003-01-29 2007-12-04 Microsoft Corporation Methods and apparatus for populating electronic forms from scanned documents
US7426496B2 (en) 2004-03-03 2008-09-16 Microsoft Corporation Assisted form filling
US7350187B1 (en) 2003-04-30 2008-03-25 Google Inc. System and methods for automatically creating lists
US7660779B2 (en) 2004-05-12 2010-02-09 Microsoft Corporation Intelligent autofill
US7584422B2 (en) 2004-07-12 2009-09-01 Informatica Corporation System and method for data format transformation
US7707486B2 (en) 2004-08-06 2010-04-27 The Board Of Trustees Of The Leland Stanford Junior University Logical spreadsheets
US7933862B2 (en) 2004-09-27 2011-04-26 Microsoft Corporation One click conditional formatting method and system for software programs
US8745483B2 (en) 2004-10-07 2014-06-03 International Business Machines Corporation Methods, systems and computer program products for facilitating visualization of interrelationships in a spreadsheet
US7451397B2 (en) 2004-12-15 2008-11-11 Microsoft Corporation System and method for automatically completing spreadsheet formulas
US8621340B2 (en) * 2004-12-20 2013-12-31 Microsoft Corporation Block properties and calculated columns in a spreadsheet application
KR20070024771A (ko) 2005-08-30 2007-03-08 엔에이치엔(주) 질의어 자동변환을 이용한 자동완성 질의어 제공 시스템 및방법
US7792814B2 (en) 2005-09-30 2010-09-07 Sap, Ag Apparatus and method for parsing unstructured data
US7627812B2 (en) * 2005-10-27 2009-12-01 Microsoft Corporation Variable formatting of cells
US7640158B2 (en) 2005-11-08 2009-12-29 Multimodal Technologies, Inc. Automatic detection and application of editing patterns in draft documents
US7590608B2 (en) 2005-12-02 2009-09-15 Microsoft Corporation Electronic mail data cleaning
US7634717B2 (en) 2006-01-23 2009-12-15 Microsoft Corporation Multiple conditional formatting
US7770100B2 (en) 2006-02-27 2010-08-03 Microsoft Corporation Dynamic thresholds for conditional formats
US7689904B2 (en) 2006-03-06 2010-03-30 Sap Ag Template-based creation of electronic document
US20070220415A1 (en) 2006-03-16 2007-09-20 Morgan Mao Cheng Excel spreadsheet parsing to share cells, formulas, tables or entire spreadsheets across an enterprise with other users
US10345922B2 (en) 2006-04-21 2019-07-09 International Business Machines Corporation Office system prediction configuration sharing
US8600916B2 (en) 2006-04-21 2013-12-03 International Business Machines Corporation Office system content prediction based on regular expression pattern analysis
US8005806B2 (en) 2006-11-15 2011-08-23 Yahoo! Inc. System and method for information retrieval using context information
CN101105814A (zh) 2007-09-11 2008-01-16 金蝶软件(中国)有限公司 一种将Script语言转换成SQL语言的方法及装置
US20090089653A1 (en) 2007-09-28 2009-04-02 Microsoft Corporation Auto-generation and syndication of tables as forms
US8640024B2 (en) * 2007-10-30 2014-01-28 Adobe Systems Incorporated Visually distinct text formatting
CN101158900B (zh) 2007-11-19 2010-09-08 北京大学 一种基于模板系列的报表生成系统及方法
US20090228776A1 (en) 2008-03-05 2009-09-10 Microsoft Corporation Dynamic formulas for spreadsheet cells
US20090319542A1 (en) 2008-06-19 2009-12-24 Pierre Jean Le Brazidec Systems and methods to automatically replace content in a range of spreadsheet cells with information from a database
US9032283B2 (en) * 2008-09-29 2015-05-12 Apple Inc. Rendering common cell formatting for adjacent cells
US8255789B2 (en) * 2008-09-30 2012-08-28 Apple Inc. Providing spreadsheet features
US8150814B2 (en) 2009-04-07 2012-04-03 Business Objects Software Ltd. System and method of data cleansing using rule based formatting
US20100325173A1 (en) 2009-06-23 2010-12-23 The Board Of Regents Of The The University Of Texas System Rapid development of informatics systems for collaborative data management
US8386406B2 (en) 2009-07-08 2013-02-26 Ebay Inc. Systems and methods for making contextual recommendations
US20110066933A1 (en) 2009-09-02 2011-03-17 Ludwig Lester F Value-driven visualization primitives for spreadsheets, tabular data, and advanced spreadsheet visualization
CN101661512B (zh) 2009-09-25 2012-01-11 万斌 一种识别传统表单信息并创建对应Web表单的系统及方法
US8140533B1 (en) 2010-01-26 2012-03-20 Google Inc. Harvesting relational tables from lists on the web
US9489366B2 (en) 2010-02-19 2016-11-08 Microsoft Technology Licensing, Llc Interactive synchronization of web data and spreadsheets
US20110320231A1 (en) 2010-06-23 2011-12-29 Canadian National Railway Company Method and system for enabling a user to bid on a work assignment
US8510373B2 (en) 2010-08-30 2013-08-13 Sap Ag Data synchronization and disablement of dependent data fields
EP2506155A1 (en) 2011-03-30 2012-10-03 Siemens Aktiengesellschaft Auto-fill functionality within engineering software for automation systems
US8645825B1 (en) 2011-08-31 2014-02-04 Google Inc. Providing autocomplete suggestions
US20130124957A1 (en) 2011-11-11 2013-05-16 Microsoft Corporation Structured modeling of data in a spreadsheet
US8799760B2 (en) 2011-12-08 2014-08-05 Xerox Corporation Smart macros using zone selection information and pattern discovery
US20130191714A1 (en) 2012-01-25 2013-07-25 Microsoft Corporation Fill by example animation and visuals
US20130227031A1 (en) 2012-02-24 2013-08-29 Research In Motion Limited Retrieval and presentation of contact data at an electronic device
US8819574B2 (en) 2012-10-22 2014-08-26 Google Inc. Space prediction for text input
US9244977B2 (en) 2012-12-31 2016-01-26 Google Inc. Using content identification as context for search
US10229101B2 (en) 2013-06-14 2019-03-12 Microsoft Technology Licensing, Llc Smart fill
US9652446B2 (en) * 2014-08-22 2017-05-16 Smartsheet Inc. Automatically adjusting spreadsheet formulas and/or formatting

Also Published As

Publication number Publication date
MX2013008441A (es) 2013-08-12
RU2602786C2 (ru) 2016-11-20
MX346269B (es) 2017-03-13
SG10201510611UA (en) 2016-01-28
KR101999409B1 (ko) 2019-07-11
CL2013002093A1 (es) 2013-12-13
AU2012209157B2 (en) 2016-07-21
EP2668594A4 (en) 2018-01-24
CO6731131A2 (es) 2013-08-15
SG191850A1 (en) 2013-08-30
CA2824922C (en) 2019-02-19
CN102609403A (zh) 2012-07-25
RU2013135003A (ru) 2015-01-27
JP2014507029A (ja) 2014-03-20
CA2824922A1 (en) 2012-08-02
MY165937A (en) 2018-05-18
TWI582616B (zh) 2017-05-11
EP2668594A2 (en) 2013-12-04
CN102609403B (zh) 2015-05-20
IL227218A (en) 2016-07-31
AU2012209157A1 (en) 2013-07-25
BR112013018693A2 (pt) 2016-10-18
TW201232294A (en) 2012-08-01
US20120192051A1 (en) 2012-07-26
US10409892B2 (en) 2019-09-10
EP2668594B1 (en) 2021-07-07
WO2012103159A2 (en) 2012-08-02
WO2012103159A3 (en) 2012-09-20
KR20140009297A (ko) 2014-01-22
ZA201304847B (en) 2014-09-25
HK1173816A1 (en) 2013-05-24
AR085036A1 (es) 2013-08-07

Similar Documents

Publication Publication Date Title
JP6033235B2 (ja) 類例によるデーターのフォーマット処理
AU2009238294B2 (en) Data transformation based on a technical design document
US11526481B2 (en) Incremental dynamic document index generation
US20100229052A1 (en) Resolving asynchronous validation errors
US20130152038A1 (en) Project management workflows
US20100325539A1 (en) Web based spell check
EP2932403A2 (en) Appending content with annotation
US20130158964A1 (en) Reusable workflows
CN117556796A (zh) 项目文档处理方法、装置、计算机设备及存储介质
CN114072787A (zh) 用于促进文档审核的快速数据输入的系统和方法
CN115469849B (zh) 一种业务处理系统、方法、电子设备和存储介质
CN109948251B (zh) 基于cad的数据处理方法、装置、设备及存储介质
CN110597862A (zh) 一种基于信息系统的数据录入方法、设备以及系统
NZ711979B2 (en) Formatting data by example
NZ711979A (en) Formatting data by example
JP5683209B2 (ja) ドキュメント類自動生成機能付クライアントコンピュータ
US20120296860A1 (en) Method and System for Extracting Information from Electronic Data Sources
CN116432619A (zh) 一种前端业务规则处理方法和装置
CN112560462A (zh) 事件抽取服务的生成方法、装置、服务器以及介质
CN115732051A (zh) 电子病例报告的生成方法、装置和电子设备
KR20210069241A (ko) 규칙 기반으로 공간정보 처리용 워크플로우 서비스를 제공하는 방법 및 이러한 방법을 실행시키기 위한 명령어들이 저장된 컴퓨터 판독 가능한 저장 매체
WO2013047146A1 (ja) Ft図作成支援装置及びft図作成支援プログラム
US20110252308A1 (en) Generating computer program code from open markup language documents

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150126

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150126

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20150519

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160224

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160229

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160530

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160926

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161025

R150 Certificate of patent or registration of utility model

Ref document number: 6033235

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250