KR20160135345A

KR20160135345A - 입력의 컨텍스트 인식 리포맷팅

Info

Publication number: KR20160135345A
Application number: KR1020167029361A
Authority: KR
Inventors: 아이삭 알폰소; 닉 키브레; 마이클 레빗; 사란가라잔 파르타사라티
Original assignee: 마이크로소프트 테크놀로지 라이센싱, 엘엘씨
Priority date: 2014-03-20
Filing date: 2015-03-18
Publication date: 2016-11-25
Also published as: CN106104427B; US9672202B2; EP3120258A1; CN106104427A; US20150269136A1; WO2015142967A1

Abstract

여러 가지 구성요소는 하나 이상의 컨텍스트에 기초하여 입력을 리포맷하는 옵션을 제공한다. 애플리케이션(예컨대, 메시징 애플리케이션, 모바일 애플리케이션, 워드-프로세싱 애플리케이션, 웹 브라우저, 검색 툴 등)에 제출되었던 입력이 수신되고, 리포맷화를 위한 옵션으로서 제공될 가능성이 있는 하나 이상의 출력이 식별된다. 각 출력의 각각의 스코어는 입력 및 각 출력의 각각의 조합에 통계적 모델을 적용함으로써 결정되고, 각각의 스코어는, 각각의 조합의 복수의 컨텍스트를 수량화하는 복수의 컨텍스트 스코어를 포함한다. 예시적인 컨텍스트는 히스토리컬-사용자 컨텍스트, 도메인 컨텍스트, 및 일반적인 컨텍스트를 포함한다. 하나 이상의 제안된 출력은 각각의 스코어에 기초하여 하나 이상의 출력 중에서 선택되며, 입력을 리포맷팅하는 옵션으로서 제공된다.

Description

입력의 컨텍스트 인식 리포맷팅{CONTEXT-AWARE RE-FORMATTING OF AN INPUT}

입력은 타이핑되거나 손으로 쓰여진 컨텐츠, 스피치, 제스처 등과 같은 여러 가지 형태로 컴퓨팅 디바이스에 제공될 수 있다. 종종, 컴퓨팅 디바이스는, 제안된 대안을 입력을 리포맷팅하기 위한 옵션으로서 제공한다. 예컨대, 제안된 대안은, 대안 또는 정확한 스펠링, 스피치/텍스트 표기 옵션, 자동-교정 옵션, 자동-완성 옵션, 텍스트 정규화, 또는 역텍스트 정규화로서 제공될 수도 있다.

본 발명의 실시형태는 하나 이상의 컨텍스트에 기초하여 입력을 리포맷하는 옵션을 제공하는 것에 관한 것이다. 애플리케이션(예컨대, 메시징 애플리케이션, 모바일 애플리케이션, 워드-프로세싱 애플리케이션, 웹 브라우저, 검색 툴 등)에 제출되었던 입력이 수신되고, 리포맷팅을 위한 옵션으로서 제공될 가능성이 있는 하나 이상의 출력이 식별된다. 각 출력의 각각의 스코어는 입력 및 각 출력의 각각의 조합에 통계적 모델을 적용함으로써 결정되고, 상기 각각의 스코어는 각각의 조합의 복수의 컨텍스트를 수량화하는 복수의 컨텍스트 스코어를 포함한다. 예시적인 컨텍스트는 히스토리컬-사용자 컨텍스트, 도메인 컨텍스트, 및 일반적인 컨텍스트를 포함한다. 하나 이상의 제안된 출력은 각각의 스코어에 기초하여 하나 이상의 출력 중에서 선택되며, 입력을 리포맷하기 위한 옵션으로서 제공된다.

본 발명의 실시형태는, 이러한 요약이 아니라, 아래의 청구항들에 의해 규정된다. 본 발명의 여러 가지 양태의 고차원적인 개요는, 개시의 개요를 제공하기 위하여, 이하의 상세한 설명 섹션에서 추가적으로 설명되는 개념을 선택하기 위한 이유로 본원에 제공된다. 이러한 개요는 청구되는 주제의 키 또는 본질적인 특징을 식별하도록 의도되지 않고, 청구된 주제의 범위를 결정하기 위하여 격리에 있어서 보조물로서 사용되도록 의도되지도 않는다.

본 발명의 예시적인 실시형태는, 참조에 의해 본원에 통합되는 첨부된 도면을 참조하여 이하에서 상세히 설명된다.
도 1은 본 발명의 실시형태에 따른 예시적인 컴퓨팅 디바이스를 나타낸다.
도 2는 본 발명의 실시형태에 따른 예시적인 컴퓨팅 환경을 나타낸다.
도 3은 각각이 본 발명의 일부 실시형태에 따른 각각의 방법의 단계를 포함하는 흐름도를 나타낸다.

본 발명의 실시형태의 주제는 법으로 정한 요건을 충족하기 위하여 본원에서 특별히 설명된다. 그러나 설명 그 자체는 청구항들의 범위를 반드시 제한하도록 의도되지 않는다. 오히려, 청구된 주제는, 다른 현재 또는 미래의 기술과 함께, 다른 요소 또는 이 문서에 설명되는 것과 유사한 요소의 조합을 포함하도록 다른 방식으로 구현될 수도 있다. 용어는 개별적인 단계의 순서가 명백하게 설명되지 않는 한 그리고 개별적인 단계의 순서가 명백하게 설명될 때를 제외하고, 본원에 개시된 여러 가지 단계들 중에서 또는 이러한 단계를 사이에서 임의의 특정 순서를 암시하는 것으로 해석되어서는 안된다.

본 발명은 일반적으로 하나 이상의 컨텍스트에 기초하여 입력을 리포맷팅하는 것에 관한 것이다. 일단 입력이 수신되면, 하나 이상의 출력은, 입력을 리포맷팅하는데 사용될 수 있는 발생가능한 대안으로서 식별되고 검색된다. 각 출력은 통계적 모델을 적용함으로써 기록되며(scored), 이러한 통계적 모델은 입력 및 출력의 조합에 적용되는 여러 가지 컨텍스트를 수량화한다. 출력들의 일부는 스코어에 기초하여 선택되고, 입력을 리포맷팅하기 위한 옵션으로서 제공된다.

본 발명의 양태는, 컴퓨팅 디바이스, 컴퓨팅 디바이스의 구성요소, 방법, 명령어를 저장하는 컴퓨터-저장 매체 또는 디바이스 등과 같은 여러 가지 형태로 구현될 수도 있다. 이제 도 1을 참조하면, 본 발명의 실시형태를 구현하기 위한 예시적인 컴퓨팅 환경이 일반적으로 컴퓨팅 디바이스(100)로서 도시되고 지정된다. 그러나, 컴퓨팅 디바이스(100)는 적절한 컴퓨팅 환경의 하나의 예이며, 본 발명의 실시형태의 사용 범위 또는 기능에 대하여 임의의 제한을 제안하도록 의도되지 않는다. 컴퓨팅 환경(100)은 예시된 구성요소 중 임의의 하나 또는 이러한 구성요소의 조합에 관한 어떤 의존성 또는 필요조건을 가지는 것으로 해석되어서는 안된다.

본 발명의 실시형태는, 컴퓨터, 또는 퍼스널 데이터 어시스턴트 또는 다른 핸드헬드 디바이스와 같은 기타 머신에 의해 실행되는 프로그램 모듈과 같은 컴퓨터-실행가능한 명령어를 포함하여, 컴퓨터 코드 또는 머신-사용가능하는 명령어의 일반적인 컨택스트에서 설명될 수도 있다. 일반적으로, 루틴, 프로그램, 객체, 구성요소, 데이터 구조체 등을 포함하는 프로그램 모듈은, 특정 작업을 수행하거나 또는 특정의 추상적인 데이터 유형을 구현하는 코드를 지칭한다. 본 발명의 실시형태는, 핸드-헬드 디바이스, 가전제품, 범용 컴퓨터, 더 특수한 컴퓨팅 디바이스 등을 포함하여, 여러 가지 시스템 구성으로 실행될 수도 있다. 본 발명의 실시형태는 또한, 통신 네트워크를 통하여 링크되는 원격-프로세싱 디바이스에 의해 작업이 수행되는 분산된 컴퓨팅 환경에서 실행될 수도 있다.

도 1을 참조하면, 컴퓨팅 디바이스(100)는, 메모리(112), 하나 이상의 프로세서(114), 하나 이상의 프레젠테이션 구성요소(116), 라디오(117), 입/출력 포트(118), 입/출력 구성요소(120), 및 예시적인 전원(122)을 직접 또는 간접적으로 연결하는 버스(110)를 포함한다. 버스(110)는 하나 이상의 버스(어드레스 버스, 데이터 버스, 또는 이들의 조합)일 수도 있는 것을 표현한다. 도 1의 여러 가지 블록이 명료화를 위하여 라인으로 도시되어 있지만, 실제로, 여러 가지 구성요소를 묘사하는 것은 그다지 명확하지 않고, 비유적으로, 라인은 더 정확하게는 회색 및 흐릿한 색일 수도 있다. 예를 들어, 하나는 I/O 구성요소가 되는 디스플레이 디바이스와 같은 프레젠테이션 구성요소를 고려할 수도 있다. 또한, 프로세서는 메모리를 가진다. 우리는 이러한 것이 본 기술의 본질이라는 것을 인식하며, 도 1의 도면이 단순히 본 발명의 하나 이상의 실시형태와 관련되어 사용될 수 있는 예시적인 컴퓨팅 디바이스의 예시라는 점을 되풀이 하여 말한다. "워크스테이션", "서버", "랩탑", "핸드헬드 디바이스" 등과 같은 이러한 카테고리들이 "컴퓨팅 디바이스"를 참조하여 도 1의 범위 내에서 고려될 때, 이러한 카테고리들 사이에서의 구분이 행해지지 않는다.

컴퓨팅 디바이스(100)는 일반적으로 여러 가지의 컴퓨터-판독가능한 매체를 포함한다. 컴퓨터-판독가능한 매체는, 컴퓨팅 디바이스(100)에 의해 액세스될 수 있는 임의의 이용가능한 매체일 수 있으며, 휘발성 및 비휘발성 매체, 분리형 및 비분리형 매체 양자를 포함한다. 제한적이지 않은 예로서, 컴퓨터-판독가능한 매체는 컴퓨터 저장 매체 및 통신 매체를 포함할 수도 있다.

컴퓨터 저장 매체는, 컴퓨터-판독가능한 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보의 저장을 위하여 임의의 방법 또는 기법으로 구현된, 휘발성 및 비휘발성, 분리형 및 비분리형, 형태를 가진 비일시적인 매체를 포함한다. 컴퓨터 저장 매체는 RAM; ROM; EEPROM; 플래시 메모리 또는 다른 메모리 기술; CD-ROM; DVD(digital versatile disks) 또는 기타 광디스크 저장 장치; 자기 카세트, 자기 테이프, 자기 디스크 스토리지 또는 기타 자기 스토리지 디바이스; 또는 원하는 정보를 저장하는데 사용될 수 있고 컴퓨팅 디바이스(100)에 의해 액세스될 수 있는 기타 매체 또는 컴퓨터 저장 디바이스를 포함한다.

통신 매체는 일반적으로 반송파 또는 기타 전송 메카니즘과 같은, 컴퓨터-판독가능한 명령어, 데이터 구조체, 프로그램 모듈 또는 변조된 데이터 신호 내의 다른 데이터를 구현하며, 임의의 정보 전달 매체를 포함한다. “변조된 데이터 신호”라는 용어는, 하나 이상의 그 특성을 가지거나, 또는 신호 내의 정보를 인코딩하기 위한 방식으로 변경된 신호를 의미한다. 예를 들어, 통신 매체는 유선 네트워크 또는 직결(direct-wired) 접속과 같은 유선 매체, 및 어코스틱, RF, 적외선과 같은 무선 매체 및 기타 무선 매체를 포함한다. 전술한 것의 임의의 조합은 또한 컴퓨터-판독가능한 매체의 범위 내에 포함되어야 한다.

메모리(120)는 휘발성 및/또는 비휘발성 메모리의 형태로 컴퓨터-저장 매체를 포함한다. 메모리는 분리형, 비분리형, 또는 이들의 조합일 수도 있다. 예시적인 하드웨어 디바이스는, 솔리드-스테이트 메모리, 하드 드라이브, 광디스크 드라이브 등을 포함한다. 컴퓨팅 디바이스(100)는 메모리(112) 또는 I/O 구성요소(120)와 같은 여러 가지 엔티티로부터 데이터를 판독하는 하나 이상의 프로세서(114)를 포함한다. 프레젠테이션 구성요소(들)(116)은 사용자 또는 다른 디바이스에 데이터 표시를 제공한다. 예시적인 프레젠테이션 구성요소는, 디스플레이 디바이스, 스피커, 프린팅 구성요소, 진동 구성요소 등을 포함한다.

라디오(117)는 전기통신 네트워크와 같은 네트워크로부터 신호를 송신 및 수신하도록 기능한다. I/O 포트(118)는 컴퓨팅 디바이스(100)로 하여금 I/O 구성요소(120)를 포함하는 다른 디바이스에 논리적으로 결합되게 하고, 이들의 일부는 내장될 수도 있다. 예시적인 구성요소는, 마이크로폰, 조이스틱, 게임 패드, 위성 안테나, 스캐너, 프린터, 무선 디바이스 등을 포함한다.

다음으로 도 2를 참조하면, 예시적인 환경(210)이 본 발명의 실시형태에 따라서 도시된다. 도 2는 네트워크(216)를 통하여 서로 통신하는 컴퓨팅 디바이스(212) 및 서버(214)를 포함한다. 컴퓨팅 디바이스(212) 및 서버(214) 양자는, 도 1에 대하여 설명된 구성요소의 일부 또는 전부를 포함하는 컴퓨팅 디바이스의 유형이다. 네트워크(216)는, 인트라넷, LAN, WAN, 모바일-전기통신 네트워크, 및 인터넷과 같은 여러 가지 유형의 네트워크를 포함할 수도 있다.

도 2에 의해 도시된 구성요소의 각각은 이제 더욱 상세하게 설명된다. 컴퓨팅 디바이스(212)는, 모바일 컴퓨팅 디바이스(예컨대, 스마트 폰), 데스트탑, 랩탑, 테블릿 등과 같은 여러 가지 상이한 디바이스 유형 중 임의의 것일 수도 있다. 컴퓨팅 디바이스(212)는, 입력 디바이스(218), 출력 디바이스(220), 애플리케이션(222), 및 입력 리포맷터(224)와 같은 여러 가지 구성요소를 포함한다. 컴퓨팅 디바이스(212)는, 프로세스와 메모리를 포함하여 도 1에 대하여 설명된 구성요소와 같은, 도시되지 않은 다른 구성요소를 포함한다. 입력 디바이스(218)는, 키보드, 터치스크린, 마이크로폰, 생체 센서, 제스처 수신기, 마우스 등과 같은 여러 가지 유형의 입력 디바이스를 포함할 수도 있다. 출력 디바이스(220)는 또한, 디스플레이 스크린, 스피커, 표시기 라이트, 또는 촉각-피드백 메카니즘과 같은 여러 가지 유형의 출력 디바이스를 포함할 수도 있다.

도 2는 입력 필드(223)와 드롭-다운 제안 메뉴(227)을 제공하는 예시적인 디스플레이 스크린(221)을 도시한다. 사용자는, 키보드 상의 타이핑, 터치-감지 스크린 상의 타이핑, 스피치/텍스트 변환기로의 스피치 입력의 제공 등과 같은 여러 가지 방식으로 입력 필드(223) 내에 입력(225)을 제공할 수도 있다.

애플리케이션(22)은 컴퓨팅 디바이스(212) 상의 하나 이상의 동작을 수행하는데 사용된다. 예컨대, 애플리케이션(222)은, 이메일 애플리케이션, 텍스트-메시징 애플리케이션, 네트워크 브라우저, 브라우저에 의해 액세스된 검색-툴, 워드-프로세싱 애플리케이션, 모바일-디바이스 애플리케이션 등일 수도 있다. 입력 및 명령은 입력 디바이스(218)를 이용하여 애플리케이션(222)에 제공될 수 있고, 애플리케이션(222)은 출력 디바이스(220)를 경유하여 출력을 제공할 수 있다.

입력(225)은, 여러 가지 컴퓨팅 작업이 상이한 컨텍스트 내에서 수행되고 있을 때, 애플리케이션(222)에 제공될 수도 있다. 예컨대, 입력(225)은, 워드-프로세싱 문서, 이메일 메시지, 텍스트 메시지, 블로그 포스팅, 소셜-네트워트 포스팅, 소셜-네트워트 커맨트 등과 같은 컨텐츠가 생성되고 있을 때, 애플리케이션(22)에 제공될 수도 있다. 다른 컨텍스트에서, 사용자는, 검색 질의, 웹페이지 어드레스, 또는 웹페이지의 필드로 들어가는 입력과 같은, 네트워크 브라우저 GUI에 입력(225)을 제공할 수도 있다. 다른 추가적인 컨텍스트에서, 입력(225)은 애플리케이션(222)에 제공된다. 이들은 단지 컨텍스트의 일례이고, 입력(225)이 하나의 유형의 컨텍트스보다 더 많은 컨텍스트 하에서 분류될 수 있도록, 반드시 서로에 대하여 상호 배타적일 필요는 없다. 애플리케이션의 다른 부분에 표시된 바와 같이, 입력(225)은, 스피치/텍스트 번역기를 통하여, 컴퓨팅 디바이스(212)에 타이핑될 수도 있거나, 또는 일부 다른 방식으로 제공될 수도 있다.

종종, 입력 리포맷터는, 애플리케이션에 제공되는 입력(예컨대, SOUNS)을 수신하거나 가로채고, 제안된 대안(228)[예컨대, SOUNDS, SOUNDS LIKE A PLAN, SLAP, SOUNDS ABOUT RIGHT]을 제공한다. 입력 리포맷터는, 컴퓨팅 디바이스(212) 상에서 동작하는 애플리케이션, 애플리케이션(222)의 구성요소, 컴퓨팅 디바이스(212)의 운영체제의 구성요소, 또는 이러한 클라이언트측 구성요소의 일부 조합이 되는 클라이언트측 입력 리포맷터(224)일 수도 있다. 대안적으로, 입력 리포맷터는, 서버(214) 상에서 동작하는 서버측 입력 리포맷터(227)를 포함할 수도 있다. 클라이언트측 입력 리포맷터(224) 및 서버측 입력 리포맷터(227)는 제안된 대안을 제공하기 위하여 서로에 대하여 독립적으로 동작될 수도 있는 반면에, 이들은 또한 제안된 대안을 제공하기 위하여 일제히 동작하고 서로 통신할 수도 있다.

입력 리포맷터(224 또는 227)는 여러 가지 이유에 대하여 제안된 대안(228)을 제공할 수도 있다. 예컨대, 제안된 대안(228)은, 자동-교정 기능, 자동-완성 기능, 및 스피치/텍스트 전사기의 일부로서 제공될 수도 있다. 다른 실시형태에 있어서, 제안된 대안(228)은 텍스트-정규화 동작 또는 역텍스트-정규화 동작의 일부로서 제공된다. 예컨대, 스크린 또는 입력-필드 부동산이 제한되는 컨텍스트에서, 제안된 대안(228)은 입력보다 더욱 간결한 출력을 포함할 수도 있다.

제안된 대안(228)은 상이한 기술을 적용함으로써 입력 리포맷터(224 또는 227)에 의해 생성될 수도 있다. 입력(225)이 수신될 때, 컨텍스트-독립 출력이 제안된 대안으로서 제공되면, 사용자에게 도움이 될 수 있는 컨텍스트-독립 출력의 세트가 존재할 수도 있다. 예컨대, 입력이 “SOUNS”이면, 그 후에, “SOUNS”가 제공되는 컨텍스트에 관계없이 “SOUNS”를 리포맷하기 위한 옵션일 수도 있는 컨텍스트-독립 출력의 세트가 식별된다. 예시적인 컨텍스트-독립 출력(246)이 도 2에 도시된다.

일 실시형태에 있어서, 컨텍스트-독립 출력은, 입력이 수신될 때 실시간으로 식별될 수도 있다. 대안적으로, 이러한 컨텍스트-독립 출력의 세트는, 인덱스 또는 다른 저장 디바이스에서와 같이, 입력(225)과 연관되어 미리 결정되고 저장될 수도 있다. 예컨대, 데이터스토어(240)는, 클라이언트 컴퓨팅 디바이스(212) 상에서 유지될 수도 있고, 또는 데이터스토어(242)는 서버(216) 상에서 유지될 수도 있다. 도 2는, 예시적인 목적을 위하여 확장도(244)에 도시되는 데이터(244)를 포함한다는 점을 예시한다. 확대도(244)는 데이터(244)가 “SOUNS”를 컨텐츠-독립 출력의 세트와 연관된다는 점을 예시한다. 동일 또는 유사한 데이터(244)는 또한 클라이언트 컴퓨팅 디바이스(212) 상의 데이터스토어(240) 내에 저장될 수도 있다. 컨텍스트-독립 출력은, 예컨대 임의의 컨텍스트에서의 입력으로부터 출력으로의 공지된 히스토리컬 변환에 기초하여, 여러 가지 방식으로 결정될 수도 있다. 예컨대, 일반적인 사용자 행위는, 입력으로부터 출력까지의 변환(즉, 리포맷팅)을 추적하기 위하여 모니터링될 수도 있고, 변환은 데이터(244)에 로그인된다.

본 발명이 없이, 일부 기술은, 입력이 공급되는 컨텍스트에 대한 출력의 관련성에 관계없이, 입력(255)을 리포맷팅하기 위한 발생가능한 옵션으로서 임의의 및 모든 컨텍스트-독립 출력을 제공할 수도 있다. 다른 기술은, 이메일 애플리케이션에 대한 하나의 모델과 같은 각 컨텍스트에 대한 별도의 모델 그리고 텍스트 메시징 애플리케이션에 대한 별도의 모델을 만들려고 시도할 수도 있다. 그러나, 본 발명의 실시형태는, 교차하는 상이한 컨텍스트로부터 지식 소스를 조합함으로써 입력의 하나 이상의 컨텍스트에 대한 관련성을 결정하기 위하여 컨텍스트-독립 출력을 스코어링하는 것에 관한 것이다.

본 발명의 실시형태에서, 입력 리포맷터(224 또는 227)는, 입력(225)이 공급되는 하나 이상의 컨텍스트에 기초하여 출력의 세트 내의 각 출력을 기록(score)하기 위하여 통계적 모델을 레버리징한다. 즉, 통계적 모델은, 입력이 각 출력으로 히스토리컬적으로 리포맷팅 또는 변환된 여러 가지 컨텍스트를 고려한다. 또한, 각 컨텍스트에는 통계적 모델에 대한 컨텍스트의 관련성을 결정하는 것을 돕기 위하여 맞춤화된 중량이 할당될 수 있다.

통계적 모델은 출력을 평가하기 위하여 여러 가지 컨텍스트를 적용한다. 컨텍스트-독립 출력 중 각각의 출력과 입력(225)의 각 조합에 대하여, 통계적 모델은, 애플리케이션(222)에서, 공급된 입력(225)과 연관된 사용자 프로파일에 의해; 입력(225)이 메시지(예컨대, 이메일, 텍스트, 또는 인스턴트 메시지) 내에 포함될 때의 메시지 수신자에 의해; 사용자 프로파일과 함께 그룹화되는 사용자(소셜 네트워크 또는 컨택트 내의 친구)에 의해; 일반적으로 사용자에 의해; 식별된 수직 도메인의 컨텍스트에서(예컨대, 여행, 스포츠, 이미지, 비디오 등); 또는 이것의 조합에 있어서, 입력이 각각의 출력에 대하여 히스토리컬적으로 리포맷팅된 횟수를 포함한다. 이들은 단지 컨텍스트의 예이며, 여러 가지 다른 컨텍스트는 또한 통계적 모델 내에 포함될 수도 있다. 통계적 모델은, 각 컨텍스트 하에서 출력에 대한 입력의 히스토리컬 리포맷팅을 고려하고, 그 후에 스코어에 도달하는 컨텍스트 모두를 조합한다.

동작에 있어서, 통계적 모델은, 수량화되었던 하나 이상의 컨텍스트를 수학적으로 결합하는 식을 적용한다. 일 실시형태에서, 식은 이하의 식 1을 포함한다.

식 1에서, “f”는 여러 가지 방식으로 정의될 수도 있다. 즉, “f”는 파라미터로서 입력 및 출력을 가지고, 출력에 대하여 SUM을 가지는 일반적인 함수이다. 일례에 있어서, f(input, output)는 score(output|input;Θ), 또는 Θscore(output|input;Θ)과 같은 이것의 일부 변형을 포함할 수도 있다.

f(input, output)이 score(output|input;Θ)를 포함하는 실시형태에서, 이하의 내용을 포함하는 식 2는 통계적 모델에서 이용된다.

식 2는 입력 및 각각의 출력의 조합의 스코어를 결정하기 위하여 적용된다. 예컨대, 도 2를 참조하면, 식 2는 “sounds | souns” 및 “sounds like a plan | souns”의 조합에 그리고 하나 이상의 다른 입력|출력의 조합에 적용될 수도 있다.

식 2의 항은 추가적으로 부가적인 식으로 나눠진다.

예컨대, “

” 는 이하의 식 3을 이용하여 모델링될 수도 있다.

식 3에 따르면, 항의 각각은 중량에 의해 인수화되고, 이는 통계적 모델을 튜닝하도록 맞춤화될 수 있다. 예를 들어, 사용자 히스토리는, 사용자 히스토리에는 도메인 보다 더 높은 중량이 할당되도록, 사용자 히스토리는 도메인보다 리포맷팅 경향을 더 나타낸다고 결정될 수도 있다. 일 실시형태에서, 중량은 애플리케이션-독립적이며, 특정 애플리케이션으로부터의 데이터로부터 또는 애플리케이션의 수집으로부터 데이터를 풀링함으로써 추정된다. 또한, 식 3은 확장될 수 있고, 부가적인 또는 대안적인 컨텍스트로 변경될 수도 있다. 즉, 식 3은 컨텍스트 “일반”, “히스토리”, 및 “도메인”으로 반드시 제한되지는 않는다. 오히려, 다른 컨텍스트는, 소스의 선형 조합을 이용하기 위하여, 이러한 컨텍스트에 더하여 또는 이러한 컨텍스트 대신에 식 3에 포함된다.

식 3에서, “일반적인” 컨텍스트는, 입력이 각각의 출력으로 리포맷팅되는 넓은, 캐치-올 컨텍스트를 표현한다. “히스토리” 컨텍스트는, 입력을 제출하는 사용자, 사용자가 연관되거나 또는 그룹화되는 사용자, 및 전체로서의 사용자와 같은, 사용자 그룹에 기초하여 히스토리컬 사용자 변환을 수량화한다. "도메인" 컨텍스트는 입력이 제출되는 도메인 또는 환경을 표현한다. 도메인 컨텍스트의 예는, 애플리케이션(222), 지리적 위치, 수직재(예컨대, 웹 검색, 이미지 컨텍스트, 비디오 컨텍스트, 및 맵 컨텍스트), 카렌다, 및 여행, 스포츠, 뉴스 등과 같은 주제 도메인을 포함한다.

식 3에서의 항은, 상이한 레벨의 입상도(granularity)로 추가적으로 나눠질 수도 있다. 예컨대, score

는 식 4를 이용하여 결정될 수 있고, 이러한 식은,

score(history)=

을 포함한다.

식 4에서의 항들의 각각은 상이한 사용자 그룹 중에서 히스토리컬 사용자 행위에 기초하여 상이한 사용자 컨텍스트를 표현한다. 예컨대, "특정 사용자(specific user)"는 입력을 제출하는 사용자를 표현하고, "그룹(group)"은 사용자가 연관되는 그룹(예컨대, 소셜 네트워크)를 표현한다. 변수 "수신자(recipient)"는 "특정 사용자"의 부-구성요소이며, 사용자가 특정 수신자에게 메시지를 전송하고 있을때 각각의 입력에 대한 입력의 리포맷팅을 표현한다. "일반적인 사용자(general user)"라는 항은 "그룹"을 포함하거나 상기 "그룹"과 중복되는 사용자의 그룹을 표현한다. 식 4는 상이한 항 또는 컨텍스트를 포함하도록 확장되거나 변경될 수 있다. 예컨대, 식 4는 사용자가 속하는 상이한 그룹에 대한 별도의 항(예컨대, 성, 나이, 취미, 직업 등)을 포함할 수도 있다. 이러한 설명의 다른 부분에서 표시된 바와 같이, 각 항은 각각의 중량을 포함하며, 이는 통계적 모델을 튜닝하기 위하여 맞춤화될 수 있다.

식 3에서, 항 스코어는 또한 식 5을 이용하여 결정되는 소스의 선형 조합을 이용하여 모델링될 수도 있고, 이러한 식 5는 이하의 것을 포함한다.

score(domain)=

In

상이한 도메인은, 검색-질의 컨텍스트, 사용자 또는 디바이스 위치 컨텍스트, 및 애플리케이션 컨텍스트(즉, 여행 애플리케이션)에서의 입력으로부터 각각의 출력까지 리포맷팅하는 것을 표현한다. 이러한 설명의 다른 부분에 표시되는 바와 같이, 이들은 단지 이러한 선형 조합을 이용하여 모델링될 수도 있는 도메인의 유형의 예이며, 각각의 중량은 맞춤화될 수 있다.

본원에서 설명된 이러한 통계적 모델을 적용하는 것은, 분석되는 각 출력에 대한 스코어를 생성한다. 이와 같이, 양자화된 스코어는, 입력(225)을 리포맷팅하기 위한 제안된 대안(238)으로서 컴퓨팅 디바이스(2120에 제공되어야 하는 출력을 선택하는데 사용될 수 있다. 예컨대, 하나의 선택 기준은, 출력 스코어의 최고 수(예컨대, 최고 4), 또는 최고 퍼센티지일 수도 있다. 이와 같이, 각각의 스코어는 서로 비교될 수도 있고, 각각의 스코어(즉,. 그룹은 미리 설정된 양) 중에서 가장 높은 것이 되는 각각의 스코어의 그룹에 대응하는 하나 이상의 제안된 출력이 선택된다. 다른 기준은, 최소 임계 스코어를 초과하지 않는 각각의 스코어가 리포맷에 대한 옵션으로서 제공되기에 부적격한 것으로 여겨지도록, 최소 임계 스코어를 포함할 수도 있다.

상기 식 1을 적용함으로써, 통계적 모델은, 크로스-컨텍스트 공통성을 레버리징하기 위하여 여러 가지 컨텍스트로부터 트레이닝 데이터의 풀링(pooling)을 허용하고, 데이터 부족 문제를 완화시킨다. 모델이 하나의 특정 컨텍스트(예컨대, 메시지 수신자)에서 충분한 데이터가 없으면, 데이터는, 입력을 리포맷팅하기 위한 방법에 대하여 사용자에게 인텔리전트한 권고를 제공하기 위하여 하나 이상의 다른 컨텍스트(예컨대, 소셜-네트워크 그룹 또는 사용자 히스토리) 내에 여전히 존재한다. 즉, 모델은 더 넓은 범위의 소스로부터의 데이터를 포함하는 더 일반적인 컨텍스트에 적절하게 디폴트할 수 있다.

도 3을 참조하면, 본 발명의 실시형태에 따라서 수행되는 일련의 단계 또는 동작을 포함하는 흐름도가 도시된다. 도 3에서의 일련의 단계는, 하나 이상의 컨텍스트에 기초하여 입력을 리포맷팅하는 방법 또는 프로세스(300)를 포함한다. 본 발명은 도 3에서 개략화된 단계를 포함하는 컴퓨터-구현된 방법으로서 실행될 수도 있다. 본 발명은 또한 도 3에서의 약술된 동작을 수행하도록 프로그래밍되는 컴퓨팅 디바이스로서 구현될 수도 있다. 다른 실시형태에서, 본 발명은, 컴퓨팅 디바이스에 의해 수행될 때, 방법(310)을 수행하는 컴퓨터-실행가능한 명령어를 저장한 컴퓨터-저장 디바이스를 포함한다. 방법 310을 설명할 때, 도 2가 또한 참조된다.

방법 310에서, 단계 312는 애플리케이션에 제출되었던 입력을 수신하는 것을 포함한다. 예컨대, 입력(225)은 입력 리포맷터(244)에 의해 또는 입력 리포맷터(227)에 의해 수신될 수도 있다. 즉, 클라이언트측 입력 리포맷터(224)는, 이것이 컴퓨팅 디바이스(212)에 공급될 때 입력(225)을 수신할 수 있거나, 또는 서버측 입력 리포맷터는 컴퓨팅 디바이스(212)로부터 입력(225)을 수신할 수도 있다. 애플리케이션(222)은, 메시징 애플리케이션(예컨대, 이메일 또는 문자 메시지), 워드-프로세싱 애플리케이션, 웹 브라우저, 모바일 애플리케이션 등과 같은 하나 이상의 여러 가지 애플리케이션일 수도 있다.

단계 314는 입력을 재포맷화하기 위한 제안으로서 사용될 하나 이상의 출력을 식별하는 것을 포함한다. 예컨대, 입력 리포맷터(224)는 데이터스토어(240) 내의 입력과 연관되는 컨텍스트-독립 출력을 검색하거나, 또는 입력 리포맷터(227)는 데이터스토어(242)로부터 컨텍스트-독립 출력(246)을 검색할 수도 있다.

단계 316은 입력과 각 출력의 각각의 조합에 대하여 통계적 모델을적용함으로써 하나 이상의 출력 중 각 출력의 각각의 스코어를 결정하는 것을 포함한다. 각각의 스코어는 각각의 조합의 복수의 컨텍스트-지정 스코어를 수량화하는 복수의 항을 포함한다. 예컨대, 입력 리포맷터(224 또는 227)는 식 1을 적용할 수도 있고, 이는 입력이 각각의 출력에 리포맷팅된 특정 컨텍스트의 선형 조합을 통계적으로 모델링한다.

컨텍스트-지정 스코어에 의해 수량화되는 컨텍스트의 예는, 특정 사용자의 히스토리를 포함하며, 여기서 컨텍스트-지정 스코어는 입력이 특정 사용자에 의해 각각의 출력에 대하여 리포맷팅된 빈도를 수량화한다. 예컨대, 입력을 포맷하는 사용자의 동작은 특정 사용자와 연관되는 프로파일 하에서 저장될 수도 있다. 이렇게 저장된 동작은 그 후에 상기 입력 리포맷터가 통계적 모델을 적용할 때 고려된다. 컨택스트-지정 스코어에 의해 수량화되는 컨텍스트의 다른 예는, 입력이 애플리케이션(예컨대, 이메일 애플리케이션)의 컨텍스트에서의 각각의 출력에 대하여 리포맷팅되는 빈도를 포함한다.

단계 318에서, 하나 이상의 제안된 출력은 각각의 스코어에 기초하여 하나 이상의 출력 중에서 선택된다. 예컨대, 입력 리포맷터(224 또는 227)는 각각의 스코어에 기초하여 출력을 순위 평가하고, 최고 수(예컨대, 최고 4) 출력을 선택할 수도 있다. 즉, 각각의 스코어는 서로 비교될 수도 있고, 각각의 스코어 중에서 가장 높은 각각의 스코어(예컨대, 미리 설정된 양)의 그룹에 대응하는 하나 이상의 제안된 출력이 선택될 수도 있다. 단계 320은 입력을 리포맷하기 위한 옵션으로서 하나 이상의 제안된 출력을 제공하는 것을 포함한다. 하나 이상의 출력은 출력 디바이스(220)를 경유하여 제공될 수도 있다. 예컨대, 도 2에서, 제안된 출력(228)은 제안된-출력의 드롭다운 메뉴(227)에 있어서 디스플레이 디바이스 상에 디스플레이된다.

도시되지 않은 구성요소뿐만 아니라 도시된 여러 가지 구성요소의 많은 상이한 배열은, 이하의 청구범위의 범위를 벗어나지 않고 형성될 수 있다. 본 기술의 실시형태를 제안적이기 보다는 예시적인 의로도 설명하였다. 대안적인 실시형태는 실시형태를 판독한 이후에 그리고 실시행태를 판독하였기 때문에 이러한 개시의 독자에게 명백하게 된다. 전술한 내용을 구현하는 대안적인 수단은 이하의 청구항들의 범위로부터 벗어나지 않고 완성될 수 있다. 어떤 특징 및 부결합은 유용성을 가지며, 다른 특징 및 부결합을 참조하지 않고 사용될 수도 있으며, 그리고 청구항들의 범위 내에서 고려된다.

Claims

하나 이상의 컨텍스트에 기초하여 입력을 리포맷팅하는 방법에 있어서,
입력이 컴퓨팅 디바이스 상에서 동작하는 애플리케이션에 제출되었을 때 상기 입력을 입력-리포맷팅 애플리케이션에 의해 수신하는 단계와,
상기 입력-리포맷팅 애플리케이션에 의해, 상기 입력을 리포맷팅하기 위한 발생가능한 제안을 포함하는 복수의 출력을 식별하는 단계와,
상기 입력 및 각 출력의 각각의 조합에 통계적 모델을 적용함으로써 상기 복수의 출력 중 각 출력의 각각의 스코어를 결정하는 단계로서, 각 스코어는 각 조합의 복수의 컨텍스트를 수량화하는 복수의 컨텍스트 스코어를 포함하며, 상기 복수의 컨텍스트는 상기 컴퓨팅 디바이스 상에서 동작하는 상기 애플리케이션에 대하여 적어도 부분적으로 독립적인 애플리케이션-독립 컨텍스트를 포함하는 것인, 상기의 스코어를 결정하는 단계와,
상기 각각의 스코어에 기초하여 상기 하나의 이상의 출력으로부터 하나 이상의 제안된 출력을 선택하는 단계로서, 상기 제안된 출력 중 적어도 하나의 각각의 스코어는 상기 애플리케이션-독립 컨텍스트에 기초하는 것인, 상기 하나 이상의 제안된 출력을 선택하는 단계와,
상기 애플케이션-독립형 컨텍스트에 기초하여 상기 각각의 스코어를 가진 상기 제안된 출력 중 적어도 하나를 포함하여, 상기 입력을 리포맷팅하기 위한 옵션으로서 상기 하나 이상의 제안된 출력을 제공하는 단계
를 포함하는 입력 리포맷팅 방법.
제1항에 있어서, 상기 복수의 컨텍스트는 일반적인-파퓰레이션(population) 컨텍스트, 사용자-지정 컨텍스트, 사용자-그룹 컨텍스트, 및 메시지-수신자 컨텍스트를 포함하는 것인 입력 리포맷팅 방법.
제1항 또는 제2항에 있어서, 상기 복수의 컨텍스트는 수직 도메인을 포함하는 것인 입력 리포맷팅 방법.
제1항 내지 제3항 중 어느 한 항에 있어서, 각 컨텍스트 스코어는 컨택스트 스코어에 의해 수량화된 각각의 컨텍스트에 적용되는 각각의 중량을 포함하는 것인 입력 리포맷팅 방법.
제1항 내지 제4항 중 어느 한 항에 있어서, 각각의 컨텍스트 스코어는, 상기 각각의 컨텍스트 하에서 상기 입력이 상기 입력으로부터 상기 각각의 출력으로 리포맷팅되었던 각각의 히스토리컬 빈도를 포함하는 것인 입력 리포맷팅 방법.
제1항에 있어서, 상기 복수의 컨텍스트 중 하나의 컨텍스트는 상기 애플리케이션을 포함하는 것인 입력 리포맷팅 방법.
제6항에 있어서, 상기 애플리케이션은 메시징 애플리케이션을 포함하는 것인 입력 리포맷팅 방법.
제1항에 있어서, 상기 하나 이상의 제안된 출력은, 자동-교정 옵션, 자동-완성 옵션, 역텍스트 정규화 옵션, 스피치/텍스트 번역, 또는 이들의 조합을 제공하는 것인 입력 리포맷팅 방법.
컴퓨팅 디바이스에 의해 실행될 때, 제1항의 방법을 실행하는 동작을 수행하는 컴퓨터-실행가능한 명령어를 저장하는 컴퓨터 저장 매체.
컴퓨팅 디바이스에 의해 실행될 때, 제1항의 방법을 실행하는 동작을 수행하는 컴퓨터-실행가능한 명령어와 결합된 프로세스를 가지는 컴퓨팅 디바이스.
제1항에 있어서, 상기 복수의 컨텍스트 스코어는, 일반적인 컨텍스트, 히스토리컬-사용자-선택 컨텍스트, 및 도메인 컨텍스트를 표현하며, 이들의 각각은, 통계적 모델 내에서 조합될 때 각각의 중량에 의해 인수화되며, 각 항의 각각의 중량은 상기 통계적 모델을 튜닝하도록 맞춤화될 수 있는 것인 입력 리포맷팅 방법.
제1항에 있어서, 상기 하나 이상의 제안된 출력을 선택하는 단계는, 각각의 스코어를 서로 비교하는 단계와, 각각의 스코어 중에서 가장 높은 것이 되는 각각의 스코어의 그룹에 대응하는 하나 이상의 제안된 출력을 선택하는 단계를 포함하며, 상기 그룹은 미리 설정된 양을 포함하는 것인 입력 리포맷팅 방법.
제1항에 있어서, 상기 하나 이상의 제안된 출력을 선택하는 단계는, 상기 각각의 스코어가 최소 스코어 임계값을 초과한다라고 결정하는 단계를 포함하며, 상기 최소 스코어 임계값을 초과하지 않는 각각의 스코어는 리포맷에 대한 옵션으로 제공되기에 부적격한 것으로 여겨지는 것인 입력 리포맷팅 방법.
제7항에 있어서, 상기 입력은 메시징 애플리케이션을 이용하여 드래프팅된 메시지의 몸체(body)를 포함하는 것인 입력 리포맷팅 방법.
제14항에 있어서, 각각의 스코어는 상기 메시지가 송신되도록 지정되는 특정 수신자의 컨텍스트에서 각각의 출력에 대하여 상기 입력이 재포맷팅되어 있는 빈도를 수량화하는 각각의 조합의 또 다른 히스토리 스코어를 더 포함하는 입력 리포맷팅 방법.