KR101854381B1 - 텍스트의 컨텍스트에 민감한 정의의 제공 - Google Patents

텍스트의 컨텍스트에 민감한 정의의 제공 Download PDF

Info

Publication number
KR101854381B1
KR101854381B1 KR1020137018134A KR20137018134A KR101854381B1 KR 101854381 B1 KR101854381 B1 KR 101854381B1 KR 1020137018134 A KR1020137018134 A KR 1020137018134A KR 20137018134 A KR20137018134 A KR 20137018134A KR 101854381 B1 KR101854381 B1 KR 101854381B1
Authority
KR
South Korea
Prior art keywords
term
definitions
text
context
user
Prior art date
Application number
KR1020137018134A
Other languages
English (en)
Other versions
KR20140003462A (ko
Inventor
토마스 지. 오닐
Original Assignee
구글 엘엘씨
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 구글 엘엘씨 filed Critical 구글 엘엘씨
Publication of KR20140003462A publication Critical patent/KR20140003462A/ko
Application granted granted Critical
Publication of KR101854381B1 publication Critical patent/KR101854381B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • User Interface Of Digital Computer (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

본 발명은 사용자에게 정의들을 제공하기 위한 시스템 및 기술에 관한 것이다. 이 제공은 정의된 용어가 나타나는 텍스트의 컨텍스를 구체화한다. 한 양태에서, 시스템은 동작들을 수행함으로써 제1 용어의 사용자 선택의 수신에 응답하도록 프로그래밍된 하나 이상의 데이터 프로세싱 장치를 포함하는 전자 장치를 포함한다. 동작들은 하나 이상의 영구 데이터 저장 장치로부터 텍스트들의 컨텍스트들의 특성화들을 액세스하는 것과, 텍스트들의 컨텍스트들의 액세스된 특성화들을 미디어 파일의 텍스트 컨텐츠의 컨텍스트의 하나 이상의 특징들과 비교하는 것과, 정의들이 미디어 파일의 텍스트 컨텐츠 내의 제1 용어의 용법을 적절하게 특성화할 각각의 가능성들에 따라 제1 용어의 정의들을 랭킹하는 것을 포함한다.

Description

텍스트의 컨텍스트에 민감한 정의의 제공{PROVIDING DEFINITIONS THAT ARE SENSITIVE TO THE CONTEXT OF A TEXT}
본 명세서는 전자책 리더 또는 다른 전자 장치에 의한 정의의 제공에 관한 것이다.
사용자들은 여러 상이한 전자 장치들에 의해 표시되는 텍스트 컨텐츠를 읽을 수 있다. 예를 들어, 브라우저는 인터넷 또는 그밖의 다른 곳에서 이용가능한 전자 문서를 랜더링(rendering)할 수 있다. 전용 "북 리더(book reader)" 하드웨어 플랫폼들은 전자 책들 및 다른 전자 미디어를 표시할 수 있다. 전용 하드웨어 플랫폼의 기능과 유사한 기능을 갖는 소프트웨어 어플리케이션들이 휴대용 전자 장치 상에서 실행할 수 있다.
텍스트 컨텐츠를 표시하는 여러 전자 장치들은 또한 텍스트 내의 용어들의 사전 룩업(dictionary look-ups)을 제공한다. 예를 들어, 사용자는 표시된 텍스트 내의 용어를 하이라이트하거나 그렇지 않으면 표시된 텍스트 내의 용어를 선택할 수 있다. 응답하여, 전자 장치는 선택된 용어의 정의를 룩업하여 그 정의를 표시한다. 하나 이상의 정의가 이용가능하다면, 전자 장치들은 하나씩 또는 함께 정의를 제공할 수 있다.
본 명세서는 사용자에 대한 정의의 제공에 관련한 기술들을 기재하고 있다. 이 제공은 정의된 용어가 나타나는 텍스트의 컨텍스트를 구체화한다.
제1 양태에서, 시스템은 미디어 파일의 텍스트 컨텐츠를 표시하도록 구성된 하나 이상의 디스플레이 화면, 제1 용어의 사용자 선택을 수신하도록 구성된 하나 이상의 입력 엘리먼트, 및 동작을 수행함으로써 제1 용어의 사용자 선택의 수신에 응답하도록 프로그래밍된 하나 이상의 데이터 프로세싱 장치를 포함한다. 이 동작은 하나 이상의 영구 데이터 저장 장치로부터 텍스트들의 컨텍스트들의 특성화(characterizations)들을 액세스하는 것과, 텍스트들의 컨텍스트들의 특성화들을 미디어 파일의 텍스트 컨텐츠의 컨텍스트의 하나 이상의 특성과 비교하는 것과, 정의가 미디어 파일의 테스트 컨텐츠 내의 제1 용어의 용법(usage)을 적절하게 특성화하는 각각의 가능성들에 따라 제1 용어의 정의를 랭킹(ranking)하는 것을 포함한다.
제2 양태에서, 하나 이상의 데이터 프로세싱 장치의 시스템에 의해 방법이 수행된다. 이 방법은 시스템에 의해, 시스템에 표시되는 텍스트에서 발견된 용어의 사용자 선택을 수신하는 단계, 시스템에 의해, 텍스트의 역사적 컨텍스트, 텍스트의 지리적 컨텍스트, 또는 텍스트의 주제 컨텍스트 중 하나 이상을 판정하는 단계, 시스템에 의해, 텍스트의 역사적, 지리적, 및 주제 컨텍스트들 중 하나 이상을 선택된 용어의 상이한 정의들의 하나 이상의 특징들과 비교하는 단계, 시스템에 의해, 비교의 결과에서 적어도 부분을 기초로 하여 상기 선택된 용어의 상이한 정의들을 랭킹하는 단계, 및 시스템에 의해, 상이한 정의들의 랭킹에 따라 상이한 정의들 중 하나 이상을 표시하는 단계를 포함한다.
제3 양태에서, 전자 장치의 시스템은 상이한 텍스트들 내의 제1 용어의 용법을 특성화하기 위한 상이한 정의들의 적절성 또는 부적절성의 사용자 확인들을 수신하도록 프로그래밍된 하나 이상의 데이터 프로세서와, 사용자 확인들과 상이한 텍스트들을 특성화하는 메시지들을 출력하도록 구성된 통신 인터페이스를 포함한다.
제4 양태에서, 하나 이상의 데이터 프로세싱 장치의 시스템에 의해 구현되는 방법은 시스템에서 복수의 원격 전자 장치로부터, 상이한 텍스트들 내의 제1 용어의 용법들을 특성화하기 위한 상이한 정의들의 적절성 또는 부적절성의 사용자 확인들을 특성화하는 복수의 메시지를 수신하는 것과, 정의들과 텍스트들을 하나 이상의 영구 데이터 저장 장치에 특성화하는 정보를 저장하는 것과, 시스템에 의해, 상이한 정의들이 제1 용어의 용법을 적절하게 특성화할 가능성들을 나타내는 가중치들을 결정하도록 하나 이상의 영구 데이터 저장 장치에 저장된 정보를 분석하는 것과, 시스템으로부터 상기 가중치들을 출력하는 것을 포함한다.
제5 양태에서, 데이터 통신망 상의 서버 시스템은 제1 용어의 다수의 정의들을 저장하는 하나 이상의 영구 데이터 저장 장치 - 정의들 각각은 정의가 제1 용어의 용법을 적절하게 특성화하는 텍스트들의 컨텍스트의 특성화와 연관되어 저장됨 - 와, 원격 전자 장치에서 표시되는 제1 텍스트의 특성화 및 제1 텍스트의 제1 용여의 식별을 수신하는 데이터 통신 엘리먼트 - 제1 용어는 정의 제공을 위해 선택되었음 - 와, 동작들을 수행함으로써 제1 용어의 식별과 제1 텍스트의 특성화의 수신에 응답하도록 프로그래밍되는 하나 이상의 데이터 프로세싱 장치를 포함한다. 이 동작들은 하나 이상의 영구 데이터 저장 장치로부터 제1 용어의 정의들과 연관되어 저장되는 텍스트들의 컨텍스트들의 특성화들을 액세스하고, 텍스트들의 컨텍스트들의 액세스된 특성화들을 제1 용어의 컨텍스트의 하나 이상의 특징들과 비교하고, 정의들이 제1 텍스트 내의 제1 용어의 용법을 적절하게 특성화할 각각의 가능성들에 따라 제1 용어의 정의를 랭킹하는 것을 포함한다.
제1, 제2, 제3, 제4, 제5, 및 다른 양태들은 하나 이상의 다음의 특징들을 포함한다. 전자 장치는 제1 용어의 다수의 정의들을 저장하는 하나 이상의 영구 데이터 저장 장치와 텍스트 컨텐츠를 포함하는 미디어 파일을 포함할 수 있다. 전자 장치는 제1 용어의 다수의 정의들 및 하나 이상의 영구 데이터 저장 장치로부터의 텍스트 컨텐츠를 포함하는 미디어 파일을 액세스할 수 있는 하나 이상의 데이터 통신 장치를 포함할 수 있다. 각각의 정의들은 정의가 제1 용어의 용법을 적절하게 특성화하는 텍스트들의 컨텍스트의 특성화와 연관되어 저장될 수 있다. 텍스트 컨텐츠는 제1 용어를 포함할 수 있다. 제1 용어의 다수의 정의는 상이한 사전에 저장될 수 있다. 다수의 사전들 각각은 상이한 컨텍스트들에서 용어 용법을 적절하게 특성화하는 정의들을 포함할 수 있다. 미디어 파일들은 텍스트 컨텐츠를 특성화하는 메타데이터를 포함할 수 있다. 하나 이상의 데이터 프로세싱 장치는 텍스트 컨텐츠의 컨텍스트의 하나 이상의 특징들을 판정하기 위해 메타데이터를 액세스하도록 프로그래밍될 수 있다. 텍스트 컨텐츠의 컨텍스트의 하나 이상의 특징은 텍스트 컨텐츠 내에서 발견된 인디케이션들로부터 판정될 수 있다. 제1 용어의 컨텍스트는 미디어 파일의 텍스트 컨텐츠 내에서 판정될 수 있다. 정의들은 텍스트 컨텐츠 내의 제1 용어의 판정된 컨텍스트와, 텍스트들의 컨텍스트들의 특성화들과 텍스트 컨텐츠의 컨텍스트의 하나 이상의 특징들의 비교의 결과 모두를 기초로 랭킹될 수 있다. 시스템은 미디어 파일의 텍스트 컨텐츠 내의 제1 용어의 의미론적 컨텍스트를 판정하는 의미론적 분석기를 포함할 수 있다. 정의들 중 적어도 몇몇은 시간 기간의 특성화들에 연관되어 저장될 수 있다. 하나 이상의 데이터 프로세싱 장치는 텍스트가 저작되었을 때의 일자와 시간 기간을 비교하도록 프로그래밍될 수 있다. 하나 이상의 데이터 프로세싱 장치는 텍스트들의 컨텍스트들의 특성화들을 판정하기 위해 미디어 파일들의 텍스트 컨텐츠를 분석하도록 프로그래밍될 수 있다. 적어도 몇몇의 정의들은 주제의 특성화들과 연관되어 저장될 수 있다. 하나 이상의 데이터 프로세싱 장치는 주제를 미디어 파일의 텍스트 컨텐츠의 주제와 비교하도록 프로그래밍될 수 있다. 적어도 몇몇의 정의들은 지리적 컨텍스트의 특성화들과 연관되어 저장될 수 있다. 하나 이상의 데이터 프로세싱 장치는 정의들과 연관된 지리적 컨텍스트를 미디어 파일의 텍스트 컨텐츠의 지리적 컨텍스트와 비교하도록 프로그래밍된다. 시스템은 표시된 정의의 적절성 또는 부적절성의 사용자 확인을 수신할 수 있다. 텍스트 내에서 발견된 제2 용어의 사용자 선택이 수신될 수 있다. 시스템은 제1 용어의 정의의 적절성 또는 부적절성의 사용자 확인에서 적어도 부분을 기초로 제2 용어의 상이한 정의들을 랭킹할 수 있다. 시스템은 제2 용어의 상이한 정의들의 랭킹에 따라 제2 용어의 하나 이상의 상이한 정의를 표시할 수 있다. 표시된 정의의 적절성 또는 부적절성의 사용자 확인을 특성화하는 메시지가 원격 사전 데이터 시스템으로 전송될 수 있다. 텍스트의 하나 이상의 역사적, 지리적, 및 주제 컨텍스트들은 텍스트의 하나 이상의 역사적, 지리적, 및 주제 컨텍스트들의 텍스트 인디케이션들에 대해 텍스트를 탐색함으로써 판정될 수 있다. 텍스트의 하나 이상의 역사적, 지리적, 및 주제 컨텍스트들은 텍스트를 포함하는 미디어 파일 내의 메타데이터를 액세스하고 메타데이터를 텍스트 인디케이션들과 비교함으로써 판정될 수 있다. 시스템은 복수의 전자 장치에 의해 출력되는 메시지들을 수신하도록 구성된 통신 인터페이스와 복수의 전자 장치로부터 수신되는 사용자 확인들의 특성화들을 저장하는 하나 이상의 영구 데이터 저장 장치를 포함하는 사전 데이터 시스템을 포함할 수 있다. 전자 장치, 또는 다수의 전자 장치들 각각은 제1 용어의 다수의 정의들을 저장하는 하나 이상의 영구 데이터 저장 장치 - 정의들 각각은 정의가 제1 용어의 용법과 제1 용어를 포함하는 텍스트 컨텐츠를 포함하는 미디어 파일을 적절하게 특성화하는 텍스트의 컨텍스트의 특성화와 연관되어 저장됨 - 와, 미디어 파일의 텍스트 컨텐츠를 표시하도록 구성되는 하나 이상의 디스플레이 화면과, 제1 용어의 사용자 선택을 수신하도록 구성되는 하나 이상의 입력 엘리먼트와, 동작들을 수행함으로써 제1 용어의 사용자 선택의 수신에 응답하도록 프로그래밍되는 하나 이상의 데이터 프로세싱 장치를 포함할 수 있다. 동작들은 하나 이상의 영구 데이터 저장 장치로부터 텍스트들의 컨텍스트들의 특성화를 액세스하는 것과, 텍스트들의 컨텍스트들의 액세스된 특성화들을 미디어 파일의 텍스트 컨텐츠의 컨텍스트의 하나 이상의 특징과 비교하는 것과, 정의들이 미디어 파일의 텍스트 컨텐츠 내에서 제1 용어의 용법을 적절하게 특성화할 각각의 가능성들에 따라 제1 용어의 정의들을 랭킹하는 것을 포함할 수 있다. 원격 전자 장치들 중 적어도 몇몇으로 가중치들을 배포함으로써 가중치들이 출력될 수 있다.
하나 이상의 구현의 세부사항이 첨부 도면을 참조로 설명될 것이다. 다른 특징, 양태, 및 장점은 발명의 상세한 설명, 도면, 및 특허청구의 범위로부터 명백해질 것이다.
도 1은 사용자에 의해 읽혀질 텍스트 컨텐츠를 표시할 수 있는 디스플레이 화면을 포함하는 전자 장치의 개략도.
도 2, 3, 및 4는 도 1의 전자 장치에 의해 선택된 용어들의 정의의 컨텍스트 민감 제공을 도시한 개략도.
도 5는 용어의 하나 이상의 정의 제공 시에 텍스트의 컨텍스트에 민감한 도 1의 전자 장치의 한 구현 예의 개략도.
도 6은 도 5의 전자 장치의 미디어 파일 저장소 내에 저장될 수 있는 일반적인 미디어 파일의 개략도.
도 7-10은 용어 정의의 컨텍스트-민감 제공에 적합한 사전 데이터의 콜렉션들의 개략도.
도 11은 용어가 나타나는 텍스트의 컨텍스트에 민감한 용어들의 정의들의 제공을 위한 프로세스의 플로우 차트.
도 12는 용어의 하나 이상의 정의 제공 시에 텍스트의 컨텍스트에 민감한 도 1의 전자 장치의 다른 구현 예의 개략도.
도 13은 용어가 나타나는 텍스트의 컨텍스트에 민감한 용어들의 정의들의 제공을 위한 프로세스의 플로우 차트.
도 14는 정의의 적절성 또는 부적절성의 사용자 확인들의 특성화들을 저장할 수 있는 시스템의 예의 개략도.
도 15는 정의의 적절성 또는 부적절성의 사용자 확인들의 특성화들이 저장된 데이터 콜렉션의 개략도.
도 16은 용어의 하나 이상의 정의 제공 시에 텍스트의 컨텍스트에 민감한 전자 장치의 다른 구현 예의 개략도.
(여러 도면들에서 동일한 참조 번호 및 지시는 동일한 엘리먼트를 나타낸다)
도 1은 사용자에 의해 읽혀질 텍스트 컨텐츠를 표시할 수 있는 디스플레이 화면(105)을 포함하는 전자 장치(100)의 개략도이다. 전자 장치(100)는 예를 들어, 데스크 또는 랩탑 컴퓨터, 스마트폰, PDA, 전용 북 리더 등일 수 있다. 전자 장치(100)는 하우징(110) 및 화면(105) 상에 표시되는 텍스트 컨텐츠 내의 용어를 선택하는 능력을 사용자에게 제공하는 하나 이상의 입력 엘리먼트(115)를 포함한다. 하우징(110)은 디스플레이 화면(105) 및 입력 엘리먼트(115)를 지지하고 선택된 용어의 하나 이상의 정의를 제공함으로써 사용자 선택에 응답하는 전자 컴포넌트들의 집합체(120)를 하우징한다. 다음에서 더 설명되는 바와 같이, 이러한 제공은 표시된 텍스트 컨텐츠의 컨텍스트에 민감하다.
입력 엘리먼트(115)는 사용자로부터 입력을 수신할 수 있는 입력 장치이다. 입력 엘리먼트(115)는 하나 이상의 키, 패드, 트랙볼, 또는 사용자로부터 기계적, 오디오, 또는 다른 입력을 수신하는 다른 컴포넌트를 포함할 수 있다. 몇몇의 구현에서, 입력 엘리먼트(115)는 디스플레이 화면(105)을 포함할 수 있다. 특히, 디스플레이 화면(105)은 사용자의 손가락 또는 다른 엘리먼트들의 위치 및 이동을 감지함으로써 입력 및 출력 모두로서 동작하는 터치 스크린일 수 있다. 감지된 정보는 사용자가 전자 장치(100)에 의해 제공된 기능을 액세스하도록 번역될 수 있다. 다음에서 더 설명되는 바와 같이, 몇몇의 구현에서, 입력 엘리먼트(115)와의 사용자 상호작용은 하나 이상의 정의의 컨텍스트-민감 제공을 위해 화면(105) 상에 표시되는 용어를 선택하는 것 뿐만 아니라, 제공되었던 정의의 적절성 또는 부적절성을 확인하는 것에도 효과적일 수 있다.
집합체(120)는 입력 엘리먼트들(115)과의 사용자 상호작용을 해석할 뿐만 아니라 사용자 상호작용에 응답하여 데이터 프로세싱 및 다른 동작을 수행하도록 구성되는 하드웨어 컴포넌트들, 소프트웨어 컴포넌트들, 또는 하드웨어 및 소프트웨어 컴포넌트들의 조합을 포함할 수 있다. 이 동작들은 텍스트 컨텐츠의 컨텍스트에 민감한 정의 제공 및 상이한 컨텍스트들에서 용어들의 정의들의 적절성 또는 부적절성의 확인들을 수신 및 핸들링을 포함할 수 있다.
도 2, 3, 및 4는 전자 장치(100)에 의해 선택된 용어들의 정의들의 컨텍스트-민감 제공을 개략적으로 도시하고 있다. 도 2에서, 전자 장치(100)는 디스플레이 화면(105) 상에 표시된 제1 텍스트(210)(즉, "text_1") 내의 용어(205)(즉, "server")의 사용자 선택을 수신하였다. 이 사용자 선택은 용어(205)의 정의(215)의 제공을 트리거한다. 도 3에서, 제2 텍스트(310)(즉, "text_2") 내에서라도, 전자 장치(300)는 동일한 용어(205)(즉, "server")의 사용자 선택을 수신하였다. 이 사용자 선택은 용어(205)의 제2 정의(315)의 제공을 트리거한다. 도시된 바와 같이, 정의(315)는 정의(215)와 다르다. 도 4에서, 제3 텍스트(410)(즉, "text_3") 내에서라도, 전자 장치(100)는 동일한 용어(205)(즉, "server")의 사용자 선택을 수신하였다. 이 사용자 선택은 용어(205)의 제3 정의(415)의 제공을 트리거한다. 도시된 바와 같이, 정의(415)는 정의들(215, 315) 모두와 다르다.
이와 같이 상이한 정의들(215, 315, 415)이 동일한 용어(205)의 사용자 선택에도 불구하고 전자 장치(100)에 의해 제공된다. 특히, 정의들(215, 315, 415)의 제공은 용어(205)가 나타나는 텍스트가 변화함에 따라 변화한다. 사용자는 단지 단일 용어(205)만을 선택하지만, 전자 장치(100)는 용어(205)가 상이한 정의들(215, 315, 415)을 제공하도록 나타나는 텍스트들(210, 310, 410)의 특징들을 사용한다. 다음에서 더 설명되는 바와 같이, 이러한 특징들은 더 넓은 컨텍스트(broader context) 내의 텍스트들(210, 310, 410) 자신의 컨텍스트 환경 뿐만 아니라 텍스트들(210, 310, 410) 내의 용어(205) 사용을 특성화할 수 있다.
정의들(215, 315, 415)은 디스플레이 화면(105)의 하부에 표시되어 도시되며, 정의들(215, 315, 415)은 또한 예를 들어, 사이드바, 팝업 윈도우, 또는 디스플레이 화면(105) 상의 어디서나 표시될 수 있다. 또한, 몇몇의 구현에서, 하나 이상의 정의가 디스플레이 화면(105) 상에 표시된다.
도 5는 용어의 하나 이상의 정의 제공 시에 텍스트의 컨텍스트에 민감한 전자 장치(100)의 한 구현 예의 개략도이다. 도시된 구현에서, 전자 컴포넌트 집합체(120)는 디지털 데이터 프로세서(505), 사전 데이터 저장소(510), 어플리케이션 명령 저장소(515), 및 미디어 파일 저장소(520)를 포함한다. 디지털 데이터 프로세서(505)는 기계 판독가능 명령들의 하나 이상의 셋에 따라 동작을 수행하는 하나 이상의 데이터 프로세싱 장치의 시스템이다. 예를 들어, 디지털 데이터 프로세서(505)는 어플리케이션 명령 저장소(515) 내에 저장된 기계 판독가능 명령들에 따라 동작들을 수행한다. 어플리케이션 명령 저장소(515)는 어플리케이션들을 구현하기 위한 기계 판독가능 명령들을 저장하는 하나 이상의 영구 데이터 저장 장치의 집합체이다. 디지털 데이터 프로세서(505)에 의해 구현될 수 있는 어플리케이션들 중에는 디스플레이 매니저(525), 입력 번역기(530), 리더 어플리케이션(535), 및 정의 파인더 어플리케이션(540)이 있다. 프로세서(505)는 디지털 전자 회로를 사용하여, 또는 컴퓨터 소프트웨어, 펌웨어, 하드웨어, 또는 그 조합으로 구현될 수 있다.
디스플레이 매니저(525)는 디스플레이 화면(105) 상에 텍스트 및 다른 컨텐츠를 제공하도록 데이터 프로세서(505)를 구성하는 소프트웨어 컴포넌트이다. 디스플레이 매니저(525)는 예를 들어, 리더 어플리케이션(535)으로부터 컨텐츠를 표시하기 위한 명령들을 수신할 수 있다. 이 명령들은 디스플레이 매니저(525)가 P를 들어, 전자 책, 기사, 및 다른 전자 문서를 포함하는 미디어 파일 저장소(520)에서 발견된 컨텐츠를 표시하도록 한다.
입력 번역기(530)는 입력 엘리먼트(115)와의 사용자 상호작용을 해석하도록 데이터 프로세서(505)를 구성하는 소프트웨어 컴포넌트이다. 예를 들어, 입력 번역기(530)는 용어의 하나 이상의 정의의 컨텍스트-민감 제공을 트리거하는 용어의 사용자 선택으로서 사용자 상호작용을 해석하는지를 판정하도록 데이터 프로세서(505)를 구성할 수 있다. 다른 예로서, 몇몇의 구현에서, 입력 번역기(530)는 입력 엘리먼트들(115) 위에서 수신되었던 용어의 정의의 적절성 또는 부적절성의 사용자 확인을 인식하도록 데이터 프로세서(505)를 구성할 수 있다.
리더 어플리케이션(535)은 사용자에 의해 리딩을 위해 디스플레이 화면(105) 상에 텍스트 및 다른 컨텐츠를 표시하도록 데이터 프로세서(505)를 구성하는 소프트웨어 컴포넌트이다. 예를 들어, 리더 어플리케이션(535)은 사용자가 표시되는 컨텐츠를 선택하고, 표시된 컨텐츠를 탐색(navigate)하고, 타이틀, 저자, 출처 등과 같은 컨텐츠를 특성화하는 정보를 보도록 하는 기능을 제공할 수 있다. 리더 어플리케이션(535)은 또한 리더 어플리케이션(535)의 지시 하에서 표시되는 텍스트의 컨텍스트에 민감한 용어들의 정의들의 표시를 트리거하는 디스플레이 매니저(525)에 정보를 제공할 수 있다.
정의 파인더(540)는 사전 데이터 저장소(130) 내에 용어들에 대한 컨텍스트-민감 정의들을 위치시키도록 데이터 프로세서(125)를 구성하는 소프트웨어 컴포넌트이다. 정의 파인더(165)는 용어와 용어가 사전 데이터 저장소(130) 내에서 정의로 나타나는 텍스트의 컨텍스트를 매칭시킴으로써 정의들을 위치시킨다. 정의 파인더(165)는 예를 들어, 사전 데이터 저장소(130)의 스트럭쳐링 (structuring) 및 매칭되는 컨텍스트에 따라 정의들을 위치시키기 위해 다양한 상이한 접근법들을 사용할 수 있다. 이러한 접근법들의 예들은 다음에서 더 설명된다.
미디어 파일 저장소(520)는 텍스트 컨텐츠를 포함하는 미디어 파일들을 저장하는 하나 이상의 영구 데이터 저장 장치의 집합체이다. 저장소(520) 내의 미디어 파일들은 예를 들어, 전자 책, 기사, 또는 텍스트를 포함하는 다른 아이템일 수 있다. 저장소(520) 내의 미디어 파일들은 예를 들어, 텍스트, 하이퍼텍스트, TOMERAIDER 포맷, KINDLE 포맷, LIBRIS, 및 다른 것들을 포함하는 다양한 다른 포맷들로 저장될 수 있다.
도 6은 미디어 파일 저장소(520) 내에 저장될 수 있는 일반적인 미디어 파일(600)의 개략도이다. 미디어 파일(600)은 미디어 컨텐츠(605)와 메타데이터(610) 모두를 포함한다. 미디어 컨텐츠(605)는 예를 들어, 디스플레이 화면(105) 상에 표시될 수 있는 텍스트를 특성화하는 정보를 포함한다. 메타데이터(610)는 전체로서 미디어 컨텐츠(605)를 특성화하는 정보를 포함한다. 예를 들어, 메타 데이터(610)는 미디어 컨테트(605) 내의 타이틀, 저자, 및 발행일을 특성화하는 정보를 포함할 수 있다. 몇몇의 구현에서, 메타 데이터(610)는 또한 예를 들어, 출판사, 출판사 주소, 인쇄 지역, ISBN 번호, 저자의 생일 등을 포함하는 미디어 컨텐츠(605)를 특성화하는 추가 정보를 포함할 수 있다. 몇몇의 구현에서, 미디어 컨텐츠(605) 및 메타 데이터(610)는 하나의 이름으로 식별되는 단일 미디어 파일(600) 내에 함께 저장된다. 다른 구현에서, 미디어 컨텐츠(605) 및 메타데이터(610)는 상이한 이름들로 식별되며 개별적으로 액세스될 수 있는 개별 미디어 파일들 내에 저장된다.
도 5로 돌아가서, 사전 데이터 저장소(510)는 용어들의 컨텍스트-민감 정의들의 제공에 적합한 사전 데이터를 저장하는 하나 이상의 영구 데이터 저장 장치의 집합체이다. 사전 데이터 저장소(510), 어플리케이션 명령 저장소(515), 및 미디어 파일 저장소(520)는 동일한 영구 데이터 저장 장치 또는 다른 영구 데이터 저장 장치 상에 저장될 수 있다. 몇몇의 구현에서, 용어들의 컨텍스트-민감 정의들의 제공에 적합한 사전 데이터는 다음에서 더 설명되는 바와 같이 전자 장치(100)로부터 원격지에 저장될 수 있다.
도 7은 용어들의 컨텍스트-민감 제공에 적합한 사전 데이터의 제1 콜렉션(700)의 개략도이다. 사전 데이터 콜렉션(700)은 사전 데이터 저장소(510) 내에 저장될 수 있다. 사전 데이터 콜렉션(700)은 상이한 사전들(705, 710, 715, 720, 725)을 포함한다. 사전들(705, 710, 715, 720, 725) 각각은 상이한 컨텍스트들에서 용어에 특징적인 정의들을 포함한다. 특히, 사전(705)은 제1 시간 기간, 즉, 2010 부근 동안에 용어의 용법에 특징적인 정의들을 포함한다. 사전(710)은 제2 시간 기간, 즉, 1950 부근 동안에 용어의 용법에 특징적인 정의들을 포함한다. 사전(715)는 제3 시간 기간, 즉, 1890 부근 동안에 용어의 용법에 특징적인 정의들을 포함한다. 사전(720)은 제4 시간 기간, 즉, 1830 부근 동안에 용어의 용법에 특징적인 정의들을 포함한다. 사전(725)은 또다른 시간 기간 동안에 용어의 용법에 특징적인 정의들을 포함한다. 몇몇의 구현에서, 특정한 일자에 발행된 사전들(705, 710, 715, 720, 725)은 처음에 그 특정한 발행일을 포함하는 기간 동안에 용어 용법에 특징적인 정의들을 포함하는 것으로서 취해진다.
사전들(705, 710, 715, 720, 725)이 용어 용법을 적절하게 특성화하는 시간 기간은 다음에서 더 설명되는 바와 같이 용어들이 룩업을 위해 선택되는 텍스트의 컨텍스트로 매칭될 수 있는 컨텍스트들이다.
도 8은 용어들의 정의의 컨텍스트-민감 제공에 적합한 사전 데이터의 제2 콜렉션(800)의 개략도이다. 사전 데이터 콜렉션(800)은 사전 데이터 저장소(510)에 저장될 수 있다. 사전 데이터 콜렉션(800)은 상이한 사전들(805, 810, 815, 820, 825, 830, 835, 840, 845, 850)을 포함한다. 사전들(805, 810, 815, 820, 825, 830, 835, 840, 845, 850) 각각은 상이한 컨텍스트들의 용어 용법에 특징적인 정의들을 포함한다. 특히, 사전(805)은 제1 시간 기간, 즉, 2010 부근 동안에 영국 용법에 특징적인 정의들을 포함한다. 사전들(810, 815, 820, 825)은 다른 시간 기간 동안에 영국 용법에 특징적인 정의들을 포함한다. 사전(830)은 제1 시간 기간, 즉, 2010 부근 동안에 미국의 용법에 특징적인 정의들을 포함한다. 사전들(835, 840, 845, 850)은 다른 시간 기간 동안에 미국의 용법에 특징적인 정의들을 포함한다. 몇몇의 구현에서, 특정한 지역 시장에 대해 발행되었던 사전들(805, 810, 815, 820, 825, 830, 835, 840, 845, 850)은 처음에 예를 들어, 특정한 발행일에서 지역 시장의 용어 용법에 특징적인 정의들을 포함하는 것으로서 취해진다.
사전들(805, 810, 815, 820, 825, 830, 835, 840, 845, 850)이 적절하게 용어 용법을 특성화하는 시간 기간 및 지역은 다음에서 더 설명되는 바와 같이 룩업을 위해 선택된 용어가 나타나는 텍스트의 컨텍스트로 매칭될 수 있는 컨텍스트들이다.
도 9는 용어들의 정의들의 컨텍스트-민감 제공에 적합한 사전의 제3 콜렉션(900)의 개략도이다. 사전 데이터 콜렉션(900)은 사전 데이터 저장소(510)에 저장될 수 있다. 사전 데이터 콜렉션(900)은 상이한 사전들(905, 910, 915, 920, 925, 930, 935, 940, 945, 950, 955, 960, 965, 970, 975)을 포함한다. 사전들(905, 910, 915, 920, 925, 930, 935, 940, 945, 950, 955, 960, 965, 970, 975) 각각은 상이한 컨텍스트들에서 용어의 용법에 특징적인 정의들을 포함한다. 특히, 사전(905)은 제1 시간 기간, 즉, 2010 부근 동안에 일반적인 영국 용법에 특징적인 정의들을 포함한다. 사전들(910, 915, 920, 925)은 다른 시간 기간 동안에 일반적인 영국 용법에 특징적인 정의들을 포함한다. 사전(930)은 제1 시간 기간, 즉, 2010 부근 동안에 일반적인 미국 용법에 특징적인 정의들을 포함한다. 사전들(935, 940, 945, 950)은 다른 시간 가간 동안에 미국의 일반적인 용법에 특징적인 정의들을 포함한다. 사전(955)은 제1 시간 기간, 즉, 2010 부근 동안에 일반적인 전문적 용법(technical usage)에 특징적인 정의들을 포함한다. 사전들(960, 965, 970, 975)은 다른 시간 기간 동안에 기술적인 용법에 특징적인 정의들을 포함한다.
사전들(905, 910, 915, 920, 925, 930, 935, 940, 945, 950, 955, 960, 965, 970, 975) 이 적절하게 용어 용법을 특성화하는 주제 또는 분야, 시간 기간, 및 지역은 다음에서 더 설명되는 바와 같이 룩업을 위해 용어가 선택되는 텍스트들의 컨텍스트에 매칭될 수 있는 컨텍스트들이다.
도 10은 용어들의 정의들의 컨텍스트-민감 제공에 적합한 사전 데이터의 제4 콜렉션(1000)의 개략도이다. 사전 데이터 콜렉션(1000)은 사전 데이터 저장소(510) 내에 저장될 수 있다.
도시된 구현에서, 사전 데이터 콜렉션(1000)은 열(1005)에 의해 인덱싱된 상이한 정의들의 데이터 테이블로서 구조화되어 있다. 사전 데이터 콜렉션(1000)은 또한 인덱싱된 용어들의 상이한 정의들(1010) 뿐만 아니라, 각각의 정의가 용법을 특성화하기 시작하였던 시간을 특성화하는 정보(1015)(가능하다면), 각각의 정의가 용법을 특성화하는 것을 중단하였던 시간을 특성화하는 정보(1020)(가능하다면), 용어 용법이 각각의 정의에 의해 정확하게 특성화되는 지역을 특성화하는 정보(1025)(가능하다면), 및 용어 용법이 각각의 정의에 의해 정확하게 특성화되는 주체 또는 분야를 특성화하는 정보(1030)(가능하다면)를 포함한다.
상이한 정의들(1010)이 연관되는 주제 또는 분야, 시간 기간, 및 지역은 다음에서 더 설명되는 바와 같이 룩업을 위해 용어가 선택되는 텍스트들의 컨텍스트에 매칭될 수 있는 정의에 특징적이다.
동작 시에, 전자 장치들(예를 들어 전자 장치(100)과 같이)은 사전 데이터의 콜렉션들(예를 들어, 콜렉션들(700, 800, 900, 1000)과 같은)을 액세스하고 그 사전 데이터로부터 하나 이상의 정의들을 제공할 수 있다. 정의들의 제공은 현재 표시되는 미디어 파일(미디어 파일(600)과 같은)의 컨텍스트에 민감하다. 예를 들어, 몇몇의 구현에서, 전자 장치들은 단지 가장 적절한 용어일 것 같은 단일 정의를 제공한다. 다른 예로서, 다른 구현들에서, 전자 장치는 정의가 용어를 적절하게 정의하는 가능성을 반영하는 순서로 다수의 정의들을 제공한다. 이러한 예들 중 어느 하나에서, 장치는 처음에 제공된 정의(들)이 불만족스러운 것으로 입증된다면 하나 이상의 추가 정의들에 대해 탐색(navigating)하기 위한 사용자 선택을 수신하는 기능을 포함한다. 이 추가 정의(들)은 예를 들어, 텍스트의 컨텍스트에 대해 다음으로 가장 적절할 것 같은 하나의 정의 또는 그들이 텍스트의 컨텍스트에 대해 적절할 가능성을 반영하는 순서로 제공되는 다수의 정의들의 그룹일 수 있다. 몇몇의 구현에서, 장치는 다음에서 더 논의되는 바와 같이 하나 이상의 정의의 적절성 또는 부적절성을 특성화하는 사용자 피드백을 수신하는 기능을 포함할 수 있다.
도 11은 용어가 나타나는 텍스트의 컨텍스트에 민감한 용어들의 정의들의 제공을 위한 프로세스(1100)의 플로우 차트이다. 프로세스(1100)는 기계 판독가능 명령들의 하나 이상의 셋의 로직에 따라 동작들을 수행하는 하나 이상의 데이터 프로세싱 장치의 시스템에 의해 수행될 수 있다. 이 명령들은 하드웨어, 소프트웨어, 또는 그 조합으로 유형으로 구현될 수 있다. 예를 들어, 프로세스(1100)는 전자 장치(100) 내의 디지털 데이터 프로세서(505)에 의해 실행되는 정의 파인더 어플리케이션(540)에 의해 수행될 수 있다. 다른 예로서, 프로세스(1100)는 예를 들어, 전자 장치들의 시스템 및 시스템(1400)(도 14)과 같은 원격 사전 데이터 시스템에 의해 수행될 수 있다. 다른 예로서, 프로세스(1100)는 예를 들어, 시스템(1600)(도 16)과 같은 데이터 통신망을 통해 원격 전자 장치와 통신하는 데이터 통신망 상의 서버 시스템에 의해 수행되는 정의 파인더 어플리케이션(1640)에 의해 수행될 수 있다. 프로세스(1100)는 단독으로 또는 다른 동작들과 함께 수행될 수 있다. 예를 들어, 프로세스(1100)는 다음에서 더 설명되는 바와 같이 프로세스(1300)(도 13)와 함께 수행될 수 있다.
프로세스(1100)를 수행하는 시스템은 정의의 룩업을 트리거하는 텍스트 내의 용어의 사용자 선택을 수신한다(1105). 이 용어는 일반적으로 디스플레이 화면 상에 표시되는 텍스트이다. 사용자 선택은 예를 들어, 입력 엘리먼트들(115) 및/또는 터치 스크린 디스플레이 화면(105)과 같은 하나 이상의 입력 엘리먼트들을 통해 수신될 수 있다. 정의 룩업은 예를 들어, 특정한 입력 엘리먼트 또는 터치 스크린 상의 영역과의 사용자 상호작용과 같은, 용어를 식별하는 사용자 입력에 의해 또는 다른 입력을 통해 용어를 식별하는 사용자 입력의 조합에 의해 트리거될 수 있다. 몇몇의 경우에, 단일 사용자 선택은 텍스트로부터 하나 이상의 용어를 선택할 수 있으며 다수의 용어들에 대한 정의 룩업이 트리거될 수 있다. 몇몇의 예에서, 사용자 선택은 데이터 통신망을 통해 원격 전자 장치로부터 서버 시스템에서 수신될 수 있다. 예를 들어, 원격 전자 장치는 원격 전자 장치에 표시된 텍스트 및 정의의 제공을 위해 선택되었던 텍스트 내의 용어를 식별하는 하나 이상의 메시지를 전송할 수 있다.
프로세스(1100)를 수행하는 시스템은 선택된 용어가 나타나는 텍스트의 컨텍스트를 판정한다(1110). 텍스트의 컨텍스트는 용어가 나타나는 텍스트의 하나 이상의 특성이다. 이 텍스트의 특성들 및 컨텍스트는 텍스트 내의 용어의 특성 및 컨텍스트와 다르다. 즉, 용어는 텍스트 내의 특정한 의미론적 및/또는 구문론적인 컨텍스트(예를 들어, 특정한 문법적인 역할을 하고 용어의 의미를 나타내는 다른 용어들에 의해 둘러싸임)를 가질 수 있다. 이러한 용어 컨텍스트는 또한 정의들의 제공으로 고려될 수 있지만(예를 들어, 다음에서 설명되는 바와 같이), 텍스트의 컨텍스트적인 환경은 역사 컨텍스트, 지리적 컨텍스트, 및 전체로서 텍스트의 다른 컨텍스트적인 특성들에 의해 특성화될 수 있다. 예를 들어, 텍스트가 저작되었을 대의 일자는 텍스트의 역사 컨텍스트의 특성이다. 저자가 살고있는 국가는 텍스트의 지리적 컨텍스트의 특성이다. 텍스트에서 고려하는 문제는 텍스트의 주제의 특성이다. 저자 또는 특정한 그룹 내의 저자 맴버십의 식별은 또한 그 자체가 텍스트의 컨텍스트의 특성이다.
프로세스(1100)를 수행하는 시스템은 다양한 상이한 접근법을 사용하여 선택된 용어가 나타나는 텍스트의 컨텍스트를 판정할 수 있다. 몇몇의 구현에서, 텍스트의 컨텍스트는 메타 데이터(610)(도 6)와 같은, 텍스트를 포함하는 미디어 파일 내의 메타데이터로부터 판정될 수 있다. 예를 들어, 텍스트의 제1 발행일, 저자의 식별, 및/또는 텍스트가 표시된 언어로 번역되었던 일자는 미디어 파일 내의 메타데이터로부터 판정되어 역사 컨텍스트 내에 텍스트를 위치시킬 수 있다. 다른 예로서, 저자의 거주 국가 및/또는 번역자가 이러한 메타데이터로부터 판정되어 텍스트를 지리적인 컨텍스트로 위치시킬 수 있다. 다른 예로서, 듀이 십진 분류법(Dewey Decimal System) 및/또는 텍스트의 다른 주제 분류가 이러한 메타데이터로부터 판정되어 텍스트를 주제 컨텍스트로 위치시킬 수 있다. 몇몇의 구현에서, 이러한 정보가 특정한 미디어 파일 내의 메타데이터에서 이용가능하지 않다면, 예를 들어, 텍스트의 컨텍스트가 판정될 수 있도록 인터넷 상에서, 임의의 이용가능한 메타데이터 또는 심지어 텍스트의 작은 토막(snippet)도 이러한 정보를 룩업하기 위해 사용될 수 있다. 이러한 메타데이터는 휴먼-큐레이트되거나 (human-curated), 텍스트의 자동화된 분석으로부터 유도되거나, 휴먼-큐레이트 및 텍스트의 자동화된 분석으로부터 유도될 수 있다.
몇몇의 구현에서, 텍스트의 컨텍스트는 텍스트 그 자체의 컨텐츠의 분석으로부터 판정될 수 있다. 예를 들어, 프로세스(1100)를 수행하는 시스템은 역사, 주제, 및 텍스트의 지리적이 컨텍스트의 텍스트 인디케이션들(textal indications)에 대해 텍스트를 탐색(search)할 수 있다. 예를 들어, 임의의 시간 기간과 연관된 용어(terminology)(예를 들어, "Gatling gun", thee/thy/thou,tweet), 특정한 지리적 영역과 연관된 용어(예를 들어, "colour" vs. "color", "realise" vs. "realize"), 및 특정한 주제와 연관된 용어(예를 들어, "field-effect transitor" 및 "transubstantiation")가 텍스트의 컨텍스트를 판정하기 위해 사용될 수 있다.
몇몇의 구현에서, 텍스트의 컨텍스트는 텍스트를 포함하는 미디어 파일 내의 메타데이터와 텍스트 그 자체의 컨텐츠의 분석으로부터 결정되거나, 이들 중 하나가 텍스트의 컨텍스트의 판정 시에 다른 것보다 더 중요할 수 있다. 이는 특히 한 컨텍스트로부터의 텍스트가 다른 컨텍스트로부터의 텍스트들을 모방하는 것을 추구하는 경우에 유용하다. 예를 들어, 2007년에 미국 저자에 의해 쓰여진 역사 로맨스는 빅토리안 잉글랜드의 특징인 용어와 다른 텍스트적 특징을 모방할 수 있다. 역사 로맨스를 특성화하는 미디어 파일 메타데이터가 한 컨텍스트 내에 역사 로맨스를 위치시킬 수 있다해도, 용어 및 다른 텍스트적인 특징은 역사 로맨스를 다른 컨텍스트에 위치시킬 수 있다.
프로세스(1100)를 수행하는 시스템은 선택된 용어의 다른 정의들의 특징과 텍스트의 컨텍스트를 비교한다(1115). 예를 들어, 텍스트의 역사 컨텍스트, 지리적 컨텍스트, 및 주제 컨텍스트는 상이한 사전들(예를 들어, 사전들 705-725, 805-850, 905-975)이 용어 용법을 적절하게 특성화하는 시간, 지리, 및 주제에 비교될 수 있다. 다른 예로서, 텍스트의 역사 컨텍스트, 지리 컨텍스트, 및 주제 컨텍스트가 사전 데이터의 단일 콜렉션(예를 들어, 사전 데이터 콜렉션 1000) 내에서 밝혀지는 상이한 정의들의 특징들에 비교될 수 있다.
프로세스(1100)를 수행하는 시스템은 상이한 정의들의 특징들과 텍스트 컨텍스트의 비교 결과에 적어도 부분적으로 기초하여 선택된 용어의 상이한 정의들을 랭킹한다(1120). 이 랭킹은 단계 1115에서 상이한 정의들이 그 컨텍스트로부터 정해진 텍스트 내의 선택된 용어를 적절하게 정의하는 가능성을 구체화할 수 있으며 비교의 결과에만 배타적으로 기초할 필요는 없다. 예를 들어, 랭킹은 예를 들어, 얼마나 자주 특정한 컨텍스트 내의 용어가 특정한 정의 및 텍스트 내의 용어의 컨텍스트(예를 들어, 용어의 문법적 역할 및 텍스트 내의 용어를 둘러싸는 다른 용어들의 의미를 포함)에 의해 적절하게 정의되는지를 포함하는 다른 요소들(factors)을 구체화할 수 있다.
프로세스(1100)를 수행하는 시스템은 이러한 랭킹들에 따라 선택된 용어의 하나 이상의 정의를 표시한다(1125). 예를 들어, 가장 적절할 것 같은 단일 정의가 표시될 수 있다. 다른 예로서, 다수의 정의들이 정의들이 적절할 가능성을 반영하는 순서로 표시될 수 있다. 하나 이상의 정의가 프로세스(1100)의 나머지를 수행하는 동일 장치에 표시될 수 있거나 하나 이상의 정의가 데이터 통신망을 통해 프로세스(1100)의 나머지를 수행하는 장치와 데이터를 교환하는 원격 전자 장치에 표시될 수 있다.
도 12는 하나 이상의 용어의 정의들을 제공할 시에 텍스트의 컨텍스트에 민감한 전자 장치(100)의 다른 구현 예의 개략도이다. 디지털 데이터 프로세서(505), 사전 데이터 저장소(510), 어플리케이션 명령 저장소(515), 및 미디어 파일 저장소(520)에 추가하여, 전자 컴포넌트 집합체(120)의 도시된 구현은 의미론적 및/또는 구문론적 분석기(1205)를 포함한다. 의미론적 및/또는 구문론적 분석기(1205)는 텍스트 내의 용어들의 언어적인 컨텍스트 및 다른 유닛들을 분석하도록 데이터 프로세서(505)를 구성하는 소프트웨어 컴포넌트이다. 예를 들어, 의미론적 및/또는 구문론적 분석기(1205)는 용어에 의해 이루어지는 문법적인 역할을 판정하고 다른 용어 및 텍스트 내의 용어를 둘러싸는 컨텐츠를 기초로 용어의 가능한 의미를 식별할 수 있다.
의미론적 및/또는 구문론적 분석기(1205)에 의해 생성된 결과는 텍스트의 컨텍스트와 텍스트 내의 용어의 컨텍스트 모두에 민감한 사전 데이터 저장소(130) 내의 용어들에 대해 정의들을 위치시키는 정의 파인더(165)에 의해 사용될 수 있다. 예를 들어, 의미론적 및/또는 구문론적 분석기(1205)는 사용자에 의해 선택되었던 용어를 특성화하는 정보를 문장, 술어, 동사, 또는 다른 문법적인 요소의 주제로서 출력할 수 있다. 선택된 용어의 특성화는 선택된 용어가 나타나는 텍스트의 컨텍스트와 함께, 상이한 정의들이 텍스트 내의 선택된 용어를 적절하게 정의할 가능성에 따라 선택된 용어의 상이한 정의들을 랭킹하도록 (예를 들어, 프로세스 1100의 단계 1120에서) 정의 파인더(165)에 의해 사용될 수 있다.
몇몇의 구현에서, 의미론적 및/또는 구문론적 분석기(1205)는 텍스트 그 자체의 컨텍스트를 특성화하는 정보를 출력할 수 있다. 예를 들어, 의미론적 및/또는 구문론적 분석기(1205)는 특정한 역사, 지리, 및/또는 주제 컨텍스트의 특징인 의미론적 특징들, 용어, 및/또는 다른 텍스트적 특징들을 식별할 수 있다. 텍스트의 컨텍스트의 특성화는 단독으로 또는 선택된 용어가 나타나는 텍스트를 특성화하는 메타 또는 다른 데이터와 함께, 상이한 정의들이 적절하게 텍스트 내의 선택된 용어를 적절하게 정의할 가능성에 따라 선택된 용어의 상이한 정의들을 랭킹하도록 (예를 들어, 프로세스 1100의 1120에서) 정의 파인더(165)에 의해 사용될 수 있다.
도 13은 용어가 나타나는 텍스트의 컨텍스트에 민감한 용어들의 정의들의 제공을 위한 프로세스(1300)의 플로우차트이다. 프로세스(1300)는 기계 판독가능 명령들의 하나 이상의 셋의 로직에 따라 동작들을 수행하는 하나 이상의 데이터 프로세싱 장치의 시스템에 의해 수행될 수 있다. 이 명령들은 하드웨어, 소프트웨어, 또는 그 조합으로 유형으로 구현될 수 있다. 예를 들어, 프로세스(1100)는 전자 장치(100) 내의 디지털 데이터 프로세서(505)에 의해 실행되는 정의 파인더 어플리케이션(540)에 의해 수행될 수 있다. 다른 예로서, 프로세스(1300)는 다양한 원격 데이터 프로세싱 장치들과 데이터 통신하는 중앙 컴퓨터 시스템을 포함하는 시스템에 의해 수행될 수 있다. 프로세스(1300)는 단독 또는 다른 동작들과 함께 수행될 수 있다. 예를 들어, 프로세스(1300)는 프로세스(1100)(도 11)와 함께 수행될 수 있다.
프로세스(1300)를 수행하는 시스템은 랭킹들에 따라 선택된 용어의 하나 이상의 정의를 표시한다(1305). 예를 들어, 가장 적절할 것 같은 단일 정의가 표시될 수 있다. 다른 예로서, 다수의 정의들이 정의들이 적절할 가능성을 반영하는 순서로 표시될 수 있다.
프로세스(1300)를 수행하는 시스템은 표시된 정의의 적절성 또는 부적절성의 사용자 확인을 수신한다(1310). 이 사용자 확인은 정의가 표시되는 장치의 입력 엘리먼트를 통해 수신될 수 있다. 이 사용자 확인은 임의의 다양한 상이한 형태로 수신될 수 있다. 예를 들어, 사용자 확인은 정의들의 적절성에 대해 질문하는 질의(예를 들어, "이 정의가 적절하였나?" 또는 "이 정의가 부적절하였나?")에 대한 바이너리 응답으로서 수신될 수 있다. 다른 예로서, 사용자 확인은 다수의 정의들 중에서 가장 적절한 한 정의의 선택으로서 수신될 수 있다. 다른 예로서, 사용자 확인은 수치적이거나 특정한 정의의 적절성 또는 부적절성을 특성화하는 다른 그레이드(grade)일 수 있다.
몇몇의 구현에서, 사용자 확인의 수신은 사용자로부터의 긍정 입력을 필요로 하지 않으며 오히려 암시적인 신호에 따른다. 예를 들어, 초기에 용어의 제1 정의를 표시한 시스템이 추가 정의에 대한 후속 요청을 수신한다면, 시스템은 이 요청을 제1 정의가 부적절하다는 확인으로서 해석할 수 있다. 다른 예로서, 시스템이 하나 이상의 사용자 요청에 응답하여 일련의 두개 이상의 정의를 표시한다면, 추가적인 정의들의 표시를 위한 사용자 요청에 대한 종료는 최종적인 사용자 요청 이후에 표시된 정의가 적절하다는 확인으로서 해석될 수 있다. 다른 예로서, 비교적 짧은 기간 이후에 다른 정의의 표시를 사용자가 요청한다면, 이 요청은 표시된 정의의 부적절성을 나타내는 것으로서 시스템에 의해 해석될 수 있다. 그러나, 정의가 비교적 긴 기간 동안 표시된다면, 이러한 표시는 표시된 정의의 잠재적인 적절성을 나타내는 것으로서 시스템에 의해 해석될 수 있다.
프로세스(1300)를 수행하는 시스템은 사용자 확인의 특성화를 저장한다(1315). 이 특성화는 하나 이상의 영구 데이터 저장 장치에 저장될 수 있으며 예를 들어, 용어, 용어가 발견되었던 텍스트의 컨텍스트, 및/또는 텍스트 내의 용어의 구문론적 및/또는 의미론적 컨텍스트를 특성화하는 정보를 포함할 수 있다. 예를 들어, 전자 장치(100)에 의해 프로세스(1300)가 수행되는 구현에서, 사용자 확인의 특성화는 전자 장치(100) 내에 하우징된 하나 이상의 영구 데이터 저장소에 저장될 수 있다.
도 14는 사용자 확인들의 특성화들을 저장할 수 있는 다른 시스템(1400)의 예의 개략도이다. 시스템(1400)은 사용자에 대해 컨텐츠를 표시하고 표시된 컨텐츠 내의 용어들의 정의들의 적절성 또는 부적절성의 사용자 확인을 수신하는 전자 장치들의 시스템이다. 시스템(1400)은 제1 사용자와 연관된 제1 전자 장치(100) 뿐만 아니라 다른 사용자들과 연관되는 다양한 다른 전자 장치들(1405)도 포함한다. 전자 장치들(1405)은 예를 들어, 데스크 또는 랩탑 컴퓨터, 스마트폰, PDA, 전용 북 리더 등일 수 있다.
전자 장치들(100, 1405)은 모두 데이터 통신 컴포넌트들을 포함하여 원격 사전 데이터 시스템(1410)과 메시지들을 교환한다. 데이터 통신 컴포넌트들은 유선 또는 무선일 수 있으며 예를 들어, 모바일 폰 트랜시버, WiFi 트랜시버, 하드와이어드 데이터 연결 트랜시버 등을 포함할 수 있다. 전자 장치들(100, 1405)은 데이터 통신 컴포넌트들을 사용하여 사전 데이터 시스템(1410)과 메시지들을 교환하도록 동작가능하다.
사전 데이터 시스템(1410)은 기계 판독 가능 명령들의 하나 이상의 셋의 로직에 따라 동작들을 수행하는 하나 이상의 데이터 프로세싱 장치의 집합체이다. 사전 데이터 시스템(1410)은 각각의 전자 장치들(100)로부터 표시되는 정의들의 적절성 또는 부적절성의 사용자 확인들을 특성화하는 정보를 포함하는 메시지들을 수신하고 이러한 확인들 중 적어도 몇몇의 기록을 데이터베이스 또는 다른 영구 데이터 저장소에 저장하도록 프로그래밍된다. 이 확인은 다양한 상이한 텍스트들에서 상이한 정의들의 적절성 또는 부적절성을 확인하는 다양한 사용자들에 의해 이루어지므로, 사전 데이터 시스템(1410)은 상이한 컨텍스트들로부터 텍스트들의 상이한 정의들의 적절성 또는 부적절성의 결합된 특성화를 시간에 따라 수집할 수 있다.
도 15는 정의들의 적절성 또는 부적절성의 사용자 확인들의 특성화들이 저장된 데이터 콜렉션(1500)의 개략도이다. 데이터 콜렉션(1500)은 예를 들어, 하나 이상의 영구 데이터 저장 장치 내의 사전 데이터 시스템(1410)에 저장될 수 있다.
도시된 구현에서, 사용자 확인 데이터 콜렉션(1500)은 열(1505)에서 정의가 확인되었던 용어에 의해 인덱싱되는 상이한 확인들의 데이터 테이블로서 구조화된다. 사용자 확인 데이터 콜렉션(1500)의 도시된 구현의 각각의 행은 단일 텍스트에 대한 단일 사용자에 의해 단일 확인 이벤트를 특성화한다. 사용자 확인 데이터 콜렉션(1500)은 상이한 사용자들에 의해 적절한 것으로 확인되었던 인덱싱된 용어들의 정의들의 수치 또는 다른 식별자들(1515) 뿐만 아니라 정의가 적절한 것으로 확인되었던 텍스트의 컨텍스트를 특성화하는 정보(1520, 1525, 1530)도 포함한다. 도시된 구현에서, 정보(1520)는 텍스트가 최초에 발행되었던 일자를 특성화하고, 정보(1525)는 저자의 지역을 특성화하며, 정보(1530)는 텍스트의 주제를 특성화한다. 다른 구현에서, 정의가 적절한 것으로 확인되었던 텍스트의 컨텍스트는 다른 방식으로 특성화될 수 있다.
몇몇의 구현에서, 사용자 확인 데이터 콜렉션(1500)은 또한 텍스트 내의 용어의 구문론적 및/또는 의미론적 컨텍스트를 특성화하는 정보를 포함한다. 예를 들어, 사용자 확인 데이터 콜렉션(1500)은 텍스트 내의 용어의 구어의 부분의 특성화 및 텍스트 내의 용어의 근처였던 다른 용어들의 특징들을 포함할 수 있다.
상이한 정의들의 적절성 또는 부적절성의 사용자 확인들이 수집됨에 따라, 사용자 확인 데이터 콜렉션(1500)은 상이한 컨텍스트들 내의 용어의 용법의 특유의 표현이 되도록 성장할 수 있다. 특히, 인간 사용자는 하나씩 상이한 컨텍스트들로부터 텍스트 내의 상이하 용어 정의들의 적절성 또는 부적절성의 확인들을 제공할 수 있다. 시간에 따라, 이러한 확인들의 수집은 이전보다 너무 비용이 많이 들지 않으면서 수집하는 방식으로 텍스트의 대량의 코퍼스(corpus)로 용어 용법을 특성화할 수 있다.
도 13로 돌아와서, 프로세스(1300)를 수행하는 시스템은 사용자 확인(user confirmation)의 저장된 특성화들에서 적어도 부분을 기초로 정의들을 랭킹한다(1320). 예를 들어, 정의들의 적절성 또는 부적절성의 사용자 확인들의 통계적인 분석은 상이한 용어 정의들이 상이한 컨텍스트들 내의 텍스트들에 대해 적절할 가능성을 나타내는 파라미터들을 결정하는데 사용될 수 있다. 몇몇의 구현에서, 이러한 통계적인 분석은 다양한 상이한 장치들로부터 수신되는 사용자 확인들을 수집하고 다음에 예를 들어, 선택된 용어들의 상이한 정의들을 랭킹하는 것(예를 들어, 프로세스(1100) (도 11)의 단계 1120에서)에 사용하기 위해 장치들에 대한 통계적인 분석의 결과를 배포하는 사전 데이터 시스템(1410)과 같은 데이터 프로세싱 시스템에 의해 수행될 수 있다. 신경망 기반 접근법들을 포함하는 다른 머신 러닝 접근법들이 또한 사용자 확인의 저장된 특성화들에서 적어도 부분을 기초로 정의들을 랭킹할 수 있다.
몇몇의 구현에서, 사용자 확인은 확인이 수신되었던 사용자의 신뢰도의 추정에 따라 가중치가 부여된다. 예를 들어, 시스템은 사용자로부터의 정확한 확인들을 일관적으로 수신하였다면, 그 사용자로부터 수신되는 후속 확인들은 새로운 사용자 또는 덜 정확한 확인들이 수신되었던 사용자들로부터 수신되는 확인들보다 더 가중치가 부여될 수 있다. 사용자 확인들에 대해 할당된 가중치는 상이한 용어 정의들이 상이한 컨텍스트들에서 텍스트에 적합할 가능성을 나타내는 파라미터들의 결정에 영향을 줄 수 있다. 특히, 파라미터들의 결정은 보다 많이 가중된 사용자 확인들보다 정확하게 적절한 정의들을 식별할 가능성을 구체화할 수 있다. 사용자 확인들의 정확성은 예를 들어, 다수의 사용자 확인들이 특정한 컨텍스트에 대해 (예를 들어, 특정한 텍스트에 대해) 올바른 정의를 식별하도록 수집되는 보팅 메커니즘(voting mechanism)에 의해 결정될 수 있다.
몇몇의 구현에서, 충분한 정의들이 이용가능하게 수집된다면, 정의들이 랭킹되는 컨텍스트는 예를 들어, 특정한 그룹에 의해 저작된 텍스트들, 특정한 개인에 의해 저작된 텍스트들, 또는 용어가 나타나는 특정한 텍스트를 포함할 수 있다.
몇몇의 구현에서, 정의들은 동일하 장치에서 이루어진 사용자 확인들의 특성화들에서 적어도 부분을 기초로 전자 장치에 의해 랭킹될 수 있다. 예를 들어, 용어 정의들의 사용자 확인들은 용어가 나타나는 텍스트의 컨텍스트의 특성화들로서 해석될 수 있다. 예를 들어, 사용자가 전문적인 주제에 특징적인 용어 정의들을 일관적으로 확인한다면, 후속하는 정의들의 랭킹들(예를 들어, 프로세스(1100)(도 11)의 1120에서)은 다른 정의들 위에 전문적인 정의들을 랭킹할 수 있다.
도 16은 하나 이상의 용어의 정의들 제공 시에 텍스트의 컨텍스트에 민감한 전자 장치(100)의 다른 구현 예의 개략도이다. 도시된 구현에서, 서버 시스템(1600)에서 용어들의 컨텍스트-민감 정의들의 제공에 적합한 사전 데이터(1610)와 정의 파인더 어플리케이션(1640)이 저장되고 전자 장치(100)로부터 원격으로 수행된다. 사전 데이터(1610)의 컨텐츠는 정의 파인더 어플리케이션(1640)에 의해 액세스가능한 하나 이상의 영구 데이터 저장 장치에 저장된다. 사전 데이터(1610)는 예를 들어, 컬렉션들(700, 800, 900, 1000)과 같은 콜렉션들로 저장될 수 있다.
정의 파인더 어플리케이션(1640)은 사전 데이터 저장소(1610)에 용어들에 대한 컨텍스트-민감 정의들을 위치시키도록 서버 시스템(1600)에서 하나 이상의 데이터 프로세싱 장치를 구성하는 소프트웨어 컴포넌트이다. 정의되는 용어들 및 그 용어들의 컨텍스트는 데이터 통신망을 통해 (예를 들어, 인터넷을 통해) 원격 전자 장치(100)로부터 수신되는 하나 이상의 메시지로 식별될 수 있다. 정의 파인더 어플리케이션(1640)은 예를 들어, 프로세스(1100)를 사용하여 원격 장치(100)로부터 보여지는 텍스트적 미디어 파일 컨텐츠(520)의 용어들에 대한 하나 이상의 정의를 제공하도록 사전 데이터(1610)를 액세스할 수 있다.
동작 시에, 원격 전자 장치(100)는 전자 장치(100)에서 표시된 텍스트에서 발견된 용어의 사용자 선택을 수신하도록 사용자와 상호작용할 수 있다. 선택된 용어를 식별하고 용어들이 선택되었던 텍스트를 특성화하는 하나 이상의 메시지가 전자 장치(100)로부터 서버 시스템(1600)으로 전송될 수 있다. 텍스트는 다양한 방식으로 하나 이상의 메시지로 특성화될 수 있다. 예를 들어, 몇몇의 구현에서, 텍스트는 이름 또는 다른 식별자에 의해 식별되고 텍스트의 컨텍스트의 특징들은 서버 시스템(1600)에 의해 판정된다. 다른 구현에서, 텍스트의 컨텍스트의 특징들은 하나 이상의 메시지 내의 텍스트를 특성화한다.
서버 시스템(1600)은 용어의 사용자 선택 및 텍스트의 특성화를 수신한다. 응답하여, 서버 시스템(1600)은 텍스트의 컨텍스트의 특징들을 선택된 용어의 상이한 정의들의 특징들과 비교하고 정의들이 텍스트 내의 용어의 용법을 적절하게 특성화할 가능성에 따른 비교의 결과에서 적어도 부분을 기초로 선택된 용어의 상이한 정의들을 랭킹한다. 서버 시스템(1600)은 다음에 상이한 정의들의 랭킹을 특성화하는 원격 전자 장치(100)로 하나 이상의 메시지를 전송한다. 몇몇의 구현에서, 서버 시스템(1600)은 또한 하나 이상의 상이한 정의를 원격 전자 장치(100)로 전송한다. 원격 전자 장치는 서버 시스템(1600)에 의해 제공되는 랭킹에 다라 하나 이상의 상이한 정의들을 표시할 수 있다.
몇몇의 구현에서, 사전 데이터 저장소(1610) 내에 컨텍스트-민감 용어 정의들을 위치시키도록 하나 이상의 데이터 프로세싱 장치를 구성하는 소프트웨어 컴포넌트는 또한 전자 장치(100)로부터 원격지에 위치하고 데이터 통신망을 통해 (예를 들어, 인터넷을 통해) 액세스 가능하다. 이러한 원격 소프트웨어 컴포넌트는 예를 들어, 사전 데이터 저장소(130)의 구조화에 따라 정의들 및 상술한 바와 같이 매칭되는 컨텍스트를 위치시키는 다양한 상이한 접근법을 사용할 수 있다.
본 명세서에서 설명된 주제 및 동작의 실시예들은 본 명세서에 개시된 구조 및 그 구조적 등가물, 또는 그들의 임의의 조합을 포함하는 디지털 전자 회로나 컴퓨터 소프트웨어, 펌웨어, 또는 하드웨어로 구현될 수 있다. 본 명세서에서 설명된 주제의 실시예들은 하나 이상의 컴퓨터 프로그램, 즉 실행을 위해 컴퓨터 저장 매체 상에 인코딩되거나 데이터 프로세싱 장치의 동작을 제어하는 컴퓨터 프로그램 명령들의 하나 이상의 모듈로서 구현될 수 있다. 다르게 또는 추가적으로, 프로그램 명령들은 데이터 프로세싱 장치에 의한 실행을 위해 적합한 수신기 장치로의 전송을 위해서 정보를 인코딩하도록 생성된, 예를 들어, 기계 발생 전기, 광, 또는 전자기 신호인 인공 발생 전파 신호로 인코딩될 수 있다. 컴퓨터 저장 매체는 컴퓨터 판독가능 저장 장치, 컴퓨터 판독가능 저장 기판, 랜덤 또는 시리얼 액셋스 메모리 어레이 또는 장치, 또는 그들의 하나 이상의 조합이거나 그에 포함될 수 있다. 또한, 컴퓨터 저장 매체는 전파되는 신호가 아니지만, 컴퓨터 저장 매체는 인공 발생 전파 신호로 인코딩된 컴퓨터 프로그램 명령들의 소스 또는 목적지일 수 있다. 컴퓨터 저장 매체는 또한 하나 이상의 개별 물리 컴포넌트 또는 미디어(예를 들어, 다수의 CD, 디스크, 또는 다른 저장 장치)이거나 그에 포함될 수 있다.
본 명세서에서 설명된 동작들은 하나 이상의 컴퓨터 판독가능 저장 장치 상에 저장되거나 다른 소스로부터 수신되는 데이터에 대해 데이터 프로세싱 장치에 의해 수행되는 동작들로서 구현될 수 있다.
용어 "데이터 프로세싱 장치"는 프로그래밍 가능한 프로세서, 컴퓨터, 칩 상의 시스템, 또는 이들 다수 또는 그 조합의 예를 포함하는, 데이터를 프로세싱하기 위한 모든 종류의 장치, 디바이스 및 기계를 포괄한다. 이 장치는 예를 들어, FPGA(Field Programmable Gate Array) 또는 ASIC(Application-Specific Integrated Circuit)과 같은 특수 목적 논리 회로를 포함할 수 있다. 이 장치는 또한 하드웨어에 추가하여, 예를 들어, 프로세서 펌웨어, 프로토콜 스택, 데이터베이스 관리 시스템, 운영 체제 크로스-플랫폼 런타임 환경, 가상 머신, 또는 이들 중 하나 이상의 조합을 구성하는 코드인 해당 컴퓨터 프로그램을 위한 실행 환경을 생성하는 코드를 포함할 수 있다. 이 장치 및 실행 환경은 웹 서비스, 분산 컴퓨팅 및 그리드 컴퓨팅 인프라스트럭쳐와 같은 다양한 상이한 컴퓨팅 모델 인프라스트럭쳐를 실현할 수 있다.
컴퓨터 프로그램(또한 프로그램, 소프트웨어, 소프트웨어 어플리케이션, 스크립트, 또는 코드로서 알려짐)은 컴파일되거나 해석된 언어들, 선언형 언어 또는 절차형 언어를 포함하는 임의의 형태의 프로그래밍 언어로 쓰여질 수 있으며, 단독형 프로그램 또는 모듈, 컴포넌트, 서브루틴, 객체, 또는 컴퓨터 환경에서 사용하는데 적합한 다른 유닛을 포함하는 임의의 형태로서 전개될 수 있다. 컴퓨터 프로그램은 필수적이지는 않지만 파일 시스템의 파일에 대응한다. 프로그램은 다른 프로그램 또는 데이터(예를 들어, 마크업 랭귀지 도큐먼트에 저장된 하나 이상의 스크립트)를 유지하는 파일의 한 부분으로, 해당 프로그램 전용의 단일 파일로, 또는 다수의 협력 파일(예를 들어, 하나 이상의 모듈, 서브루틴, 또는 코드의 일부)로 저장될 수 있다. 컴퓨터 프로그램은 하나의 컴퓨터 또는 한 사이트에 위치하거나 다수의 사이트에 걸쳐 분산되어 있고 통신망에 의해 상호접속된 다수의 컴퓨터 상에서 실행되도록 전개될 수 있다.
본 명세서에 설명된 프로세스들 및 논리 플로우는 입력 데이터로 동작하고 출력을 생성함으로써 동작들을 수행하는 하나 이상의 컴퓨터 프로그램을 실행하는 하나 이상의 프로그래밍 가능 프로세서에 의해 수행될 수 있다. 이 프로세스 및 논리 플로우는 또한 특수 목적 논리 회로, 예를 들어, FPGA(Field Programmable Gate Array) 또는 ASIC(Application-Specific Integrated Circuit)에 의해 수행될 수 있고, 또한 장치가 그것으로 구현될 수 있다.
컴퓨터 프로그램의 실행에 적합한 프로세서들은 예를 들어, 일반 및 특수 목적 마이크로프로세서들, 및 임의의 종류의 디지털 컴퓨터의 임의의 하나 이상의 프로세서들을 포함한다. 일반적으로, 프로세서는 판독 전용 메모리 또는 랜덤 액세스 메모리 또는 양자 모두로부터 명령들 및 데이터를 수신할 것이다. 컴퓨터의 필수 구성요소는 명령들에 따라 동작들을 수행하기 위한 프로세서와 명령들 및 데이터를 저장하기 위한 하나 이상의 메모리 장치이다. 일반적으로, 컴퓨터는 또한 데이터를 저장하기 위한 하나 이상의 대용량 저장 장치, 예를 들어, 자기, 광자기 디스크, 또는 광 디스크를 포함하거나, 그로부터 데이터를 수신하거나 데이터를 전송하거나 양자 모두를 위해 동작적으로 연결될 것이다. 또한, 컴퓨터는 예를 들어, 휴대 전화, 퍼스널 디지털 어시스턴트(PDA), 휴대용 오디오 또는 비디오 재생 장치, 게임 콘솔, 전지구 측위 시스템(GPS) 수신기, 또는 휴대용 저장 장치(예를 들어, 범용 직렬 버스(USB) 플래시 드라이브)인 다른 장치(단지 일부만 열거함)로 구현될 수 있다. 컴퓨터 프로그램 명령들 및 데이터를 저장하기에 적합한 장치들은 예를 들어, EPROM, EEPROM, 및 플래시 메모리인 반도체 메모리 소자와, 예를 들어, 내장 하드 디스크 또는 휴대용 디스크인 자기 디스크와, CD-ROM 및 DVD-ROM 디스크를 포함하는 모든 형태의 불휘발성 메모리, 미디어, 및 메모리 소자를 포함한다. 프로세서 및 메모리는 특수 목적 논리 회로에 의해 공급되거나 포함될 수 있다.
사용자와의 상호작용을 위해, 본 명세서에 설명된 주제의 실시예들은 사용자에 대해 정보를 표시하기 위한 예를 들어, CRT(Cathode Ray Tube) 또는 LCD(Liquid Crystal Display) 모니터인 디스플레이 장치와 사용자가 컴퓨터로 입력을 제공할 수 있는 키보드와 예를 들어, 마우스 또는 트랙볼인 포인팅 장치를 갖는 컴퓨터 상에서 구현될 수 있다. 다른 종류의 장치들이 마찬가지로 사용자와의 상호작용을 위해 제공될 수 있는데, 이는 예를 들어, 사용자에게 제공되는 피드백이 시작적 피드백, 오디오적 피드백, 또는 촉각적 피드백인 임의의 형태의 감각 피드백일 수 있으며, 사용자로부터의 입력은 음향, 음성, 또는 촉각 입력을 포함하는 임의의 형태로 수신될 수 있다. 또한, 컴퓨터는 예를 들어, 웹 브라우저로부터 수신된 요청에 응답하여 사용자의 클라이언트 장치 상의 웹 브라우저로 웹페이지를 전송하는 것과 같이, 사용자에 의해 사용되는 장치로부터 도큐먼트를 수신하고 그곳으로 도큐먼트를 전송함으로써 사용자와 상호작용을 할 수 있다.
본 명세서는 다수의 특정한 상세 구현을 포함하고 있지만, 이는 본 발명의 범위나 특허청구의 범위를 제한하려는 것은 아니며, 특정한 실시 예들에 대한 특징을 기술하기 위한 것이다. 개별 실시예들의 맥락에서 본 명세서에 기술된 임의의 특징들은 또한 단일 실시예의 조합으로도 구현될 수 있다. 반대로, 단일 실시예의 맥락에서 기술된 다양한 특징들은 또한 개별적으로 다수의 실싱예들로 또는 임의의 적합한 부조합으로 구현될 수 있다. 또한, 상기에서 특징들이 임의의 조합으로서 동작하고 처음에 그와 같이 주장되었지만, 주장된 조합으로부터의 하나 이상의 특징은 몇몇의 경우에 조합으로부터 삭제될 수 있으며, 주장된 조합은 부조합 또는 부조합의 변형으로 유도될 수 있다.
유사하게, 동작들이 특정한 순서로 도면에 도시되었지만, 이는 그러한 동작들이 도시된 특정한 순서 또는 순차적인 순서로 수행되거나 모든 도시된 동작들이 수행되어야 원하는 결과를 달성하는 것으로 이해되어서는 안된다. 특정 환경에서는 멀티테스킹 및 병렬 프로세싱이 유리할 수 있다. 또한, 상술한 실시예들의 다양한 시스템 컴포넌트들의 부분은 모든 실시예들에서 그러한 부분들을 필요로 하는 것으로 이해되어서는 안되며, 설명된 프로그램 컴포넌트 및 시스템은 일반적으로 단일 소프트웨어 제품으로 함께 통합되거나 다수의 소프트웨어 제품으로 패키징될 수 있다는 것을 이해하여야 한다.
이와 같이, 주제의 특정한 실시예들이 설명되었다. 다른 실시예들은 다음의 특허 청구의 범위 내에 있다. 몇몇의 경우에, 청구범위에 열거된 동작들은 상이한 순서로 수행되어도 여전히 원하는 결과를 얻을 수 있다. 또한, 첨부된 도면들에 도시된 프로세스들은 원하는 결과를 달성하기 위해 도시된 특정한 순서, 또는 순차적인 순서를 반드시 필요로 하는 것은 아니다. 임의의 구현에서, 멀티태스킹 및 병렬 프로세싱이 유리할 수 있다. 전자 장치(100)를 포함하는 전자 장치들은 하나 이상의 디스플레이 화면을 포함하는 중복 컴포넌트들을 가질 수 있다.

Claims (22)

  1. 전자 장치를 포함하는 시스템에 있어서,
    상기 전자 장치는
    제1 용어의 다수의 정의들(definitions) - 상기 각각의 정의는 상기 제1 용어의 용법을 적절하게 특성화하는 텍스트의 컨텍스트의 특성화와 연관되어 저장되고, 상기 정의들 중 적어도 몇몇이 기간의 특성화들과 연관되어 저장되며 - 및 상기 제1 용어를 포함하는 텍스트 컨텐츠(textual content)를 포함하는 하나 이상의 미디어 파일을 저장하는 하나 이상의 영구 데이터 저장 장치,
    상기 미디어 파일들 중 첫번째의 상기 텍스트 컨텐츠를 표시하도록 구성된 하나 이상의 디스플레이 화면,
    상기 제1 용어의 사용자 선택을 수신하도록 구성된 하나 이상의 입력 엘리먼트, 및
    동작들을 수행함으로써 상기 제1 용어의 사용자 선택의 수신에 응답하도록 프로그래밍된 하나 이상의 데이터 프로세싱 장치 - 상기 동작들은 상기 하나 이상의 영구 데이터 저장 장치로부터 상기 제1 용어의 상기 정의들과 연관되어 저장된 상기 텍스트들의 컨텍스트들의 상기 특성화들을 액세스하는 것과, 상기 텍스트들의 컨텍스트들의 상기 액세스된 특성화들을 상기 텍스트 컨텐츠의 컨텍스트의 하나 이상의 특징과 비교하는 것과, 상기 정의들이 상기 텍스트 컨텐츠 내의 상기 제1 용어의 용법을 적절하게 특성화할 각각의 가능성들에 따라 상기 제1 용어의 정의들을 랭킹(ranking)하는 것을 포함하며, 상기 하나 이상의 데이터 프로세싱 장치는 상기 텍스트가 저작되었을 때의 일자를 상기 기간과 비교하도록 프로그래밍됨-
    를 포함하는 시스템.
  2. 제1항에 있어서, 상기 제1 용어의 상기 다수의 정의는 상이한 사전들에 저장되어 있으며, 상기 사전들 각각은 상이한 컨텍스트들에서 적절하게 용어 용법을 특성화하는 정의들을 포함하는 시스템.
  3. 제1항에 있어서,
    상기 미디어 파일들 중 첫번째는 상기 텍스트 컨텐츠를 특성화하는 메타데이터를 더 포함하고,
    상기 하나 이상의 데이터 프로세싱 장치는 상기 텍스트 컨텐츠의 컨텍스트의 하나 이상의 특징을 판정하기 위해 상기 메타데이터를 액세스하도록 프로그래밍되는 시스템.
  4. 제1항에 있어서, 상기 동작들은 상기 텍스트 컨텐츠 내에서 발견된 인디케이션들(indications)로부터 상기 텍스트 컨텐츠의 컨텍스트의 하나 이상의 특징들을 더 포함하는 시스템.
  5. 제1항에 있어서,
    상기 동작들은 상기 텍스트 컨텐츠 내의 상기 제1 용어의 컨텍스트를 판정하는 것을 더 포함하고,
    상기 정의들의 랭킹은 상기 텍스트 컨텐츠 내의 상기 제1 용어의 상기 판정된 컨텍스트 및 상기 텍스트들의 컨텍스트들의 상기 특성화들과 상기 텍스트 컨텐츠의 컨텍스트의 하나 이상의 특징들을 비교한 결과, 양자에 기초하는 시스템.
  6. 제5항에 있어서, 상기 시스템은 상기 텍스트 컨텐츠 내의 상기 제1 용어의 의미론적 컨텍스트(syntactic context)를 판정하는 의미론적 분석기를 포함하는 시스템.
  7. 삭제
  8. 제1항에 있어서,
    상기 하나 이상의 데이터 프로세싱 장치는 상기 텍스트들의 컨텍스트들의 상기 특성화들을 판정하기 위해 상기 텍스트 컨텐츠를 분석하도록 프로그래밍되는 시스템.
  9. 제1항에 있어서,
    상기 정의들 중 적어도 몇몇은 주제의 특성화들과 연관되어 저장되고,
    상기 하나 이상의 데이터 프로세싱 장치는 상기 주제를 상기 텍스트 컨텐츠의 주제와 비교하도록 프로그래밍되는 시스템.
  10. 제1항에 있어서,
    상기 정의들 중 적어도 몇몇은 지리적 컨텍스트들의 특성화들과 연관되어 저장되고,
    상기 하나 이상의 데이터 프로세싱 장치는 상기 텍스트 컨텐츠의 지리적인 컨텍스트와 상기 정의들과 연관된 상기 지리적인 컨텍스트를 비교하도록 프로그래밍되는 시스템.
  11. 하나 이상의 데이터 프로세싱 장치의 시스템에 의해 수행되는 방법에 있어서,
    상기 시스템에 의해, 상기 시스템에 표시되는 텍스트에서 발견된 용어의 사용자 선택을 수신하는 단계,
    상기 시스템에 의해, 텍스트의 역사적 컨텍스트, 텍스트의 지리적 컨텍스트, 또는 텍스트의 주제 컨텍스트 중 하나 이상을 판정하는 단계,
    상기 시스템에 의해, 상기 텍스트의 역사적, 지리적, 및 주제 컨텍스트들 중 하나 이상을 상기 선택된 용어의 상이한 정의들의 하나 이상의 특징들과 비교하는 단계,
    상기 시스템에 의해, 상기 비교의 결과에서 적어도 부분을 기초로 하여 상기 선택된 용어의 상기 상이한 정의들을 랭킹하는 단계,
    상기 시스템에 의해, 상기 상이한 정의들의 랭킹에 따라 상기 상이한 정의들 중 하나 이상을 표시하는 단계,
    상기 시스템에 의해, 표시된 정의의 적절성 또는 부적절성의 사용자 확인을 수신하는 단계,
    상기 텍스트 내에서 발견된 제2 용어의 사용자 선택을 수신하는 단계,
    상기 시스템에 의해, 상기 선택된 용어의 상기 정의의 적절성 또는 부적절성의 상기 사용자 확인에서 적어도 부분을 기초로 하여 상기 제2 용어의 상이한 정의들을 랭킹하는 단계, 및
    상기 시스템에 의해, 상기 제2 용어의 상기 상이한 정의들의 랭킹에 따라 상기 제2 용어의 상기 상이한 정의들 중 하나 이상을 표시하는 단계를 더 포함하며,
    상기 선택된 용어는 상기 제2용어와 상이한 방법.
  12. 제11항에 있어서, 상기 시스템은 상기 비교와 상기 랭킹을 수행하는 서버 시스템과 상기 표시를 수행하는 원격 전자 장치를 포함하는 방법.
  13. 삭제
  14. 삭제
  15. 제11항에 있어서, 상기 표시된 정의의 적절성 또는 부적절성의 상기 사용자 확인을 특성화하는 메시지를 원격 사전 데이터 시스템으로 전송하는 단계를 더 포함하는 방법.
  16. 제11항에 있어서, 상기 텍스트의 상기 역사적, 지리적, 및 주제 컨텍스트들 중 하나 이상을 판정하는 단계는 상기 텍스트의 상기 역사적, 지리적, 및 주제 컨텍스트들 중 하나 이상의 텍스트 인디케이션들에 대해 텍스트를 탐색(searching)하는 단계를 포함하는 방법.
  17. 제16항에 있어서, 상기 텍스트의 상기 역사적, 지리적, 및 주제 컨텍스트들 중 적어도 하나 이상을 판정하는 단계는 상기 텍스트와 연관된 미디어 파일 내에서 메타데이터를 액세스하는 단계, 및 상기 메타데이터를 상기 텍스트 인디케이션들과 비교하는 단계를 더 포함하는 방법.
  18. 전자 장치의 시스템에 있어서,
    상기 시스템은 복수의 전자 장치들을 포함하고, 상기 복수의 전자 장치들 각각은:
    제1 용어의 다수의 정의들 - 상기 각각의 정의는 상기 제1 용어의 용법을 적절하게 특성화하는 텍스트의 컨텍스트의 특성화와 연관되어 저장됨 - 및 상기 제1 용어를 포함하는 텍스트 컨텐츠를 포함하는 미디어 파일을 저장하는 하나 이상의 영구 데이터 저장 장치와,
    상기 미디어 파일들의 상기 텍스트 컨텐츠를 표시하도록 구성된 하나 이상의 디스플레이 화면과,
    상기 제1 용어의 사용자 선택을 수신하도록 구성된 하나 이상의 입력 엘리먼트와,
    상이한 텍스트들 내의 제1 용어의 용법을 특성화하기 위한 상이한 정의들의 적절성 또는 부적절성의 사용자 확인들을 수신하도록 프로그래밍된 하나 이상의 데이터 프로세서와,
    동작들을 수행함으로써 상기 제1 용어의 사용자 선택의 수신에 응답하도록 프로그래밍된 하나 이상의 데이터 프로세싱 장치 - 상기 동작들은, 상기 하나 이상의 영구 데이터 저장 장치로부터 상기 텍스트들의 컨텍스트들의 상기 특성화들을 액세스하는 것과, 상기 텍스트들의 컨텍스트들의 상기 액세스된 특성화들을 상기 미디어 파일의 상기 텍스트 컨텐츠의 컨텍스트의 하나 이상의 특징과 비교하는 것과, 상기 정의들이 상기 미디어 파일의 상기 텍스트 컨텐츠 내의 상기 제1 용어의 용법을 적절하게 특성화할 각각의 가능성들에 따라 상기 제1 용어의 정의들을 랭킹하는 것을 포함함- 와, 그리고
    상기 사용자 확인들과 상기 상이한 텍스트들을 특성화하는 메시지들을 출력하도록 구성된 통신 인터페이스
    를 포함하는 전자 장치의 시스템.
  19. 제18항에 있어서,
    복수의 상기 전자 장치들에 의해 출력된 메시지를 수신하도록 구성된 통신 인터페이스와, 복수의 상기 전자 장치들로부터 수신된 상기 사용자 확인들의 특성화들을 저장하는 하나 이상의 영구 데이터 저장 장치를 포함하는 사전 데이터 시스템을 더 포함하는 시스템.
  20. 삭제
  21. 하나 이상의 데이터 프로세싱 장치의 시스템에 의해 구현되는 방법에 있어서,
    상기 시스템에서 복수의 원격 전자 장치로부터, 상이한 텍스트들 내의 제1 용어의 용법들을 특성화하기 위한 상이한 정의들의 적절성 또는 부적절성의 사용자 확인들을 특성화하는 복수의 메시지를 수신하는 단계,
    상기 정의들과 상기 텍스트들을 하나 이상의 영구 데이터 저장 장치에 특성화하는 정보를 저장하는 단계,
    상기 시스템에 의해, 상기 상이한 정의들이 상기 제1 용어의 용법을 적절하게 특성화할 가능성들을 나타내는 가중치들을 결정하도록 상기 하나 이상의 영구 데이터 저장 장치에 저장된 정보를 분석하는 단계, 및
    상기 시스템으로부터 상기 가중치들을 출력하는 단계를 포함하고,
    상기 정의들 중 적어도 몇몇이 기간의 특성화들과 연관되어 저장되며, 상기 하나 이상의 데이터 프로세싱 장치는 상기 텍스트들이 저작되었을 때의 일자를 상기 기간과 비교하는 것인 방법.
  22. 제21항에 있어서, 상기 가중치들을 출력하는 단계는 상기 원격 전자 장치들 중 적어도 몇몇에 상기 가중치들을 배포하는 단계를 포함하는 방법.
KR1020137018134A 2010-12-13 2011-10-25 텍스트의 컨텍스트에 민감한 정의의 제공 KR101854381B1 (ko)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US42242410P 2010-12-13 2010-12-13
US61/422,424 2010-12-13
US13/076,685 2011-03-31
US13/076,685 US8645364B2 (en) 2010-12-13 2011-03-31 Providing definitions that are sensitive to the context of a text
US13/249,410 US8521517B2 (en) 2010-12-13 2011-09-30 Providing definitions that are sensitive to the context of a text
US13/249,410 2011-09-30
PCT/US2011/057658 WO2012082234A1 (en) 2010-12-13 2011-10-25 Providing definitions that are sensitive to the context of a text

Publications (2)

Publication Number Publication Date
KR20140003462A KR20140003462A (ko) 2014-01-09
KR101854381B1 true KR101854381B1 (ko) 2018-06-14

Family

ID=46200232

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020137018134A KR101854381B1 (ko) 2010-12-13 2011-10-25 텍스트의 컨텍스트에 민감한 정의의 제공

Country Status (4)

Country Link
US (3) US8645364B2 (ko)
KR (1) KR101854381B1 (ko)
AU (1) AU2011341662A1 (ko)
WO (1) WO2012082234A1 (ko)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9269353B1 (en) * 2011-12-07 2016-02-23 Manu Rehani Methods and systems for measuring semantics in communications
US20130159847A1 (en) * 2011-12-14 2013-06-20 International Business Machines Corporation Dynamic Personal Dictionaries for Enhanced Collaboration
US8997070B2 (en) * 2011-12-15 2015-03-31 Sap Se Extension mechanism for scripting language compiler
US9342233B1 (en) * 2012-04-20 2016-05-17 Amazon Technologies, Inc. Dynamic dictionary based on context
US20140101544A1 (en) * 2012-10-08 2014-04-10 Microsoft Corporation Displaying information according to selected entity type
US20140101542A1 (en) * 2012-10-09 2014-04-10 Microsoft Corporation Automated data visualization about selected text
KR102050431B1 (ko) * 2012-12-14 2019-12-02 한국전자통신연구원 자연어 처리 기반의 에이전트 시스템의 구동 장치
CN105814557A (zh) * 2013-12-09 2016-07-27 谷歌公司 用于提供文本的基于上下文的定义和翻译的系统和方法
CN104731776B (zh) 2015-03-27 2017-12-26 百度在线网络技术(北京)有限公司 翻译信息的提供方法及系统
US20170052988A1 (en) * 2015-08-20 2017-02-23 International Business Machines Corporation Normalizing values in data tables
US10503818B2 (en) 2016-01-14 2019-12-10 Microsoft Technology Licensing, Llc. Content authoring inline commands
US10169322B2 (en) * 2016-05-03 2019-01-01 Dinky Labs, LLC Personal dictionary
US10832000B2 (en) * 2016-11-14 2020-11-10 International Business Machines Corporation Identification of textual similarity with references
US11188710B2 (en) * 2016-12-30 2021-11-30 Dropbox, Inc. Inline content item editor commands
KR101886131B1 (ko) * 2017-02-01 2018-08-07 부경대학교 산학협력단 외국어 단어 학습을 위한 단어장 생성 방법
US10535342B2 (en) * 2017-04-10 2020-01-14 Microsoft Technology Licensing, Llc Automatic learning of language models
KR101928656B1 (ko) * 2017-06-09 2018-12-12 계명대학교 산학협력단 신장 보호 활성을 갖는 쿠드라트리쿠스잔톤 a를 유효성분으로 포함하는 신장 질환 예방 또는 치료용 조성물
US10740365B2 (en) * 2017-06-14 2020-08-11 International Business Machines Corporation Gap identification in corpora
US11263399B2 (en) * 2017-07-31 2022-03-01 Apple Inc. Correcting input based on user context
US20220198323A1 (en) * 2020-12-22 2022-06-23 Collibra Nv System for preparing machine learning training data for use in evaluation of term definition quality
US11669682B2 (en) * 2020-12-22 2023-06-06 Collibra Belgium Bv Bespoke transformation and quality assessment for term definition

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6961722B1 (en) * 2001-09-28 2005-11-01 America Online, Inc. Automated electronic dictionary
US20080141182A1 (en) * 2001-09-13 2008-06-12 International Business Machines Corporation Handheld electronic book reader with annotation and usage tracking capabilities
US20100169367A1 (en) * 2006-05-04 2010-07-01 Samsung Electronics Co., Ltd. Method and device for selecting a word to be defined in mobile communication terminal having an electronic dictionary

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6219632B1 (en) 1997-11-20 2001-04-17 International Business Machines Corporation System for the facilitation of supporting multiple concurrent languages through the use of semantic knowledge representation
US6772139B1 (en) 1998-10-05 2004-08-03 Smith, Iii Julius O. Method and apparatus for facilitating use of hypertext links on the world wide web
GB9821787D0 (en) 1998-10-06 1998-12-02 Data Limited Apparatus for classifying or processing data
US7254531B2 (en) * 2000-09-05 2007-08-07 Nir Einat H In-context analysis and automatic translation
WO2005020091A1 (en) 2003-08-21 2005-03-03 Idilia Inc. System and method for processing text utilizing a suite of disambiguation techniques
US9547994B2 (en) 2003-10-01 2017-01-17 Kenneth Nathaniel Sherman Progressive reference system, method and apparatus
CN100555264C (zh) 2003-10-21 2009-10-28 国际商业机器公司 电子文档的注释方法、装置和系统
US20050160082A1 (en) 2004-01-16 2005-07-21 The Regents Of The University Of California System and method of context-specific searching in an electronic database
US7869989B1 (en) 2005-01-28 2011-01-11 Artificial Cognition Inc. Methods and apparatus for understanding machine vocabulary
US7827503B2 (en) 2005-07-27 2010-11-02 Yahoo! Inc. Automatically generating a search result in a separate window for a displayed symbol that is selected with a drag and drop control
US7693836B2 (en) * 2005-12-27 2010-04-06 Baynote, Inc. Method and apparatus for determining peer groups based upon observed usage patterns
US7937397B2 (en) 2006-08-22 2011-05-03 Fuji Xerox Co., Ltd. Apparatus and method for term context modeling for information retrieval
EP2067102A2 (en) 2006-09-15 2009-06-10 Exbiblio B.V. Capture and display of annotations in paper and electronic documents
US20080140652A1 (en) 2006-12-07 2008-06-12 Jonathan Travis Millman Authoring tool
US20090063546A1 (en) 2007-08-31 2009-03-05 Caterpillar, Inc. Method and system for creating a data dictionary
KR100958340B1 (ko) * 2007-09-05 2010-05-17 한국전자통신연구원 실시간 대화식 기계 번역 장치 및 방법
US8914363B2 (en) * 2008-05-22 2014-12-16 International Business Machines Corporation Disambiguating tags in network based multiple user tagging systems
US20100005087A1 (en) 2008-07-01 2010-01-07 Stephen Basco Facilitating collaborative searching using semantic contexts associated with information
US20110087670A1 (en) * 2008-08-05 2011-04-14 Gregory Jorstad Systems and methods for concept mapping
US9317589B2 (en) 2008-08-07 2016-04-19 International Business Machines Corporation Semantic search by means of word sense disambiguation using a lexicon

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080141182A1 (en) * 2001-09-13 2008-06-12 International Business Machines Corporation Handheld electronic book reader with annotation and usage tracking capabilities
US6961722B1 (en) * 2001-09-28 2005-11-01 America Online, Inc. Automated electronic dictionary
US20080154582A1 (en) * 2001-09-28 2008-06-26 Aol Llc, A Delaware Limited Liability Company (Formerly Known As America Online, Inc.) Retrieving and providing contextual information
US20100169367A1 (en) * 2006-05-04 2010-07-01 Samsung Electronics Co., Ltd. Method and device for selecting a word to be defined in mobile communication terminal having an electronic dictionary

Also Published As

Publication number Publication date
AU2011341662A1 (en) 2013-07-18
US20120150848A1 (en) 2012-06-14
KR20140003462A (ko) 2014-01-09
US8521517B2 (en) 2013-08-27
US20140149402A1 (en) 2014-05-29
US20120150533A1 (en) 2012-06-14
US8645364B2 (en) 2014-02-04
WO2012082234A1 (en) 2012-06-21

Similar Documents

Publication Publication Date Title
KR101854381B1 (ko) 텍스트의 컨텍스트에 민감한 정의의 제공
TWI790443B (zh) 用於機器學習模型建立之技術
US11295085B2 (en) Navigating electronic documents using domain discourse trees
CN109800386B (zh) 突出显示文档内文本的关键部分
US10528597B2 (en) Graph-driven authoring in productivity tools
US9607032B2 (en) Updating text within a document
Van Hooland et al. Exploring entity recognition and disambiguation for cultural heritage collections
US9852215B1 (en) Identifying text predicted to be of interest
US9342233B1 (en) Dynamic dictionary based on context
US20130110828A1 (en) Tenantization of search result ranking
Ekstrand et al. Searching for software learning resources using application context
US10810357B1 (en) System and method for selection of meaningful page elements with imprecise coordinate selection for relevant information identification and browsing
US20220138422A1 (en) Determining lexical difficulty in textual content
US20220121668A1 (en) Method for recommending document, electronic device and storage medium
CN110489032B (zh) 用于电子书的词典查询方法及电子设备
KR20160100316A (ko) 전자 책들에 대한 엔티티 기반의 요약
JP2015022655A (ja) 電子機器、方法、およびプログラム
US9679047B1 (en) Context-sensitive reference works
KR101783012B1 (ko) 문서 선택에 따른 가이드라인 제공방법, 이를 수행하기 위한 프로그램이 기록된 컴퓨터 판독가능한 기록 매체 및 매체에 저장된 단말장치용 어플리케이션
US20130054585A1 (en) Geographic search with mixed-precision results
US20220277050A1 (en) Identifying search terms by reverse engineering a search index
KR101618600B1 (ko) 문서 선택에 따른 가이드라인 제공방법, 이를 수행하기 위한 프로그램이 기록된 컴퓨터 판독가능한 기록 매체 및 매체에 저장된 단말장치용 어플리케이션
CN117033601A (zh) 基于网络系统使用的智能问答方法、装置、设备及介质
CN116975083A (zh) 信息搜索方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant