KR20240044542A - 구조-기반 자동 하이퍼링킹을 위한 시스템 및 방법 - Google Patents

구조-기반 자동 하이퍼링킹을 위한 시스템 및 방법 Download PDF

Info

Publication number
KR20240044542A
KR20240044542A KR1020247010035A KR20247010035A KR20240044542A KR 20240044542 A KR20240044542 A KR 20240044542A KR 1020247010035 A KR1020247010035 A KR 1020247010035A KR 20247010035 A KR20247010035 A KR 20247010035A KR 20240044542 A KR20240044542 A KR 20240044542A
Authority
KR
South Korea
Prior art keywords
hyperlink
anchor
hyperlinks
text
electronic document
Prior art date
Application number
KR1020247010035A
Other languages
English (en)
Inventor
마이클 거샤
더글러스 거샤
Original Assignee
락 큐브 홀딩스 엘엘씨
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 락 큐브 홀딩스 엘엘씨 filed Critical 락 큐브 홀딩스 엘엘씨
Publication of KR20240044542A publication Critical patent/KR20240044542A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/134Hyperlinking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9558Details of hyperlinks; Management of linked annotations

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

하이퍼링크를 자동으로 삽입하기 위한 방법이 제공된다. 일 실시예에서, 상기 방법은 문서에서 식별된 구조적 요소의 유형을 기반으로 문서에서 하이퍼링크 앵커의 위치를 결정하는 단계를 포함한다. 하이퍼링크 앵커 표시는 구조적 요소의 유형에 따라 하이퍼링크 앵커의 모양을 정의하는 규칙의 집합에 따라 표시될 수 있다.

Description

구조-기반 자동 하이퍼링킹을 위한 시스템 및 방법
본 개시내용은 일반적으로 웹페이지에서 하이퍼링크의 자동 표시에 관한 것이다.
쉽게 액세스할 수 있는 정보에 대한 수요가 증가하면서 공개적으로 사용 가능한 미디어, 예컨대, 인터넷 기반 콘텐츠가 증가했다. 사용자는 인터넷에 호스팅된 웹사이트를 활용할 수 있으므로, 웹사이트를 사용하여 특정 주제 또는 다양한 주제에 대한 정보를 통합하고, 경우에 따라, 다른 웹사이트에서 관련 콘텐츠를 찾을 수도 있다. 웹사이트는 공통 도메인 이름 아래에 있는 하나 이상의 웹페이지를 포함할 수 있고, 웹사이트의 웹페이지 간 탐색, 및 웹사이트와 외부 웹사이트 간의 탐색은 하이퍼링크를 통해 제공될 수 있다.
하이퍼링크는 앵커라고도 하는 HTML 요소로, 현재 전자 문서, 예를 들어, 웹사이트에 표시되는 것과 같은 문서로부터 다른 웹페이지, 파일, 이메일 주소, 동일한 문서 내의 위치, 또는 URL로 주소 지정할 수 있는 임의의 기타 항목까지의 링크를 제공한다. 새 문서는 웹사이트 내의 다른 웹페이지 또는 외부 웹사이트, 예를 들어, 다른 도메인에 속한 웹사이트의 웹페이지일 수 있다. 하이퍼링크는 문서의 관련 지점에 있으며, 링크된 문서의 주제를 나타내는 하이퍼링크의 대상을 나타내는 콘텐츠와 함께 표시된다. 하이퍼링크는 또한 텍스트 외에도 아이콘, 이미지, 및 컨테이너와 같은 HTML 요소를 비롯한 다른 형식의 콘텐츠도 포함할 수 있다. 소수의 페이지와 비교적 적은 양의 콘텐츠를 갖는 웹사이트의 경우, 하이퍼링크는 수동으로 삽입되거나(예를 들어, 웹페이지의 코딩에 입력됨) 또는 하나 이상의 키워드를 기반으로, 예를 들어, 하이퍼링크 생성 알고리즘을 사용하여, 자동으로 생성될 수 있다.
그러나, 많은 양의 정보를 다루는 많은 웹페이지로 형성된, 대량 콘텐츠 웹사이트의 경우, 수동 입력은 힘들고, 비효율적이며, 입력 중 오류가 발생할 수 있다. 키워드 기반 하이퍼링크 생성으로 인해 웹페이지가 복잡하게 표시되거나 웹사이트가 시각적으로 덜 매력적이게 될 수 있다. 웹페이지에 하이퍼링크가 과도하게 많으면 사용자가 하이퍼링크와 상호 작용할 가능성이 줄 수 있고, 예를 들어, 사용자가 너무 많은 하이퍼링크에 둔감해질 수 있다. 반대로, 많은 양의 정보가 포함된 웹페이지에서 하이퍼링크를 드물게 배치하면 하이퍼링크의 가시성이 떨어질 수 있고 하이퍼링크가 웹페이지 텍스트에서 손실될 수 있다. 따라서, 웹페이지에서 하이퍼링크를 찾기가 어려워질 수 있다.
또한, 하이퍼링크의 정적 특성으로 인해 하이퍼링크가 시간에 따라 사용되지 않을 수 있다. 예를 들어, 딥 링크, 예를 들어, 특정 콘텐츠에 대한 링크가 있는 웹페이지에서, 하이퍼링크가 올바로 연결되는 가능성이 시간에 따라 줄 수 있다. 일부 경우에, 끊어지거나 사용되지 않는 하이퍼링크(예를 들어, 더 이상 존재하지 않거나 변경된 대상에 대한 링크)의 수가 시간에 따라 증가할 수 있다. 따라서, 정보 제공에서 웹페이지의 유용성이 끊어진 하이퍼링크로 인해 저하될 수 있다. 하지만, 웹페이지를 수동으로 업데이트하는 일은 하이퍼링크의 정확성을 유지하기 위해 하이퍼링크에 대한 마이그레이션된 대상 또는 적합한 새 대상을 모니터링하고 검색하는 데 시간이 많이 걸릴 수 있으므로 불편하고 비효율적일 수 있다.
보다 의미 있고 유용한 정보 검색 경로를 제공하기 위해 하이퍼링크를 생성 및 표시하는 사용자 지정 가능하고 적응형의 시스템과 방법이 있어야 한다.
본 출원은 2021년 8월 27일에 출원된 “구조-기반 자동 하이퍼링킹을 위한 시스템 및 방법”이라는 명칭의 미국 가특허 출원 번호 63/260,682의 우선권을 주장한다. 상기 명시된 출원의 전체 내용은 모든 목적을 위해 참조로서 본원에 포함된다.
하이퍼링크를 자동으로 삽입하기 위한 하이퍼링크 생성 방법이 제공된다. 상기 방법은 문서에서 식별된 구조적 요소의 유형을 기반으로 문서에서 하이퍼링크 앵커의 위치를 결정하는 단계를 포함한다. 이러한 방식으로, 하이퍼링크의 가시성을 높이고 웹페이지의 정돈되고 복잡하지 않은 모습을 유지하기 위해 문서 내에서 하이퍼링크가 전략적으로 배치될 수 있다.
일 실시양태에서, 하이퍼링크 생성 엔진이 사용자가 입력한 규칙의 집합을 수신하도록 구현될 수 있다. 하이퍼링크 생성 엔진은 웹페이지와 같은 전자 문서에 하이퍼링크를 자동으로 삽입하기 위한 문서 처리 알고리즘으로 구성된 자동 도구일 수 있다. 규칙의 집합은 하이퍼링크가 삽입되는 구조적 요소의 유형에 따라 웹페이지에서 하이퍼링크가 표시되는 방식을 정의할 수 있다. 예를 들어, 웹페이지의 구조적 요소는 하나 이상의 텍스트 단락, 목록, 및 표, 및 위치를 포함할 수 있다. 각 구조적 요소에서 하이퍼링크의 서식은 사용자가 제공한 규칙의 집합을 기반으로 결정될 수 있다. 따라서, 웹페이지로의 하이퍼링크 자동 삽입은 사용자 기본 설정에 따라 사용자 지정되어, 하이퍼링크를 더 구분하기 쉽고, 의미 있는 방식으로 표시할 수 있다. 또한, 하이퍼링크 생성 엔진은 기계 학습 및/또는 인공 지능을 활용하여 시간이 지남에 따라 데이터 세트로부터 적절한 하이퍼링크 배치를 학습할 수 있다. 시간 경과에 따라 데이터 세트도 증가하므로, 하이퍼링크 생성 엔진은 사용자 참여에 따라 증가하는 정확도로 대상 하이퍼링크 배치를 결정할 수 있다.
상술한 간단한 설명은 발명을 실시하기 위한 구체적인 내용에서 추가로 설명하는 선택된 개념을 단순화된 형태로 소개하기 위한 것임을 이해해야 한다. 이는 청구된 발명대상의 주요 또는 필수 특징을 식별하려는 의도가 아니며, 그 범위는 발명을 실시하기 위한 구체적인 내용 이후에 나오는 청구범위에 의해 고유하게 정의된다. 또한, 청구된 발명대상은 위에서 언급된 임의의 단점 또는 본 개시내용의 임의의 부분을 해결하는 실시예로 제한되지 않는다.
본 개시내용은 아래의 첨부된 도면을 참조하여, 비제한적인 실시양태에 대한 다음 설명을 읽으면 더 잘 이해할 수 있다.
도 1은 동적 하이퍼링크 생성 엔진을 통해 사용자 기본 설정에 따라 문서에 하이퍼링크를 자동으로 삽입하도록 구성된 예시적 하이퍼링크 생성 시스템의 블록도를 나타낸다.
도 2는 동적 하이퍼링크 생성 엔진을 통해 하이퍼링크를 자동으로 생성하기 위한 예시적인 네트워크로 연결된 컴퓨팅 시스템의 블록도를 나타낸다.
도 3은 텍스트 단락의 키워드에 하이퍼링크가 자동으로 삽입될 수 있는 문서의 구조적 요소의 예시를 나타낸다.
도 4는 종래의 하이퍼링킹 시스템에 의해 생성되는 하이퍼링킹 오류의 제1 예시를 나타낸다.
도 5A는 문서의 구조적 요소에서 하이퍼링크의 부정확한 표시의 예시를 나타낸다.
도 5B는 도 5A의 하이퍼링크의 더 정확한 표시의 예시를 나타낸다.
도 6A는 문서에서 복잡한 하이퍼링크 배치의 예시를 나타낸다.
도 6B는 도 6A에 비해 더 정돈된 하이퍼링크 배치의 예시를 나타낸다.
도 7은 하이퍼링크가 자동으로 삽입될 수 있는 패턴의 제2 예시를 나타낸다.
도 8A는 도 7의 패턴에 기반을 둔 하이퍼링크의 덜 정확한 배치의 예시를 나타낸다.
도 8B는 도 8A에 비해 하이퍼링크의 더 정확한 배치의 예시를 나타낸다.
도 9A는 패턴을 갖는 구조적 요소에서 하이퍼링크의 덜 정확한 배치의 예시를 나타낸다.
도 9B는 도 9A에 비해, 사용-사례 시나리오에 따라 하이퍼링크의 더 적절한 배치의 예시를 나타낸다.
도 10은 하이퍼링크가 자동으로 배치될 수 있는 구조적 요소의 예시를 나타내며, 여기서 구조적 요소는 글머리 기호 목록이다.
도 11은 하이퍼링크가 자동으로 배치될 수 있는 구조적 요소의 예시를 나타내며, 여기서 구조적 요소는 번호 매기기 목록이다.
도 12는 하이퍼링크가 자동으로 배치될 수 있는 구조적 요소의 예시를 나타내며, 여기서 구조적 요소는 제목이다.
도 13은 하이퍼링크가 자동으로 배치될 수 있는 구조적 요소의 예시를 나타내며, 여기서 구조적 요소는 표다.
도 14는 하이퍼링크가 자동으로 배치될 수 있는 구조적 요소 내의 패턴의 예시를 나타내며, 여기서 패턴은 문장 부호이고 구조적 요소는 글머리 기호 목록이다.
도 15는 문서의 표시 부분에서 허용되는 최대 하이퍼링크 수를 기반으로 한 자동 하이퍼링크 생성의 예시를 나타낸다.
도 16은 문서에 하이퍼링크를 자동으로 삽입하기 위한 방법의 예시를 나타낸다.
다음 설명은 동적 하이퍼링크 생성 시스템의 다양한 실시양태에 관한 것이다. 동적 하이퍼링크 생성 시스템은, 도 1에 도시된 바와 같이, 문서, 예컨대, 웹페이지에 하이퍼링크를 자동으로 삽입할 수 있는 하이퍼링크 생성 엔진을 갖도록 구성될 수 있다. 동적 하이퍼링크 생성 시스템은, 도 2에 도시된 바와 같이, 네트워크로 연결된 컴퓨팅 시스템에 포함될 수 있고, 웹페이지의 다양한 구조적 요소에 하이퍼링크를 삽입할 수 있으며, 이때 하이퍼링크의 표시는 구조적 요소의 유형 및/또는 패턴에 따라 달라질 수 있다. 구조적 요소의 유형/패턴에 따라 하이퍼링크가 표시될 수 있는 방식의 예시가 도 3 내지 도 15에 도시되어 있다. 하이퍼링크를 표시하기 위한 구조-특정 명령을 제공하는 규칙의 집합에 따라 웹페이지에 하이퍼링크를 자동으로 삽입하기 위한 방법의 예시가 도 16에 도시되어 있다.
텍스트 하이퍼링크가 본원에 기술되어 있지만, 상기 시스템 및 방법은 비텍스트 앵커된 하이퍼링크, 예컨대, 이미지, 아이콘, HTML 요소 등으로 구성된 하이퍼링크에 대해 구현될 수 있다는 것을 인식해야 한다. 하이퍼링크의 앵커는 하이퍼링크된 웹사이트, 전자 문서, 이미지 등의 내부 및 외부 모두에 있는, 웹페이지를 비롯한, 다른 유형의 대상에 연결될 수 있다. 상기 대상은 문서 파일 형식, 이미지 파일 형식, 비디오 파일 형식, 음악 파일 형식, PDF, PNG, JPG, TXT, 스프레드시트 파일 형식 등을 비롯한 다양한 혼합 파일 형식을 포함할 수 있다.
이제 도 1로 넘어가면, 동적 하이퍼링크 생성 시스템(100)이 본원에 블록도로 도시되어 있다. 동적 하이퍼링크 생성 시스템(이하, 시스템)(100)은, 아래에서 자세히 기술되는 바와 같이, 전자 텍스트 파일의 콘텐츠 구조와 관련된 사용자 정의 규칙에 따라 실시간으로 하이퍼링크를 자동으로 생성하고 전자 텍스트 파일에 삽입할 수 있다. 하이퍼링크를 다양한 유형의 디지털 콘텐츠를 전자 텍스트 파일에 연결할 수 있다.
시스템(100)은 서버, 예를 들어, 웹 서버(102), 하이퍼링크 생성 엔진(104), 및 콘텐츠 데이터베이스(106)를 포함할 수 있다. 하이퍼링크 생성 엔진(104)은 콘텐츠 데이터베이스(106)로부터 링크된 콘텐츠를 추출할 수 있다. 서버(102)는 네트워크(110)(예를 들어, 인터넷)를 통해 클라이언트 시스템(108)에 연결될 수 있다. 서버(102), 클라이언트 시스템(108), 네트워크(110) 등의 각각이 하나만 도시되어 있지만, 다른 예시들은 시스템(100)의 각 요소를 하나 이상 포함할 수 있음이 이해될 것이다. 또한, 각 요소의 대안적인 유형이 가능하다. 예를 들어, 서버(102)는 인터넷 활동을 호스트하도록 구성될 수 있거나 또는 네트워크로 연결된 환경 내의 서버일 수 있다.
서버(102)는 데이터 콘텐츠, 예컨대, 전자 텍스트 파일을 갖는 웹페이지를 호스트할 수 있다. 전자 텍스트 파일은 전자 문서, 이메일, 뉴스 및 기타 콘텐츠 관련 기사, 블로그 게시물 등을 비롯한 다양한 유형의 텍스트 기반, 컴퓨터 판독 가능 파일일 수 있다. 각 전자 텍스트 파일은 HTML(Hyper-Text Markup Language) 파일, XHTML(Extensible Hyper-Text Markup Language) 파일, 또는 일부 다른 유사한 유형의 파일로 구성될 수 있다. 일 실시예에서, 전자 텍스트 파일은 서버(102) 및 네트워크(110)를 통해 클라이언트 시스템(108)에서 웹사이트에 호스트되고 표시되는 HTML 파일일 수 있다.
전자 텍스트 파일은 하이퍼링크 생성이 시작될 때 요청에 따라 검색될 수 있도록 콘텐츠 데이터베이스(106)에 저장될 수 있다. 예로서, 서버는 콘텐츠 데이터베이스(106)로부터 전자 텍스트 파일(112)을 검색하고 전자 텍스트 파일(112)을 하이퍼링크 생성 엔진(104) 전송할 수 있다. 하이퍼링크 생성 엔진(104)은, 도 3 내지 도 9를 참조하여 아래에서 기술된 바와 같이, 전자 텍스트 파일(112)을 분석 및 처리하여 전자 텍스트 파일(112) 내의 대상 위치에 하이퍼링크를 삽입할 수 있다. 각 하이퍼링크는 하이퍼링크가 포함되는 전자 텍스트 파일(112) 내의 지점, 예를 들어, 하이퍼링크의 앵커, 및 앵커와 상이한 위치, 예를 들어, 하이퍼링크의 대상에 있는 관련 정보의 원본 사이의 브리지일 수 있다.
하이퍼링크는 href 특성을 사용하여 하이퍼링크가 링크되는 URL을 지정할 수 있다. 그러나, 다른 예시들에서, 웹 브라우저에서 지원하는 URL 체계를 준수하는 HTTP 기반 URL 외의 다른 프로토콜이 사용될 수 있다. 다른 하이퍼링크 특성은 대상, 예를 들어, 웹페이지에서 링크된 URL을 표시할 위치, 및 URL로 이동하는 대신 사용자에게 링크된 URL을 컴퓨터에 저장하라는 메시지를 표시하는 Download 특성을 포함할 수 있다. 콘텐츠 데이터베이스(106)의 전자 텍스트 파일(112)에 하이퍼링크를 추가할 때, 하이퍼링크 생성 엔진(104)은 표시된 및/또는 대상으로 지정된 위치에 하이퍼링크를 추가하여 전자 텍스트 파일(112)을 수정할 수 있다. 결과로, 수정된 버전의 전자 텍스트 파일이 원본 파일과 별도로 저장될 수 있다. 전자 텍스트 파일(112)은 일반 텍스트, Markdown 등을 비롯한 다양한 형식으로 작성되고 구문 분석될 수 있고, 사용자에게 반환되기 전에 서버(102)에 의해 최종적으로 HTML로 변환될 수 있다.
대상은 앵커와 동일한 전자 텍스트 파일의 다른 섹션, 하나 이상의 전자 텍스트 파일로 구성된 동일한 웹사이트에 포함된 다른 전자 텍스트 파일, 또는 다른 웹사이트에 있을 수 있다. 하이퍼링크의 앵커는 사용자가 앵커에 의해 표시된 주제에 관련된 추가 정보에 쉽게 액세스할 수 있도록 사용자에게 표시되는 웹페이지에서 시각적으로 구분되는 문자, 단어, 구, 문장, 이미지, 이모지, 기호 등일 수 있다. 여기서, 하이퍼링크는 변경 가능한 앵커 및 앵커를 기반으로 선택되는 대상 사이의 링크를 제공할 수 있다. 예를 들어, 앵커는 사용자가 웹페이지와 상호작용할 때 사용자의 동작을 모니터링함으로써 결정될 수 있는 사용자의 표시된 관심 주제를 수용하도록 실시간으로 변경될 수 있다. 하이퍼링크의 대상은 앵커의 변경 사항에 따라 실시간으로 유사하게 조정될 수 있으며, 따라서, 사용자가 유용한 정보를 신속하게 획득할 수 있는 가능성이 높아질 수 있다.
전자 텍스트 파일(112)의 대상 위치는 대상 위치와 관련된 웹사이트를 식별하고 찾기 위해 웹페이지 데이터베이스 인덱스(114)를 질의하는 데 사용될 수 있다. 웹페이지 데이터베이스 인덱스(114)는 인덱싱된 내부 웹페이지, 예를 들어, 전자 텍스트 파일(112)이 표시되는 동일한 웹사이트에 포함된 웹페이지, 및/또는 외부 웹페이지, 예를 들어, 전자 텍스트 파일(112)이 표시되는 웹사이트와 다른 웹사이트에 포함된 웹페이지, 또는 다른 유형의 전자 문서의 인덱싱된 버전을 포함할 수 있다. 웹페이지 데이터베이스 인덱스(114)의 인덱싱된 웹페이지는 전자 텍스트 파일(112)의 대상 위치와 관련된 메타 데이터로 식별되는 웹페이지일 수 있고, 하이퍼링크 생성 엔진(104)은 웹페이지 데이터베이스 인덱스(114)를 질의하여 대상 위치에 해당하는 메타데이터 식별자를 갖는 웹페이지를 찾을 수 있다.
관련 웹페이지를 식별하면, 하이퍼링크 생성 엔진(104)은 전자 텍스트 파일(112)의 각 대상 위치에 하이퍼링크를 동적으로 생성할 수 있으므로, 전자 텍스트 파일(112)을 각 하이퍼링크에서 연결된 웹페이지에 링크할 수 있다. 일 실시예에서, 웹페이지 데이터베이스 인덱스(114)는 웹페이지 데이터베이스(116)에 저장된 웹페이지를 미러링하는 웹페이지의 인덱싱된 버전을 포함하며, 웹페이지 데이터베이스는 서버(102)에 저장될 수 있다. 웹페이지 데이터베이스(116)에서 웹페이지가 추가되거나 제거되면, 웹페이지 데이터베이스 인덱스(114)는 통신 링크(120)를 통해 적절하게 업데이트될 수 있다. 하이퍼링크 생성 엔진(104)은 통신 링크(120)를 통해 웹페이지 데이터베이스(116)에 저장된 웹페이지의 주소 및 위치에 액세스할 수 있다. 전자 텍스트 파일(112)은 하이퍼링크 생성 엔진(104)에 의해 하이퍼링크된 전자 텍스트 파일(118)로 변환되고, 하이퍼링크된 전자 텍스트 파일(118)을 서버(102)로 반환함으로써 클라이언트 시스템(108)이 액세스할 수 있다. 일부 실시예에서, 하이퍼링크된 전자 텍스트 파일(118)은 콘텐츠 데이터베이스(106)에 저장될 수 있다.
서버(102) 및 클라이언트 시스템(108)의 세부사항은 도 2에 도시되어 있다. 도 2는 일 실시양태에 따른 예시적인 네트워크로 연결된 컴퓨팅 시스템(200)을 나타내는 블록도이다. 네트워크로 연결된 컴퓨팅 시스템(200)은 서버(102) 및 네트워크(110)를 통해 서버(102)와 통신할 수 있도록 결합된 클라이언트 시스템(108)을 포함한다. 네트워크로 연결된 컴퓨팅 시스템(200)의 구성요소의 배열 및 유형에서의 변형은 본 개시내용의 범위를 벗어나지 않고 만들어질 수 있다는 것을 이해해야 한다. 예를 들어, 네트워크로 연결된 컴퓨팅 시스템(200)은 네트워크(110)를 통해 서버(102)와 통신할 수 있도록 결합된 하나 이상의 클라이언트 시스템(108)을 포함할 수 있다.
서버(102)는 클라이언트 시스템(108)과 같은 하나 이상의 클라이언트 시스템에 요청에 따라 웹페이지를 제공하도록 구성된 컴퓨팅 시스템을 포함한다. 도 1에서는 서버(102)가 단일 디바이스로서 도시되어 있지만, 일부 실시양태에서, 네트워크로 연결된 컴퓨팅 시스템(200)은 분산 컴퓨팅을 위해 구성된 복수의 서버(102)를 포함할 수 있다. 다른 실시양태에서, 서버(102)는 메인프레임 컴퓨터, 서버 컴퓨터, 데스크탑 컴퓨터, 노트북 컴퓨터, 태블릿 컴퓨터, 네트워크 컴퓨팅 디바이스, 모바일 컴퓨팅 디바이스, 마이크로프로세서 등의 형태를 취할 수 있다.
서버(102)는 논리 하위시스템(202) 및 데이터-보유(data-holding) 하위시스템(204)을 포함한다. 논리 하위시스템(202)은 하나 이상의 명령을 실행하도록 구성된 하나 이상의 물리적 디바이스를 포함할 수 있다. 예를 들어, 논리 하위시스템(202)은 하나 이상의 애플리케이션, 서비스, 프로그램, 루틴, 라이브러리, 개체, 구성요소, 데이터 구조, 또는 기타 논리적 구문의 일부인 하나 이상의 명령을 실행하도록 구성될 수 있다. 이러한 명령은 작업을 수행하거나, 데이터 형식을 구현하거나, 하나 이상 디바이스의 상태를 변환하거나, 또는 그렇지 않으면 원하는 결과에 도달하기 위해 구현될 수 있다.
논리 하위시스템(202)은 소프트웨어 명령을 실행하도록 구성된 하나 이상의 프로세서를 포함할 수 있다. 추가로 또는 대안적으로, 논리 하위시스템(202)은 하드웨어 또는 펌웨어 명령을 실행하도록 구성된 하나 이상의 하드웨어 또는 펌웨어 논리 머신을 포함할 수 있다. 논리 하위시스템(202)의 프로세서는 단일 코어 또는 다중-코어일 수 있고, 그 상에서 실행되는 프로그램은 병렬 또는 분산 처리를 위해 구성될 수 있다. 논리 하위시스템(202)은, 원격으로 배치 및/또는 조정된 처리를 위해 구성될 수 있는, 둘 이상의 디바이스 전반에 분산되는 개별 구성요소를 선택적으로 포함할 수 있다. 논리 하위시스템(202)의 하나 이상의 측면은 클라우드 컴퓨팅 구성으로 구성된 원격으로 액세스할 수 있는 네트워크로 연결된 컴퓨팅 디바이스에 의해 가상화되고 실행될 수 있다.
데이터 보유 하위시스템(204)은 본원에 기술된 방법 및 프로세스를 구현하기 위해 논리 하위시스템(202)에 의해 실행될 수 있는 데이터 및/또는 명령을 보유하도록 구성된 하나 이상의 물리적 디바이스를 포함할 수 있다. 이러한 방법 및 프로세스가 구현될 때, 데이터-보유 하위시스템(204)의 상태가 (예를 들어, 다른 데이터를 보유하기 위해) 변환될 수 있다.
상술한 바와 같이, 서버(102)는 웹페이지와 같은 문서에서 하이퍼링크를 자동으로 생성하기 위한 웹 서버일 수 있다. 특히, 본원에 자세히 기술된 바와 같이, 하이퍼링크 생성 엔진(104)은 데이터-보유 하위시스템(204)에 업로드된 전자 파일 메타데이터와 관련된 코드를 평가하고, 평가된 코드를 기반으로, 도 1의 웹페이지 데이터베이스 인덱스(114) 및 웹페이지 데이터베이스(116)를 포함하는, 하나 이상의 데이터베이스(206)를 생성하고, 추가 사용자 입력 없이 자동으로 하이퍼링크를 생성할 수 있다. 하나 이상의 데이터베이스(206)가 서버(102)의 데이터-보유 하위시스템(204)에 저장된 것으로 도시되어 있지만, 일부 실시예에서, 하나 이상의 데이터베이스(206)는 서버(102)와 통신할 수 있도록 결합되고 네트워크(110)를 통해 액세스할 수 있는 별도의 컴퓨팅 시스템에 저장될 수 있다는 것을 이해해야 한다.
서버(102)는 디스플레이 하위시스템(208) 및 통신 하위시스템(210)을 추가로 포함할 수 있다. 포함되는 경우, 디스플레이 하위시스템(208)은 데이터-보유 하위시스템(204)에 의해 보유된 데이터의 시각적 표현을 제시하기 위해 사용될 수 있다. 본원에 기술된 방법 및 프로세스가 데이터-보유 하위시스템(204)에 의해 보유된 데이터를 변경하고, 따라서 데이터-보유 하위시스템(204)의 상태를 변환하면, 디스플레이 하위시스템(208)의 상태도 마찬가지로 기본 데이터의 변경사항을 시각적으로 표시하기 위해 변환될 수 있다. 디스플레이 하위시스템(208)은 거의 모든 유형의 기술을 활용하는 하나 이상의 디스플레이 디바이스를 포함할 수 있다. 이러한 디스플레이 디바이스는 공유 인클로저에서 논리 하위시스템(202) 및/또는 데이터-보유 하위시스템(204)과 결합될 수 있거나, 또는 이러한 디스플레이 디바이스는 주변기기 디스플레이 디바이스일 수 있다.
포함되는 경우, 통신 하위시스템(210)은 서버(102)를 클라이언트 시스템(108)과 같은 하나 이상의 다른 컴퓨팅 디바이스와 통신 가능하게 결합하도록 구성될 수 있다. 통신 하위시스템(210)은 하나 이상의 다른 통신 프로토콜과 호환되는 유선 및/또는 무선 통신 디바이스를 포함할 수 있다. 비제한적인 예로서, 통신 하위시스템(210)은 무선 전화 네트워크, 무선 근거리 통신망, 유선 근거리 통신망, 무선 광역 네트워크, 유선 광역 네트워크 등을 통한 통신을 위해 구성될 수 있다. 일부 실시양태에서, 통신 하위시스템(210)은 서버(102)가 공용 인터넷을 통해 다른 디바이스에/로부터 메시지를 전송 및/또는 수신할 수 있도록 할 수 있다. 예를 들어, 통신 하위시스템(210)은 서버(102)를 네트워크(110)를 통해 클라이언트 시스템(108)과 통신할 수 있도록 결합할 수 있다. 일부 실시예에서, 네트워크(110)는 공용 인터넷일 수 있다. 다른 실시예에서, 네트워크(110)는 사설 네트워크 연결로 간주될 수 있고, 예를 들어, 가상 사설망 또는 암호화 또는 공용 인터넷을 통해 사용되는 기타 보안 메커니즘을 포함할 수 있다.
또한, 서버(102)는 네트워크(110)를 통해 서버(102)와 통신할 수 있도록 결합된 클라이언트 시스템(108)과 같은 복수의 클라이언트 시스템을 통해 복수의 사용자가 액세스할 수 있는 네트워크 서비스를 제공한다. 따라서, 네트워크로 연결된 컴퓨팅 시스템(200)은 클라이언트 시스템(108)과 같이 사용자가 운영하는 하나 이상의 디바이스를 포함할 수 있다. 클라이언트 시스템(108)은 네트워크(110)와 같은 네트워크에 액세스하도록 구성된, 개인용 데스크탑 컴퓨터, 노트북, 스마트폰, 태블릿 등을 포함하지만 이에 제한되지 않는, 임의의 컴퓨팅 디바이스일 수 있다. 하나의 클라이언트 시스템(108)이 도시되어 있지만, 임의의 수의 사용자 디바이스 또는 클라이언트 시스템이 네트워크(110)를 통해 서버(102)와 통신 가능하도록 결합될 수 있다는 것을 이해해야 한다.
클라이언트 시스템(108)은 논리 하위시스템(212) 및 데이터-보유 하위시스템(214)을 포함한다. 클라이언트 시스템(108)은 디스플레이 하위시스템(216), 통신 하위시스템(218), 사용자 인터페이스 하위시스템(220), 및/또는 도 2에 도시되지 않은 기타 구성요소를 선택적으로 포함할 수 있다.
논리 하위시스템(212)은 하나 이상의 명령을 실행하도록 구성된 하나 이상의 물리적 디바이스를 포함할 수 있다. 예를 들어, 논리 하위시스템(212)은 하나 이상의 애플리케이션, 서비스, 프로그램, 루틴, 라이브러리, 개체, 구성요소, 데이터 구조, 또는 기타 논리적 구문의 일부인 하나 이상의 명령을 실행하도록 구성될 수 있다. 이러한 명령은 작업을 수행하거나, 데이터 형식을 구현하거나, 하나 이상 디바이스의 상태를 변환하거나, 또는 그렇지 않으면 원하는 결과에 도달하기 위해 구현될 수 있다.
논리 하위시스템(212)은 소프트웨어 명령을 실행하도록 구성된 하나 이상의 프로세서를 포함할 수 있다. 추가로 또는 대안적으로, 논리 하위시스템(212)은 하드웨어 또는 펌웨어 명령을 실행하도록 구성된 하나 이상의 하드웨어 또는 펌웨어 논리 머신을 포함할 수 있다. 논리 하위시스템(212)의 프로세서는 단일 코어 또는 다중-코어일 수 있고, 그 상에서 실행되는 프로그램은 병렬 또는 분산 처리를 위해 구성될 수 있다. 논리 하위시스템(212)은, 원격으로 배치 및/또는 조정된 처리를 위해 구성될 수 있는, 둘 이상의 디바이스 전반에 분산되는 개별 구성요소를 선택적으로 포함할 수 있다. 논리 하위시스템(212)의 하나 이상의 측면은 클라우드 컴퓨팅 구성으로 구성된 원격으로 액세스할 수 있는 네트워킹 컴퓨팅 디바이스에 의해 가상화되고 실행될 수 있다.
데이터 보유 하위시스템(214)은 본원에 기술된 방법 및 프로세스를 구현하기 위해 논리 하위시스템(212)에 의해 실행될 수 있는 데이터 및/또는 명령을 보유하도록 구성된 하나 이상의 물리적, 비-일시적 디바이스를 포함할 수 있다. 이러한 방법 및 프로세스가 구현될 때, 데이터-보유 하위시스템(214)의 상태가 (예를 들어, 다른 데이터를 보유하기 위해) 변환될 수 있다.
데이터-보유 하위시스템(214)은 이동식 미디어 및/또는 내장 디바이스를 포함할 수 있다. 데이터-보유 하위시스템(214)은 광메모리(예를 들어, CD, DVD, HD-DVD, Blu-Ray 디스크 등), 및/또는 자기 메모리 디바이스(예를 들어, 하드 드라이브 디스크, 플로피 디스크 드라이브, 테이프 드라이브, MRAM 등) 등을 포함할 수 있다. 데이터 보유 하위시스템(214)은 휘발성, 비휘발성, 동적, 정적, 읽기/쓰기, 읽기 전용, 임의 액세스, 순차 액세스, 위치 주소 지정 가능, 파일 주소 지정 가능, 및 콘텐츠 주소 지정 가능 중 하나 이상의 특성을 갖는 디바이스를 포함할 수 있다. 일부 실시양태에서, 논리 하위시스템(212) 및 데이터-보유 하위시스템(214)은 애플리케이션-특정 집적 회로 또는 시스템온칩(system on a chip)과 같은 하나 이상의 공통 디바이스에 통합될 수 있다.
포함되는 경우, 디스플레이 하위시스템(216)은 데이터-보유 하위시스템(214)에 의해 보유된 데이터의 시각적 표현을 제시하기 위해 사용될 수 있다. 본원에 기술된 방법 및 프로세스가 데이터-보유 하위시스템(214)에 의해 보유된 데이터를 변경하고, 따라서 데이터-보유 하위시스템(214)의 상태를 변환하면, 디스플레이 하위시스템(216)의 상태도 마찬가지로 기본 데이터의 변경사항을 시각적으로 표시하기 위해 변환될 수 있다. 디스플레이 하위시스템(216)은 거의 모든 유형의 기술을 활용하는 하나 이상의 디스플레이 디바이스를 포함할 수 있다. 이러한 디스플레이 디바이스는 공유 인클로저에서 논리 하위시스템(212) 및/또는 데이터-보유 하위시스템(214)과 결합될 수 있거나, 또는 이러한 디스플레이 디바이스는 주변기기 디스플레이 디바이스일 수 있다.
일 실시예에서, 클라이언트 시스템(108)은 논리 하위시스템(212)에 의해 실행될 때 논리 하위시스템(212)이 본원에서 자세히 기술되는 바와 같은 다양한 작업을 수행하게 하는 실행할 수 있는 명령(222)을 데이터 보유 하위시스템(214)에 포함할 수 있다. 일 실시예로서, 클라이언트 시스템(108)은 서버(102)에 의해 전송된 하나 이상의 하이퍼링크를 포함하는 웹페이지를 수신하고, 디스플레이 하위시스템(216)에서 그래픽 사용자 인터페이스를 통해 하이퍼링크된 웹페이지를 사용자에게 표시하도록, 명령(222)을 통해, 구성될 수 있다.
포함되는 경우, 통신 하위시스템(218)은 클라이언트 시스템(108)을 서버(102)와 같은 하나 이상의 다른 컴퓨팅 디바이스와 통신 가능하게 결합하도록 구성될 수 있다. 통신 하위시스템(218)은 하나 이상의 다른 통신 프로토콜과 호환되는 유선 및/또는 무선 통신 디바이스를 포함할 수 있다. 비제한적인 예로서, 통신 하위시스템(218)은 무선 전화 네트워크, 무선 근거리 통신망, 유선 근거리 통신망, 무선 광역 네트워크, 유선 광역 네트워크 등을 통한 통신을 위해 구성될 수 있다. 일부 실시양태에서, 통신 하위시스템(218)은 클라이언트 시스템(108)이 네트워크(110)를 통해 서버(102)와 같은 다른 디바이스에/로부터 메시지를 전송 및/또는 수신할 수 있도록 할 수 있다.
클라이언트 시스템(108)은 키보드, 마우스, 게임 컨트롤러, 카메라, 마이크, 및/또는 터치 스크린과 같은 사용자 입력 디바이스를 포함하는 사용자 인터페이스 하위시스템(220)을 추가로 포함할 수 있다. 클라이언트 시스템(108)의 사용자는, 예를 들어, 사용자 인터페이스 하위시스템(220)을 통해, 서버(102)에 의해 저장된 웹페이지의 하이퍼링크를 로드하거나 그러지 않으면 상호작용하기 위해 요청을 입력할 수 있다.
따라서, 서버(102) 및 클라이언트 시스템(108)은 각각, 일반적으로 계산을 수행하도록 구성되고 하나 이상의 유선 및/또는 무선 통신 인터페이스를 통해 데이터 통신을 전송 및 수신할 수 있는 임의의 디바이스를 포함할 수 있는, 컴퓨팅 디바이스를 나타낸다. 이러한 디바이스는 다양한 네트워크 프로토콜 중 임의의 것을 사용하여 통신하도록 구성될 수 있다. 예를 들어, 클라이언트 시스템(108)은 HTTP를 사용하여 서버(102)로부터 정보를 요청한 다음 디스플레이 하위시스템(216)과 같은 디스플레이에서 검색된 정보를 사용자에게 표시하는 명령(222)으로 저장된 브라우저 애플리케이션을 실행하도록 구성될 수 있다.
하이퍼링크 생성 엔진, 예를 들어, 도 1 및 도 2의 하이퍼링크 생성 엔진(104)은 웹페이지의 하이퍼링크가 자동으로 삽입되도록 할 수 있다. 웹페이지에 하이퍼링크를 자동으로 삽입하는 종래의 방법과는 달리, 하이퍼링크 생성 엔진(104)은 웹페이지에서 사용할 수 있는 구조적 요소의 유형을 기반으로 하이퍼링크를 추가할 수 있다. 다시 말해, 하이퍼링크의 배치가 페이지 구조를 기반으로 결정될 수 있다. 또한, 하이퍼링크의 배치 및 표시는, 예를 들어, 키워드를 기반으로 하이퍼링크를 삽입하는 것과 비교하여, 더 구분하기 쉽고 적절한 하이퍼링크의 배치를 제공하는 사용자 정의 규칙의 집합에 따라 선택될 수 있다. 페이지 구조에 따라 하이퍼링크를 추가함으로써, 웹페이지를 탐색할 때 사용자 경험이 향상될 수 있고, 사용자가 원하는 정보를 보다 효율적으로 얻을 수 있다. 또한, 하이퍼링크는 웹페이지에서 더 미적으로 매력적이고 의미 있는 위치에 배치될 수 있으므로, 사용자가 하이퍼링크와 상호작용할 가능성을 높일 수 있다.
예로서, 하이퍼링크를 생성하기 위한 종래의 시스템에서는, 전자 텍스트 파일 내의 키워드가 식별되어 하이퍼링크될 수 있고, 그 결과 웹페이지에서 키워드가 나올 때마다 하이퍼링크가 생성될 수 있다. 일부 경우에, 키워드가 웹페이지의 섹션 내에서 여러 번 반복될 수 있다. 예를 들어, 키워드는 웹페이지의 각 단락의 각 문장에 적어도 한 번 나타날 수 있다. 결과적으로, 섹션에 하이퍼링크가 많아져서 텍스트가 복잡하게 보여 사용자가 싫어할 수 있다. 또한, 하이퍼링크 생성을 위한 종래의 방법은 하이퍼링크될 키워드를 다른 키워드 내에서 식별하는 기능, 대시, 아포스트로피, 키워드의 복수 형태 또는 굴절을 갖는 키워드에 맞게 조정하는 기능, 및/또는 키워드의 중첩된 일치에 맞게 조정하는 기능을 포함하지 않을 수 있다.
일 실시예에서, 본원에 기술된 바와 같이, 하이퍼링크 생성 엔진은 특정 서식, 예를 들어, 패턴, 및 웹페이지에 표시된 구조적 요소를 기반으로 하이퍼링크 배치를 선택할 수 있다. 예를 들어, 하이퍼링크 생성은, 텍스트 및/또는 문서 처리 알고리즘을 통해, 구조적 요소, 예컨대, 다른 유형의 목록(글머리 기호, 번호 매기기 등), 제목, 표, 텍스트의 단락, 이미지 상의 좌표 등을 식별하고, 사용자에 의해 정의될 수 있는 하이퍼링크 배치를 위한 규칙의 집합을 참조할 수 있다. 패턴은 하이퍼링크 배치를 위한 대상 앵커(예를 들어, 키워드)의 발생 또는 빈도, 하이퍼링크 사이의 거리, 웹페이지에서 허용되는 최대 하이퍼링크 수, 하이퍼링크될 구조적 요소의 백분율 등을 포함할 수 있다. 구조적 요소 내에서 하이퍼링크의 위치 지정은 규칙의 집합을 기반으로 결정될 수 있다. 예를 들어, 글머리 기호 목록에서 글머리 기호 앞이나 뒤에 하이퍼링크를 배치하는 것이 규칙의 집합에 의해 결정될 수 있다. 하이퍼링크 생성 엔진을 통한 하이퍼링크 삽입에 대한 추가적인 세부사항은 도 3 내지 도 7을 참조하여 아래에 제공된다.
이제 도 3으로 넘어가면, 하이퍼링크 삽입을 위한 구조적 요소의 제1 실시예가 텍스트의 단락(300) 내에 도시되어 있다. 단락(300)은 단락의 다양한 단어 또는 용어에 있는 복수의 하이퍼링크를 포함한다. 이와 같이, 복수의 하이퍼링크 중 하나가 배치되는 각 용어를 하이퍼링크의 앵커라고 한다. 단락(300)에 도시된 각 앵커는 단락의 주제와 관련하여 유용한 정보를 제공하는 특정 용어 또는 구에 해당할 수 있다.
예를 들어, 단락(300)은 풋볼에서 "Scoring Rules(득점 규칙)"를 정의하기 위한 것이고, 각 앵커는 "Scoring Rules(득점 규칙)"를 추가로 정의하고/하거나 "Scoring Rules(득점 규칙)"와 의미 있는 연결을 갖는 구의 용어이다. 각 앵커는 추가적인 관심을 장려할 수 있고, 따라서 사용자, 예를 들어, 정보를 위해 웹페이지를 정독하는 사용자가 앵커에 의해 소개된 주제에 관한 정보를 제공하는 다른 웹페이지 또는 전자 문서로 이동할 수 있도록 하이퍼링크될 수 있다. 앵커에 결합된 대상은, 예를 들어, 하이퍼링크에 의해 제공되는 바와 같이, 다른 웹페이지 또는 전자 문서로의 직접적인 이동 이외의 다양한 방식으로 제시될 있다는 것이 이해될 것이다. 다른 실시예는, 예를 들어, 앵커에 관한 정보를 제공하는 웹페이지의 다른 섹션으로 웹페이지를 스크롤하는 것을 포함할 수 있다. 다른 일 실시예로서, 사용자가 앵커와 상호작용할 때 현재 웹페이지에서 팝업 표시가 활성화될 수 있으며, 여기서 팝업은 앵커의 정의, 앵커와 관련된 대상의 목록 등을 표시할 수 있다.
일 실시예에서, 앵커는 사용자(예를 들어, 하이퍼링크 생성 엔진에 대한 규칙을 제공하는 사용자)가 정의한 미리 결정된 키워드 및 핵심 구의 집합을 기반으로 하이퍼링크 생성 엔진에 의해 웹페이지에서 표시되는 텍스트로부터 선택될 수 있다. 다른 일 실시예에서, 미리 결정된 키워드 집합은 기계 학습(ML) 및/또는 인공 지능(Al)을 사용하여 정의될 수 있다. 예를 들어, 키워드, 구, 및 대상뿐만 아니라, 웹페이지/웹사이트 또는 관련 웹페이지/웹사이트의 구조적 요소는 웹사이트의 웹페이지 제목을 기반으로 자동으로 식별되고 텍스트-대상 맵(text-to-destination map)을 생성하는 데 사용될 수 있다.
텍스트-대상 맵은 하이퍼링크된 웹페이지의 요소, 예를 들어, 대상 위치 및 하이퍼링크가 웹페이지를 연결하는 대상에 대한 기록을 구축하기 위한 도구로서 사용될 수 있다. 또한, 텍스트-대상 맵은 하나 이상의 링크 가능한 텍스트 및 하나 이상의 대상 사이의 관계 및 연결을 저장할 수 있으며, 하이퍼링크는 저장된 관계 및 연결을 기반으로 생성된다.
텍스트-대상 맵을 사용하여 하이퍼링크 생성 엔진이 웹사이트의 각 웹페이지에서 하이퍼링크 앵커로서 사용될 수 있는 명사, 엔티티, 이름, 구, 및 이미지와 같은 링크 가능한 텍스트, 및 그들과 관련된 대상을 자동으로 식별할 수도 있다. 이후 하이퍼링크 생성을 위해 하이퍼링크 생성 엔진에서 액세스할 수 있는 레코드가 생성될 수 있다. 이 도구는 사용자가 웹페이지와 상호작용할 때 실시간으로 질의할 수 있는 앵커 및 대상의 맵을 생성할 수 있고, 따라서 의미 있고 유용한 동적 하이퍼링크 배치를 지원할 수 있다. 텍스트-대상 맵은, 예를 들어, 하이퍼링크 생성 엔진이 액세스할 수 있는 데이터베이스에 기록될 수 있다.
사용자가 제공하거나 ML/Al을 통해 생성된, 미리 결정된 키워드 집합은 하이퍼링크 생성 엔진을 위한 규칙의 집합에 저장될 수 있고, 하이퍼링크 생성 엔진은 하이퍼링크 삽입이 필요한 각 웹페이지에 대한 키워드 집합을 참조할 수 있다. 웹페이지는 그룹화되거나 태그가 지정되어, 해당하는 태그를 갖는 미리 결정된 키워드의 참조 집합과 일치될 수 있다. 대안적으로, 키워드는 페이지에서 페이지 단위로 설정될 수 있다. 키워드는 컨텍스트에 관계없이 "모든 곳에 링크"하도록 구성된 전역 키워드, 또는 "주제 내에서만 링크"하도록 구성된 컨텍스트 기반 키워드일 수 있다. 키워드는 주제에 따라 다른 의미를 가질 수 있으므로, 하이퍼링킹을 위한 (주제에 따라) 보다 관련성이 높은 키워드 목록은 사용자 또는 AI/ML에 의해 결정될 수 있다. 또한, 키워드는 중요도 및 관련성에 따라 더 높은 가중치 또는 순위를 가질 수 있다. 예를 들어, 엔티티의 이름은 형용사보다 가중치 또는 순위가 더 높을 수 있다.
예로서, 텍스트-대상 맵은 사용자 입력 또는 웹사이트의 웹페이지 및 메타데이터를 읽어 들이는 AI/ML에 의해 생성될 수 있다. 키워드 및/또는 핵심 구는 텍스트 말뭉치 및 키워드/핵심 구의 데이터베이스 사이의 일치를 기반으로 텍스트 말뭉치에서 식별될 수 있다. 하이퍼링크는 일치 항목에서, 텍스트-대상 맵으로부터의 대상을 키워드/핵심 구에 링크하여, 생성될 수 있다.
규칙의 집합이 없으면, 자동 하이퍼링크 생성은 키워드/핵심 구의 데이터베이스만 사용하므로 처리 능력에 큰 부담을 줄 수 있고 오류가 발생하기 쉽다. 예를 들어, 도 4에 도시된 바와 같이, 하이퍼링크 생성 엔진은 주변 텍스트 또는 식별된 키워드의 컨텍스트를 기반으로 적절한 하이퍼링크 배치를 결정할 수 없을 수 있다. 예를 들어, 도 4에 도시된 단락(400)의 제2 글머리 기호에서, 하이퍼링크 생성 엔진은 "point"와 키워드 데이터베이스 사이의 일치를 찾고, 그 위치에 하이퍼링크(402)를 생성할 수 있다. 그러나, 단락(400)에서, 더 관련성 높은 앵커는 단락(400)의 주제를 기반으로 "point"만보다는 "two-point conversion"일 수 있다. 따라서, "point"에 설정된 하이퍼링크는 관련성이 낮고 사용자가 거의 관심을 두지 않는 대상에 앵커될 수 있다.
도 5A에 도시된 바와 같이, 다른 일 실시예에서, 규칙의 집합은 의미로 연결되어 구를 형성하는 용어들에서의 하이퍼링크 배치를 위한 명령을 제공할 수 있다. 예를 들어, 키워드의 식별만을 기반으로, 웹페이지에서 텍스트를 자동 하이퍼링크하기 위한 종래의 시스템은 앵커(500)의 적절한 컨텍스트를 고려하지 않고 하이퍼링크할 앵커(500)를 선택하는 것을 포함할 수 있다. 텍스트 단락(502)의 제3 문장은 running back에 대한 설명을 제공할 수 있는데, 종래의 시스템은 구의 제1 부분, 예를 들어, "running" 및 구의 제2 부분, 예를 들어, "back" 사이의 관계를 인식하도록 구성되지 않을 수 있다. 결과적으로, 제1 부분만 앵커(500)로 사용되고, "running back"이 아닌 "running"과 관련된 대상에 링크될 수 있다.
대조적으로, 도 5B에 도시된 바와 같이, 하이퍼링크 생성 엔진은 도 5A의 텍스트 단락(502)의 주제를 기반으로 하이퍼링크를 위한 더 적합한 앵커(550)를 평가할 수 있도록 하는 규칙의 집합을 사용하여 구성될 수 있다. 일부 경우에, 텍스트 단락(502)의 제목(예를 들어, "Football Touchdowns"), 또는 웹페이지 제목이 주제를 식별하기 위해 사용될 수 있다. 이와 같이, 전체 구 "running backs"는 "running"만보다 더 관련성이 높은 것으로 결정될 수 있고, 앵커(550)로 사용될 수 있다. 하이퍼링크의 대상은 running backs와 관련된 추가 정보를 제공할 수 있다. 하이퍼링크 생성 엔진은 더 긴 앵커 텍스트와 연관된 더 높은 관련성으로 인해 둘 이상의 가능한 앵커를 비교할 때 더 긴 앵커 텍스트를 먼저 사용하도록 구성될 수 있다. 결과적으로, "Running"이 아닌 "Running backs"를 하이퍼링크하는 것은 풋볼 터치다운에 따른 더 관련성이 높은 대상에 대한 링크를 제공할 수 있다.
하이퍼링크 생성 엔진을 안내하는 규칙의 집합을 구현하면, 하이퍼링크는 데이터베이스로부터의 키워드/핵심 구와 일치하고 규칙의 집합을 충족한 후에만 생성될 수 있다. 규칙의 집합을 충족하면, 구조, 사용자 정의 규칙, 및 패턴, 예컨대, 하이퍼링크 사이의 거리 또는 웹페이지의 구조적 요소의 일부를 고려하여 키워드/핵심 구가 자동으로 링크될 수 있다.
하이퍼링크 생성 엔진에 명령을 제공하는 규칙의 집합은 앵커로 표시된 용어 또는 구가 이후 앵커로 표시될 수 있는 빈도에 관한 규칙을 포함할 수 있다. 예를 들어, 규칙의 집합은 용어/구의 첫 번째 발생에서 용어 또는 구를 하이퍼링크하고 용어/구의 후속 발생은 하이퍼링크하지 않는 것을 포함할 수 있다. 도 3으로 돌아가면, 복수의 하이퍼링크 중 제1 하이퍼링크(302)는 "scoring"의 제1 앵커에 도시되어 있다. "score", "scores" 등의 다른 모양의 "scoring"의 다양한 버전은 하이퍼링크되지 않았다. 따라서, 하이퍼링크 앵커로 사용된 용어 또는 구의 다른 굴절은 하이퍼링크 생성 엔진에 의해 용어 또는 구의 하이퍼링크된 버전과 관련된 것으로 인식될 수 있다. 유사하게, "end zone"의 제2 앵커에 링크된 복수의 하이퍼링크 중 제2 하이퍼링크(304)는 단락(300)에서 한 번 이상 사용되지만, "end zone"의 제1 인스턴스만 하이퍼링크된다. 그러나, 다른 실시예에서, 키워드/핵심 구의 하나 이상의 발생이 하이퍼링크될 수 있다. 예를 들어, 규칙의 집합은 웹페이지의 섹션 내에서 키워드의 첫 번째 및 두 번째 발생을 하이퍼링크하는 것을 포함할 수 있다. 추가적으로, 발생에 기반한 패턴, 예컨대, 키워드가 텍스트에 나타나는 "매 두 번째(every other)", "매 세 번째(every third)", "매 네 번째(every fourth)" 발생을 하이퍼링크하라는 명령도 설정될 수 있다. 하이퍼링크 생성 엔진은 하이퍼링크된 모든 키워드의 수를 모니터링할 수 있다.
다른 실시예에서, 앵커로 선택된 용어/구는 웹페이지에서 원하는 다른 간격으로 하이퍼링크될 수 있다. 예를 들어, 용어/구는 웹페이지의 각 단락의 용어/구의 첫 번째 발생 또는 웹페이지의 다른 구조적 요소에서 용어/구의 첫 번째 발생에서 앵커로 구성될 수 있다. 일 실시예로서, 용어/구는 단락, 목록 및 표에서 용어/구의 첫 번째 표시에서 하이퍼링크될 수 있다. 다른 일 실시예로서, 용어/구가 앵커로 구성되는 빈도는 용어/구가 웹페이지에 포함되는 빈도에 따라 가중치가 적용될 수 있다.
또한, 구조적 요소 내의 패턴은 하이퍼링크의 적절한 배치를 평가하기 위해 사용될 수 있다. 위에 기술된 바와 같이, 패턴은 용어의 발생 또는 빈도를 포함할 수 있다. 예를 들어, 도 6A에 도시된 바와 같이, 제1 단락(602) 및 제2 단락(604)을 포함하는 텍스트(600)의 섹션에서, 용어 "touchdown"은 텍스트(600)의 섹션 전반에서 반복적으로 나타난다. 하이퍼링크 생성 엔진은 용어가 나타나는 빈도를 감지하고 해당 용어를 하이퍼링크될 키워드로 지정할 수 있다. 그러나, 텍스트(600) 내에서 앵커의 선택은 시각적으로 매력적인 앵커 배치를 제공하기 위해 규칙의 집합을 기반으로 결정될 수 있다.
예를 들어, 하이퍼링크를 자동으로 생성하기 위한 종래의 시스템은, 도 6A에 도시된 바와 같이, 용어 "touchdown"의 각 발생을 앵커로 지정할 수 있다. 동일한 용어를 앵커로 사용하는 이러한 빈도의 하이퍼링크 배치는 사용자에게 지나치게 반복적인 것으로 간주될 수 있다. 그러나, 하이퍼링크 생성 엔진을 대신 사용하는 경우, 규칙의 집합은 하이퍼링크 생성 엔진이 앵커로 선택된 용어의 반복을 처리하는 방법을 정의할 수 있다. 예로서, 도 6B에 도시된 바와 같이, 규칙의 집합은 제1 단락(602) 및 제2 단락(604) 각각에서 용어의 첫 번째 발생만을 하이퍼링크하는 명령을 제공할 수 있다. 다시 말해, 섹션 재설정은 하이퍼링크 생성 엔진에 의해 식별될 수 있으며, 여기서 섹션 재설정은 새로운 단락 또는 새로운 제목이 발견될 때 인식된다. 따라서, 사용자는 앞뒤로 스크롤하지 않고도 하이퍼링크를 쉽게 찾을 수 있고 텍스트(600)의 섹션의 모양은 복잡하지 않게 유지된다. 이 패턴은 또한 문서 내에서 "매 두 번째(every other)" 또는 "매 두 번째 발생 하이퍼링크(hyperlink every other occurrence)"로 지칭될 수 있다.
웹페이지의 구조적 요소 내에서 하이퍼링크 배치를 결정하기 위해 사용되는 패턴은 또한 하이퍼링크 배치를 위한 앵커로 식별된 용어/구 사이의 자간 거리를 포함할 수 있다. 이제 도 7로 넘어가면, 도 6A 내지 도 6B의 텍스트(600)의 섹션은 예시 목적으로 제시되고 웹페이지에 실제로 표시되지 않는 숫자 및 화살표로 표시된 주석과 함께 도시되어 있다. 텍스트(600)의 섹션의 제1 단락(602)은 제1 하이퍼링크를 위한 제1 앵커(702)(예를 들어, "touchdown") 및 제2 하이퍼링크를 위한 제2 앵커(704)(예를 들어, "end zone")를 포함한다. 도 7의 화살표 및 텍스트(600)의 섹션 위에 있는 숫자로 표시된 바와 같이, 제1 앵커(702)는 제1 단락(602)의 제1 문자(예를 들어, "A") 이후 10자(공백 포함)의 위치에서 끝난다. 제2 앵커(704)는 제1 단락(602)의 제1 문자 이후 110자의 위치에서 시작한다. 따라서, 제1 앵커(702)의 끝은 제2 앵커(704)의 시작으로부터 101자만큼 떨어져 있고, 이는 규칙의 집합에 포함된 임계값 거리보다 크거나 작은 거리일 수 있다. 임계값 거리는 도 7에서 하이퍼링크 배치 결정에 적용되지 않는다. 도 7에 추가하여, 도 8A 및 도 9A에서 텍스트의 섹션 위에 있는 화살표 및 숫자는 마찬가지로 예시 목적이고 실제로 웹페이지에 나타나지 않는다는 것이 인식될 것이다.
대조적으로, 도 8A에 도시된 바와 같이, 제1 앵커(702)는 텍스트(600)의 섹션 위에 있는 화살표 및 숫자로 표시된 바와 같이, 제3 앵커(802)로부터 5자만큼 떨어져 있다. 제1 앵커(702) 및 제3 앵커(802) 사이의 거리는 임계값 거리보다 작을 수 있으며, 여기서 임계값 거리는 5자 이하의 거리일 수 있다. 하이퍼링크 생성 엔진은, 도 8B에 도시된 바와 같이, 규칙의 집합을 기반으로, 제1 앵커(702) 및 제3 앵커(802)를 하이퍼링크를 위한 하나의 제4 앵커(850)로 결합하도록 구성될 수 있다.
앵커를 분리 또는 결합할지 여부를 결정하기 위한 임계값 거리의 사용은 또한 글머리 기호 목록과 같은 다른 구조적 요소에도 적용될 수 있다. 더욱이, 규칙의 집합은 또한 하이퍼링크로 형성된 구조적 요소의 백분율을 기반으로 인접 하이퍼링크를 결합하는 명령을 포함할 수 있다. 예를 들어, 글머리 기호 목록(900)은 도 9A 내지 도 9B에 도시되어 있다. 글머리 기호 목록(900)의 제1 글머리 기호 항목은 제1 앵커(902)를 포함하고, 글머리 기호 목록(900)의 제2 글머리 기호 항목은 제2 앵커(904) 및 제3 앵커(906)를 모두 포함한다.
제1 글머리 기호 항목에서, 제1 앵커(902)를 형성하는 제1 글머리 기호 항목에서의 텍스트의 백분율은 제1 앵커(902)를 조정하는 데 사용될 수 있다. 예를 들어, "inbounds"의 제1 앵커(902)는 "stay inbounds"에 포함된 총 13자 중 8자를 포함하고, 따라서 제1 글머리 기호 항목의 62%를 포함한다. 하이퍼링크 생성 엔진은 제1 앵커(902)로 형성된 제1 글머리 기호 항목의 부분 비율을 비교하고, 이 부분 비율을 임계값 비율과 비교하도록 구성될 수 있다. 예를 들어, 임계값 비율은 50%, 60%, 또는 기타 백분율일 수 있다. 제1 앵커(902)의 부분 비율이 임계값 비율보다 크면, 제1 앵커 앵커(902)는, 도 9B에 도시된 바와 같이, "stay"를 포함하도록 확장될 수 있다. 결과적으로, 제1 앵커(902)는 웹페이지 섹션의 주제와 관련하여 더 핵심적인 구로 조정될 수 있다.
도 9A의 제2 글머리 기호 항목, 즉, 제1 글머리 기호 항목의 아래에 있는 제2 글머리 기호 항목에서, 제2 앵커(904) 및 제3 앵커(906) 사이의 자간 거리는, 예를 들어, 상술한 바와 같이, 임계값 거리보다 작을 수 있다고 결정될 수 있다. 제2 앵커(904)와 제3 앵커(906)를 단일 앵커로 결합하는 것이 지정될 수 있지만, 적절한 대상의 선택이 요구된다. 예를 들어, 결합된 단일 앵커는 제2 앵커(904)의 대상 또는 제3 앵커(906)의 대상에 링크될 수 있다. 앵커의 수정은 제2 글머리 기호 항목의 텍스트에서 더 큰 비율을 차지하는 앵커를 기반으로 실행될 수 있다. 예를 들어, "break the plane"은 "goal line"보다 제2 글머리 기호 항목 텍스트 중 더 큰 비율을 차지한다. 따라서, 제2 앵커(904)는 제3 앵커(906)보다 더 무겁게 가중치가 적용되거나 더 높은 순위가 지정될 수 있고, 제2 앵커(904)는, 도 9B에 도시된 바와 같이, 제3 앵커(906)를 포함하도록 확장될 수 있다. 도 9B에서 제2 앵커(904)의 대상은 "goal line"이 아니라 "break the plane"에 해당할 수 있다.
글머리 기호 목록(1000)의 다른 일 실시예가 도 10에 도시되어 있다. 글머리 기호 목록(1000)은 사전순으로 제시된 스포츠 카탈로그를 포함한다. 글머리 기호 목록(1000)의 나열된 각 항목(1002)은 스포츠 유형의 이름 앞에 글머리 기호(1004), 예를 들어, 점으로 표시된다. 하이퍼링크는 나열된 항목(1002) 앞에 있는 글머리 기호(1004)의 식별 및 글머리 기호(1004) 다음에 나오는 나열된 항목(1002)의 텍스트로부터 글머리 기호(1004)를 구별하는 것을 기반으로 하이퍼링크 생성 엔진에 의해 글머리 기호 목록(1000)에 삽입될 수 있다.
도 10의 글머리 기호 목록(1000)에 대하여, 목록에 하이퍼링크를 삽입하기 위한 규칙의 집합은 목록을 정의하기 위한 명령, 예를 들어, 웹페이지의 세로 축을 따라 정렬된 일련의 글머리 기호의 탐지, 및 일련의 글머리 기호 탐지에 응답하여, 각 글머리 기호 뒤에(예를 들어, 가로로) 표시되는 텍스트에 하이퍼링크를 삽입하기 위한 명령을 포함할 수 있다. 결과적으로, 글머리 기호 목록은 효율적이고 미적으로 매력적인 방식으로 자동으로 하이퍼링크될 수 있다.
목록이 글머리 기호가 아닌 번호가 매겨진 경우, 하이퍼링크 생성 엔진은 유사하게 규칙의 집합을 기반으로 하이퍼링크를 자동으로 삽입할 수 있다. 예를 들어, 규칙의 집합은 글머리 기호 또는 번호 매기기 목록의 각 항목의 전체 텍스트를 하이퍼링크하거나 텍스트를 하이퍼링크하지 않는 명령을 포함할 수 있다. 다른 일 실시예로, 규칙의 집합은 각 항목에서 단일 하이퍼링크만 생성하는 것을 포함할 수 있다. 도 11에 도시된 바와 같이, 하이퍼링크가 자동으로 삽입될 수 있는 웹페이지의 구조적 요소의 다른 일 실시예는 번호 매기기 목록(1100)으로 도시되어 있다. 규칙의 집합은, 일 실시예에서, 일련의 번호를 식별하기 위한 명령을 추가로 포함할 수 있고, 웹페이지의 세로 축을 따라 배열된 각 번호 다음에는 용어 또는 구가 나온다. 하이퍼링크 생성 모듈은 번호는 포함하지 않고 번호 다음에 오는 번호 매겨진 각 항목의 전체 용어/구에 하이퍼링크를 삽입하도록 지시받을 수 있다.
자동 하이퍼링크 삽입을 위한 웹페이지의 구조적 요소의 또 다른 일 실시예는 도 12에 단락(1202)에 대한 제목(1200)으로 도시되어 있다. 하이퍼링크 생성 엔진은, 규칙의 집합에 정의된 바와 같이, 예를 들어, 제목(1200)의 글꼴 크기 및/또는 서체, 제목(1200)의 글꼴 스타일, 단락(1202)을 기준으로 제목(1200)의 위치 등을 기반으로 제목(1200)을 단락(1202)과 구분되게 식별하도록 구성될 수 있다. 규칙의 집합은 앵커로 구성되는 제목(1200)의 부분, 예를 들어, 제목의 문자 중 백분율에 대한 명령을 추가로 제공할 수 있다. 예를 들어, 제목(1200)은 두 개의 용어, "Football" 및 "Touchdown"으로 제시되며, 따라서 단락(1202)에 설명된 연관된 관심 주제에 대한 완전한 이름을 제공하기 위해 제목(1200)의 두 단어 모두의 포함을 요구하도록 결정될 수 있다. 제목의 용어 하나만, 예를 들어, "Football"만 또는 "Touchdown"만 하이퍼링크하는 것은 관심 주제를 정확하게 나타내지 않을 수 있으므로, 제목(1200)에서 두 용어 모두 하이퍼링크된다.
그러나, 다른 실시예에서, 제목은 대신 문장일 수 있고, 이때 문장에서 용어의 일부가 관심 주제에 특정되지 않을 수 있다. 이러한 경우, 제목 중 관련된 부분만 앵커로 구성될 수 있다. 하이퍼링크 생성 엔진은, 예를 들어, 제목을 식별하기 위해 제공된 규칙 및 키워드를 식별하기 위해 제공된 규칙의 조합을 기반으로 논리적 결정을 내릴 수 있다. 따라서, 앵커의 구성은 두 가지 규칙 유형 모두의 충족을 기반으로 선택될 수 있고, 예를 들어, 제목 내의 키워드가 하이퍼링크를 위한 앵커로 설정된다.
이제 도 13으로 넘어가면, 자동 하이퍼링크 삽입을 위한 웹페이지의 구조적 요소는 표(1300)를 포함할 수 있다. 표(1300)는 2개 열로 도시되어 있지만, 본원에 기술된 자동 하이퍼링크 삽입의 표에의 응용은 다양한 차원, 예를 들어, 임의의 수의 열 및 행의 표에 적용될 수 있다는 것이 이해될 것이다. 표(1300)의 열 중 제1 열(1302)은 항공 스포츠의 이름을 제공할 수 있다. 표(1300)의 열 중 제2 열(1304)은 제1 열(1302)에 나열된 해당하는 항공 스포츠에 대한 간략한 설명을 제공할 수 있다. 표(1300)에서 하이퍼링크의 배치는 제1 열(1302)만의 하이퍼링킹을 지시할 수 있는 규칙의 집합에 의해 정의될 수 있다.
패턴에 기반한 하이퍼링크 배치의 다른 일 실시예에서, 문장부호를 사용하여 하이퍼링크의 적절한 배치를 결정할 수 있다. 예로서, 글머리 기호 목록(1400)이 도 14에 도시되어 있고, 여기서 각 글머리 기호 항목은 용어와 그다음에 오는 콜론을 포함한다. 콜론은 용어에 대한 정의를 제공하는 콜론 뒤의 문장으로부터 용어를 구분한다. 규칙의 집합은 콜론 앞의 용어를 하이퍼링크의 앵커로 사용하고 콜론 뒤의 문장에는 하이퍼링크 삽입을 배제하는 명령을 포함할 수 있다. 따라서, 글머리 기호 목록(1400) 내의 하이퍼링크의 위치는 균일하고 깔끔히 구성된다. 추가적으로, 일관된 패턴으로, 예를 들어, 목록에서 각 글머리 기호 항목의 첫 번째 용어 또는 구 각각의 뒤에, 정렬된 다른 유형의 문장부호, 예컨대, 세미콜론, 하이픈, 쉼표 등이 하이퍼링크 배치를 결정하기 위해 사용될 수 있다.
하이퍼링크 생성 엔진을 위한 규칙의 집합은 또한 사용자에게 보이는 웹페이지의 일부, 예를 들어, 가시 화면 내에 표시될 하이퍼링크의 허용 가능한 최대 수를 포함할 수 있다. 예를 들어, 가시 화면(1500)의 예가 도 15에 도시되어 있고, 여기에는 텍스트의 단락(1502)이 도시되고, 여기서 텍스트의 각 단락은 제목(1504)을 갖는다. 허용 가능한 최대 하이퍼링크 수(1506)는 예시 목적으로 가시 화면(1500)의 우측 상단 모서리에 표시되어 있으며, 가시 화면(1500)에서 사용자에게 실제로 표시되지는 않는다.
도 15에 도시된 바와 같이, 일 실시예에서, 하이퍼링크(1506)의 허용 가능한 최대 수는 8개 하이퍼링크로 설정될 수 있다. 하이퍼링크 생성 엔진은 규칙의 집합을 기반으로 하이퍼링크 배치를 위한 후보 앵커를 평가하도록 구성될 수 있다. 예를 들어, 하이퍼링크 생성 엔진은 가시 화면(1500)에서 구조적 요소 및 패턴, 예컨대, 텍스트 단락(1502) 내의 키워드, 제목(1504), 및 위에 기술된 바와 같은 임의의 다른 구조적 요소 및 패턴의 위치를 식별할 수 있다. 모든 후보 앵커를 식별하면, 하이퍼링크 생성 엔진은 각 유형의 후보 앵커의 수를 허용 가능한 최대 하이퍼링크 수(1506)와 비교하여 하이퍼링크를 위해 가장 적합한 앵커 유형을 결정하도록 구성될 수 있다.
일 실시예로서, 도 15에 도시된 바와 같이, 가시 화면(1500)은 텍스트 단락(1502)에서 3개의 제목(1504) 및 3개 이상의 키워드를 포함한다. 규칙의 집합은 가장 많은 후보 앵커를 갖는 구조적 요소를 하이퍼링크함으로써 허용 가능한 최대 하이퍼링크 수(1506)를 충족하는 명령을 포함할 수 있고, 따라서 가시 화면(1500)에서 하이퍼링크되는 구조적 요소의 유형에 대한 일관성을 유지할 수 있다. 한 가지 유형의 구조적 요소 또는 패턴만 하이퍼링크로 구성될 수 있다. 그러나, 다른 실시예에서, 규칙의 집합은 대신 제목(1504)의 하이퍼링킹을 우선 처리하는 명령을 제공할 수 있고, 허용 가능한 최대 하이퍼링크 수(1506) 중 나머지 5개 하이퍼링크는 다른 구조적 요소 또는 패턴에, 예컨대, 텍스트 단락(1502)의 키워드에 표시될 수 있다.
또 다른 실시예에서, 규칙의 집합은 허용 가능한 최대 수가 설정된 경우 동일한 키워드를 두 번 이상 하이퍼링크하지 않는 명령, 허용 가능한 최대 수가 설정된 경우 특정 대상을 한 번 이하로 하이퍼링크하는 명령, 특정 구조적 요소 또는 기타 항목을 우선 처리하는 명령(예를 들어, 제목 먼저, 그다음 글머리 기호, 표, 단락 마지막과 같은 우선 순위), 및 가중치가 적용되지 않았거나 가중치가 낮은 키워드/대상보다 가중치가 적용된 키워드 또는 대상을 우선 처리하는 명령을 포함할 수 있다.
이러한 방식으로, 하이퍼링크는 웹페이지에 포함된 구조적 요소 및 서식을 기반으로 웹페이지에 자동으로 삽입될 수 있다. 하이퍼링크는 웹페이지에서 식별된 구조적 요소에 해당하는 앵커의 선택을 정의하는 규칙의 집합을 기반으로 웹페이지에 추가될 수 있다. 예를 들어, 키워드만이 아니라 구조적 요소에 따라 하이퍼링크를 삽입하면, 하이퍼링크가 사용자의 관심을 끌 가능성이 높은 웹페이지의 영역에 위치할 수 있다. 또한, 하이퍼링크의 구조-정의된 배치 및 하이퍼링크의 일관된 서식은 웹페이지의 미적 매력을 증가시킬 수 있다. 구조적 요소를 의도한 방식으로 사용하면 사용자에게 더 자연스러운 경험을 제공할 수 있다. 또한, 글머리 기호 목록의 하이퍼링크는 각 글머리 기호 항목의 전체 텍스트를 하이퍼링크할 경우 더 유용하고 매력적일 수 있지만, 표의 하이퍼링크는 하이퍼링킹을 위해 한 열을 사용할 경우 더 매력적일 수 있다. 또한, 단락에서 하이퍼링크 사이의 거리는 유효성에 대한 인상에 영향을 미칠 수 있는데, 예를 들어, 적절한 간격은 사용자가 하이퍼링크를 스팸 링크로 잘못 식별할 가능성 또는 그렇지 않으면 사용자가 구조적 요소 내의 모든 링크를 무시하게 될 수 있는 "링크 무시(link blindness)"를 줄일 수 있다.
웹페이지에 하이퍼링크를 자동으로 삽입하기 위한 방법(1600)의 일 실시예가 도 16에 도시되어 있다. 방법(1600)은 논리 하위시스템, 예컨대, 도 2의 논리 하위시스템(202)의 메모리에 저장된 명령을 기반으로, 도 1 및 도 2의 하이퍼링크 생성 엔진(104)과 같은 자동화된 도구에 의해 실행될 수 있다. 명령은, 실행될 경우, 논리 하위시스템의 프로세서가 웹페이지를 분석하고 그의 메타데이터를 읽도록 할 수 있다. 방법(1600)의 구현은 사용자가 새로운 웹페이지를 생성하거나 기존의 웹페이지를 수정할 때 시작될 수 있다.
(1602)에서, 방법(1600)은 전자 문서(예를 들어, 웹페이지를 생성하는 데 사용되는 전자 파일)에 하이퍼링크가 삽입되는 방식을 정의하는 규칙의 집합을 수신하는 단계, 전자 문서, 및 전자 문서의 주제와 관련된 대상의 목록을 포함한다. (1602)에서 사용자가 제공한 정보는 하이퍼링크 생성 엔진에 의해 사용자 인터페이스에 표시되는 사용자 입력 페이지에 입력될 수 있다. 예를 들어, 사용자 입력 페이지는 텍스트-대상 맵을 자동으로 생성하기 위한 사이트맵에 대한 링크, 수동으로 입력된 키워드, 구 및 대상의 목록, 키워드 및/또는 대상에 대해 정의된 가중치 및 우선 순위, 키워드 및 구에 해당하는 패턴의 목록, 하이퍼링킹을 위한 구조적 요소의 목록(예를 들어, 글머리 기호, 번호 매기기 목록, 표 등) 및 구조적 요소와 관련된 다양한 설정, 및 하이퍼링크하지 않을 구조적 요소의 목록을 포함하거나 갖도록 구성될 수 있다. 사용자 입력 페이지는 항상 하이퍼링크할 구조적 요소의 목록, 패턴이 재설정되어야 할 시기(예컨대, 각 제목 이후)에 대한 명령, AI/ML을 적용하기 위한 기준, 두 하이퍼링크 사이의 최소 및 최대 임계값 자간 거리, 구조적 요소에서 하이퍼링크될 텍스트의 백분율 임계값, 앵커 텍스트를 확장하기 위한 백분율 임계값, 및 대상, 앵커 텍스트, 또는 구조적 요소를 기반으로 한 하이퍼링크 또는 특정 유형의 하이퍼링크의 스타일 지정을 추가로 포함하거나 갖도록 구성될 수 있다.
(1604)에서, 방법(1600)은 전자 문서에 하나 이상의 하이퍼링크를 삽입하는 단계를 포함한다. 하나 이상의 하이퍼링크를 삽입하는 단계는, (1605)에서, 텍스트 및/또는 문서 처리 알고리즘을 사용하여, 전자 문서에 존재하는 구조적 요소를 찾기 위해 전자 문서를 분석 및/또는 스캔하는 단계를 포함할 수 있다. 구조적 요소는 규칙의 집합에 정의된 구조적 요소에 따라 식별될 수 있고, 식별된 구조적 요소의 유형 및 위치는, 예로서, 하이퍼링크 삽입이 완료될 때까지 일시적 또는 임시 메모리에 저장될 수 있다.
하나 이상의 하이퍼링크를 삽입하는 단계는 또한 (1606)에서 HTML 파서를 사용하여 전자 문서의 텍스트에서 식별된 구조적 요소에 하이퍼링크의 앵커를 생성하는 단계를 포함할 수 있다. 다시 말해, 전자 문서의 텍스트 중 선택된 부분은 구조적 요소에서 앵커로 변환될 수 있다. 위에 기술된 바와 같이, 식별된 구조적 요소는 규칙의 집합을 기반으로 하이퍼링크를 위한 위치가 되도록 지정된 구조적 요소일 수 있다. HTML 파서는 전자 텍스트 파일의 HTML 코드를 액세스 및 수정하고/하거나 앵커의 오류 및 모양을 조정하기 위해 사용되는 소프트웨어 패키지일 수 있다. 그러나, 다른 실시예에서, 전자 문서는 HTML 이외에 일반 텍스트, Markdown 등을 포함하는 다른 유형의 텍스트를 포함할 수 있으며, 이에 따라 텍스트의 유형에 해당하는 다른 유형의 파서가 사용될 수 있다. 하이퍼링크는 하이퍼링크를 포함하도록 전자 문서의 HTML 코드를 변경하고 전자 문서가 표시되는 웹페이지에서 앵커의 시각적 모양을 조정함으로써 자동으로(예를 들어, 수동 입력 없이) 추가될 수 있다.
하나 이상의 하이퍼링크를 삽입하는 단계는 또한 (1608)에서 규칙의 집합에 따라 하이퍼링크에 추가적인 수정을 적용하는 단계를 포함할 수 있다. 예를 들어, 전자 문서의 구조적 요소가 글머리 기호 목록을 포함하는 경우, 도 10에 도시된 바와 같이, 앵커는 글머리 기호 다음에 오는 텍스트만 포함하도록 조정될 수 있다. 또 다른 예로서, 텍스트의 단락에 있는 앵커는 규칙의 집합에 의해 선택된 키워드가 단락에 두 번 이상 나타나는 경우에 제거될 수 있다. 예를 들어, 도 6B에 도시된 바와 같이, 단락에서 키워드가 처음 표시된 이후 키워드의 임의의 발생은 하이퍼링크되지 않을 수 있다.
하나 이상의 하이퍼링크를 삽입하는 단계는 (1610)에서 수정된 전자 문서를 표시하는 단계를 추가로 포함할 수 있다. 예를 들어, 전자 문서는 서버에서 호스트된 웹사이트의 웹페이지에 표시될 수 있고, 따라서 디스플레이 디바이스에서 사용자에게 표시될 수 있다. 예로서, 웹페이지는 인터넷에서 공개적으로 액세스할 수 있다. 또한, 하이퍼링크의 대상은 유사하게 호스트될 수 있다. 방법(1600)이 종료된다.
전자 문서의 구조적 요소를 기반으로 전자 문서에 하이퍼링크를 자동으로 삽입하는 방법의 기술적 효과는 하이퍼링크의 배치 및 서식이 사용자 기본 설정에 따라 자동으로 선택되어 하이퍼링크가 유용하고 깔끔히 구성되고, 따라서 정보를 효율적으로 획득할 수 있게 된다는 것이다. 하이퍼링크의 배치는 비교적 낮은 처리 부담을 요구하는 하이퍼링크 관리 전략에 따라 사용자 지정될 수 있고, 동시에 웹페이지 표시에서 하이퍼링크 배열의 미적 매력을 증가시킬 수 있다. 미리 설정된 규칙은 전자 문서를 분석하고 수동 삽입을 통해(예를 들어, 사용자에 의해) 달성될 수 있는 것보다 더 짧은 시간 내에 하이퍼링크를 삽입하는 알고리즘 기반 도구(예를 들어, 하이퍼링크 생성 엔진)를 사용하여 적용될 수 있다. 또한, 상기 도구는 전자 문서에 하이퍼링크가 배치되는 동안 여러 규칙이 동시에 적용되도록 할 수 있다.
실시양태에 대한 설명은 예시 및 설명의 목적으로 제시되었다. 실시양태에 대한 적절한 수정 및 변형은 상기 설명을 고려하여 수행될 수 있거나, 방법을 실시하는 것으로부터 획득될 수 있다. 예를 들어, 달리 언급되지 않는 한, 기술된 방법 중 하나 이상은 도 1과 관련하여 위에 기술된 시스템과 같은 적절한 디바이스 및/또는 디바이스의 조합에 의해 수행될 수 있다. 방법은 하나 이상의 하드웨어 요소, 예컨대, 저장 디바이스, 메모리, 하드웨어 네트워크 인터페이스/안테나, 스위치, 액추에이터, 클록 회로 등과 함께 하나 이상의 논리 디바이스(예를 들어, 프로세서)를 사용하여 저장된 명령을 실행함으로써 수행될 수 있다. 설명된 방법 및 관련 작업은 또한 본 출원에 기술된 순서 이외에 다양한 순서로, 병렬로, 및/또는 동시에 수행될 수 있다. 기술된 시스템은 본질적으로 예시이며, 추가 요소를 포함하고/하거나 요소를 생략할 수 있다. 본 개시내용의 주제는 다양한 시스템 및 구성의 모든 신규하고 명백하지 않은 조합 및 하위-조합, 및 개시된 다른 특징, 기능, 및/또는 속성을 포함한다.
또한, 본 개시내용은, 전자 문서의 구조적 요소를 기반으로 하이퍼링크를 전자 문서에 삽입하기 위한 규칙의 집합을 서버의 프로세서에서 수신하는 단계, 프로세서에서 구현되고 규칙의 집합을 기반으로 하이퍼링크의 삽입을 실행하도록 구성된 자동화된 도구를 통해 전자 문서에 존재하는 구조적 요소를 식별하는 단계, 식별된 구조적 요소를 기반으로 전자 문서에 하이퍼링크를 삽입하는 단계, 및 하이퍼링크를 갖는 전자 문서를 디스플레이 디바이스에 표시하는 단계를 포함하는, 하이퍼링크를 자동으로 삽입하기 위한 방법에 대한 지원을 제공한다. 방법의 제1 실시예에서, 구조적 요소를 식별하는 단계는 하나 이상의 키워드, 글머리 기호 목록, 번호 매기기 목록, 제목 및 표를 식별하는 것을 포함한다. 전자 문서에서 키워드를 식별하는 것에 응답하여 선택적으로 제1 실시예를 포함하는, 방법의 제2 실시예에서, 하이퍼링크를 삽입하는 단계는 텍스트의 단락에서 키워드의 첫 번째 발생을 하이퍼링크하고 텍스트의 단락에서 키워드의 후속 표시는 하이퍼링크하지 않는 것을 포함한다. 전자 문서에서 글머리 기호 목록을 식별하는 것에 응답하여 제1 실시예 및 제2 실시예 중 하나 또는 둘 다를 선택적으로 포함하는, 방법의 제3 실시예에서, 하이퍼링크는 글머리 기호 목록에서 글머리 기호 다음에 오는 텍스트에 삽입된다. 전자 문서에서 번호 매기기 목록을 식별하는 것에 응답하여 제1 실시예 내지 제3 실시예 중 하나 이상 또는 각각을 선택적으로 포함하는, 방법의 제4 실시예에서, 하이퍼링크는 번호 매기기 목록의 항목을 나타내는 텍스트에 삽입된다. 전자 문서에서 제목을 식별하는 것에 응답하여 제1 실시예 내지 제4 실시예 중 하나 이상 또는 각각을 선택적으로 포함하는, 방법의 제5 실시예에서, 하이퍼링크는 제목의 키워드에 삽입된다. 전자 문서에서 표를 식별하는 것에 응답하여 제1 실시예 내지 제5 실시예 중 하나 이상 또는 각각을 선택적으로 포함하는, 방법의 제6 실시예에서, 하이퍼링크는 표의 열에 삽입된다. 제1 실시예 내지 제6 실시예 중 하나 이상 또는 각각을 선택적으로 포함하는, 방법의 제7 실시예에서, 규칙의 집합을 수신하는 단계는 프로세서와 통신 가능하게 결합된 사용자 인터페이스에서 사용자에 의해 입력된 기본 설정을 수신하는 것을 포함하고, 여기서 사용자에 의해 입력된 기본 설정은 식별된 구조적 요소의 유형에 특정한 하이퍼링크의 배치 및 서식을 포함한다. 제1 실시예 내지 제7 실시예 중 하나 이상 또는 각각을 선택적으로 포함하는, 방법의 제8 실시예에서, 규칙의 집합을 수신하는 단계는 인공 지능 또는 기계 학습을 사용하여 생성되는 규칙을 수신하는 것을 포함한다.
또한, 본 개시내용은 전자 문서를 저장하는 데이터베이스, 전자 문서를 표시하도록 구성된 디스플레이 디바이스, 및 디스플레이 디바이스와 통신 가능하도록 결합되고 비일시적 메모리에 저장된 실행 가능한 명령(실행될 경우, 프로세서가 실행 가능한 명령에 포함된 규칙의 집합(하나 이상의 구조적 요소의 유형에 따라 하이퍼링크가 표시되는 방법을 정의하는 규칙의 집합)에 따라 전자 문서에서 식별된 하나 이상의 구조적 요소에 하이퍼링크를 삽입하고 디스플레이 디바이스에 하이퍼링크를 갖는 전자 문서를 표시하도록 하는 명령)으로 구성된 자동화된 도구를 포함하는 프로세서를 포함하는 하이퍼링크 삽입을 위한 시스템에 대한 지원을 제공한다. 시스템의 제1 실시예에서, 규칙의 집합은 웹사이트 사이트맵을 사용하여 하이퍼링크의 앵커와 하이퍼링크의 대상 간의 관계를 매핑하기 위해 텍스트-대상 맵을 생성하는 명령을 포함한다. 제1 실시예를 선택적으로 포함하는, 시스템의 제2 실시예에서, 규칙의 집합은 전자 문서의 텍스트의 섹션에 대한 허용 가능한 최대 하이퍼링크 수를 포함한다. 제1 실시예 및 제2 실시예 중 하나 또는 모두를 선택적으로 포함하는, 시스템의 제3 실시예에서, 규칙의 집합은 제1 앵커 및 제2 앵커가 임계값 자간 거리 미만으로 분리된 경우 하이퍼링크의 제2 앵커를 포함하도록 하이퍼링크의 제1 앵커를 확장하는 명령을 포함한다. 제1 실시예 내지 제3 실시예 중 하나 이상 또는 각각을 선택적으로 포함하는, 시스템의 제4 실시예에서, 규칙의 집합은 하이퍼링크의 앵커의 표시 빈도, 앵커의 서식, 및 앵커로 구성된 텍스트 섹션의 부분의 범위 중 하나 이상을 조정하는 명령을 포함한다.
또한, 본 개시내용은, 프로세서에서 전자 문서, 하이퍼링크 대상의 목록, 및 규칙의 집합을 수신하는 단계, 전자 문서에서 식별된 구조적 요소의 유형을 기반으로 전자 문서에 하이퍼링크를 자동으로 삽입하기 위한 명령을 제공하는 규칙의 집합, 프로세서에서 구현되는 문서 처리 알고리즘을 사용하여 전자 문서에서 구조적 요소의 유형을 식별하는 단계, 구조적 요소를 파싱하여 구조적 요소의 선택된 텍스트에서 하이퍼링크의 앵커를 생성하는 단계, 하이퍼링크 대상의 목록에 해당하는 대상에 링크된 앵커, 및 하이퍼링크를 갖는 전자 문서를 디스플레이 디바이스에 표시하는 단계를 포함하는, 전자 문서에서 하이퍼링크 배치를 결정하기 위한 방법에 대한 지원을 제공한다. 방법의 제1 실시예에서, 방법은 패턴 및 앵커의 빈도 중 하나 이상을 기반으로 하이퍼링크의 앵커를 수정하는 단계를 추가로 포함한다. 제1 실시예를 선택적으로 포함하는, 방법의 제2 실시예에서, 패턴을 기반으로 앵커를 수정하는 단계는 발생, 키워드, 구조적 요소의 텍스트의 백분율, 자간 거리, 섹션 재설정, 및 가중치 또는 순위 중 하나 이상에 따라 앵커의 모양 및/또는 대상을 조정하는 단계를 포함한다. 제1 실시예 및 제2 실시예 중 하나 또는 모두를 선택적으로 포함하는, 방법의 제3 실시예에서, 앵커의 빈도를 기반으로 앵커를 수정하는 단계는 키워드가 전자 문서의 섹션 내에서 다른 키워드보다 더 높은 빈도로 나타날 경우 해당 키워드를 앵커로 선택하는 단계를 포함한다. 제1 실시예 내지 제3 실시예 중 하나 이상 또는 각각을 선택적으로 포함하는, 방법의 제4 실시예에서, 앵커를 수정하는 단계는 제1 앵커 및 제2 앵커의 순위 또는 가중치를 기반으로 제1 앵커 및 제2 앵커가 단일 앵커로 결합될 경우 제1 앵커의 제1 대상 및 제2 앵커의 제2 대상 중 하나를 선택하는 단계를 추가로 포함한다. 제1 실시예 내지 제4 실시예 중 하나 이상 또는 각각을 선택적으로 포함하는, 방법의 제5 실시예에서, 앵커는 대상에 링크된 HTML 요소이고, 여기서 대상은 다른 문서, 전자 문서의 다른 섹션, 및 팝업 중 하나이다.
본 출원에서 사용된 바와 같이, 단수형으로 언급되고 앞에 단어 "a" 또는 "an"이 오는 요소 또는 단계는 상기 요소 또는 단계의 복수형을 배제하지 않는 것으로 이해되어야 한다. 단, 이러한 배제가 명시된 경우는 예외로 한다. 또한, 본 개시내용의 "일 실시양태" 또는 "일 실시예"에 대한 언급은 언급된 특징을 또한 포함하는 추가적인 실시양태의 존재를 배제하는 것으로 해석되어서는 안 된다. "제1", "제2", "제3" 등의 용어는 단순히 라벨로 사용되며 해당 개체에 숫자 요건 또는 특정 위치 순서를 부여하기 위한 것이 아니다. 다음의 청구범위는 신규하고 자명하지 않는 것으로 간주되는 본 개시내용의 발명대상을 특히 강조한다.

Claims (15)

  1. 하이퍼링크를 자동으로 삽입하기 위한 방법으로서,
    전자 문서의 구조적 요소를 기반으로 하이퍼링크를 전자 문서에 삽입하기 위한 규칙의 집합을 서버의 프로세서에서 수신하는 단계;
    자동화된 도구를 통해 전자 문서에 존재하는 구조적 요소를 식별하는 단계로서, 자동화된 도구는 프로세서에서 구현되고 규칙의 집합을 기반으로 하이퍼링크의 삽입을 실행하도록 구성되는 것인, 단계;
    식별된 구조적 요소를 기반으로 전자 문서에 하이퍼링크를 삽입하는 단계; 및
    하이퍼링크를 갖는 전자 문서를 디스플레이 디바이스에 표시하는 단계
    를 포함하는 방법.
  2. 제1항에 있어서, 구조적 요소를 식별하는 단계는 하나 이상의 키워드, 글머리 기호 목록, 번호 매기기 목록, 제목 및 표를 식별하는 단계를 포함하는 것인, 방법.
  3. 제2항에 있어서, 전자 문서에서 키워드를 식별하는 것에 응답하여, 하이퍼링크를 삽입하는 단계는 텍스트의 단락에서 키워드의 첫 번째 발생을 하이퍼링크하고 텍스트의 단락에서 키워드의 후속 표시는 하이퍼링크하지 않는 단계를 포함하는 것인, 방법.
  4. 제2항에 있어서, 전자 문서에서 글머리 기호 목록을 식별하는 것에 응답하여, 하이퍼링크는 글머리 기호 목록에서 글머리 기호 다음에 오는 텍스트에 삽입되는 것인, 방법.
  5. 제2항에 있어서, 전자 문서에서 번호 매기기 목록을 식별하는 것에 응답하여, 하이퍼링크는 번호 매기기 목록의 항목을 나타내는 텍스트에 삽입되는 것인, 방법.
  6. 제2항에 있어서, 전자 문서에서 제목을 식별하는 것에 응답하여, 하이퍼링크는 제목의 키워드에 삽입되는 것인, 방법.
  7. 제2항에 있어서, 전자 문서에서 표를 식별하는 것에 응답하여, 하이퍼링크는 표의 열에 삽입되는 것인, 방법.
  8. 제1항에 있어서, 규칙의 집합을 수신하는 단계는 프로세서와 통신가능하게 결합된 사용자 인터페이스에서 사용자에 의해 입력된 기본 설정을 수신하는 단계를 포함하는 것인, 방법.
  9. 제8항에 있어서, 사용자에 의해 입력된 기본 설정은 식별된 구조적 요소의 유형에 특정한 하이퍼링크의 배치 및 서식을 포함하는 것인, 방법.
  10. 제1항에 있어서, 규칙의 집합을 수신하는 단계는 인공 지능 또는 기계 학습을 사용하여 생성되는 규칙을 수신하는 단계를 포함하는 것인, 방법.
  11. 하이퍼링크 삽입을 위한 시스템으로서,
    전자 문서를 저장하는 데이터베이스;
    전자 문서를 표시하도록 구성된 디스플레이 디바이스;
    디스플레이 디바이스와 통신 가능하도록 결합되고 비일시적 메모리에 저장된 실행 가능한 명령으로 구성된 자동화된 도구를 포함하는 프로세서로서, 이 명령이 실행될 경우 프로세서는
    실행 가능한 명령에 포함된 규칙의 집합(하나 이상의 구조적 요소의 유형에 따라 하이퍼링크가 표시되는 방법을 정의하는 규칙의 집합)에 따라 전자 문서에서 식별된 하나 이상의 구조적 요소에 하이퍼링크를 삽입하고; 및
    디스플레이 디바이스에 하이퍼링크를 갖는 전자 문서를 표시하는 것인 프로세서
    를 포함하는 시스템.
  12. 제11항에 있어서, 규칙의 집합은 웹사이트 사이트맵을 사용하여 하이퍼링크의 앵커와 하이퍼링크의 대상 간의 관계를 매핑하기 위해 텍스트-대상 맵을 생성하는 명령을 포함하는 것인, 시스템.
  13. 제11항에 있어서, 규칙의 집합은 전자 문서의 텍스트의 섹션에 대한 허용 가능한 최대 하이퍼링크 수를 포함하는 것인 시스템.
  14. 제11항에 있어서, 규칙의 집합은 제1 앵커 및 제2 앵커가 임계값 자간 거리 미만으로 분리된 경우 하이퍼링크의 제2 앵커를 포함하도록 하이퍼링크의 제1 앵커를 확장하는 명령을 포함하는 것인, 시스템.
  15. 제11항에 있어서, 규칙의 집합은 하이퍼링크의 앵커의 표시 빈도, 앵커의 서식, 및 앵커로 구성된 텍스트 섹션의 부분의 범위 중 하나 이상을 조정하는 명령을 포함하는 것인, 시스템.
KR1020247010035A 2021-08-27 2022-08-26 구조-기반 자동 하이퍼링킹을 위한 시스템 및 방법 KR20240044542A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202163260682P 2021-08-27 2021-08-27
US63/260,682 2021-08-27
PCT/US2022/075523 WO2023028587A1 (en) 2021-08-27 2022-08-26 Systems and methods for structure-based automated hyperlinking

Publications (1)

Publication Number Publication Date
KR20240044542A true KR20240044542A (ko) 2024-04-04

Family

ID=85289029

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020247010035A KR20240044542A (ko) 2021-08-27 2022-08-26 구조-기반 자동 하이퍼링킹을 위한 시스템 및 방법

Country Status (5)

Country Link
US (2) US11954422B2 (ko)
EP (1) EP4377818A1 (ko)
KR (1) KR20240044542A (ko)
AU (1) AU2022335597A1 (ko)
WO (1) WO2023028587A1 (ko)

Family Cites Families (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5708825A (en) * 1995-05-26 1998-01-13 Iconovex Corporation Automatic summary page creation and hyperlink generation
US6098081A (en) * 1996-05-06 2000-08-01 Microsoft Corporation Hypermedia navigation using soft hyperlinks
US6295542B1 (en) * 1998-10-02 2001-09-25 National Power Plc Method and apparatus for cross-referencing text
US7003719B1 (en) * 1999-01-25 2006-02-21 West Publishing Company, Dba West Group System, method, and software for inserting hyperlinks into documents
US7275061B1 (en) 2000-04-13 2007-09-25 Indraweb.Com, Inc. Systems and methods for employing an orthogonal corpus for document indexing
US7107535B2 (en) * 2000-05-24 2006-09-12 Clickfox, Llc System and method for providing customized web pages
US7451099B2 (en) * 2000-08-30 2008-11-11 Kontera Technologies, Inc. Dynamic document context mark-up technique implemented over a computer network
US7013309B2 (en) * 2000-12-18 2006-03-14 Siemens Corporate Research Method and apparatus for extracting anchorable information units from complex PDF documents
US20020107884A1 (en) * 2001-02-08 2002-08-08 International Business Machines Corporation Prioritizing and visually distinguishing sets of hyperlinks in hypertext world wide web documents in accordance with weights based upon attributes of web documents linked to such hyperlinks
CN1186737C (zh) * 2002-02-05 2005-01-26 国际商业机器公司 对尚未访问的网页进行基于路径的排队的方法和系统
US20040078451A1 (en) * 2002-10-17 2004-04-22 International Business Machines Corporation Separating and saving hyperlinks of special interest from a sequence of web documents being browsed at a receiving display station on the web
US20050149851A1 (en) * 2003-12-31 2005-07-07 Google Inc. Generating hyperlinks and anchor text in HTML and non-HTML documents
US8150824B2 (en) * 2003-12-31 2012-04-03 Google Inc. Systems and methods for direct navigation to specific portion of target document
US7467349B1 (en) * 2004-12-15 2008-12-16 Amazon Technologies, Inc. Method and system for displaying a hyperlink at multiple levels of prominence based on user interaction
US7831545B1 (en) * 2005-05-31 2010-11-09 Google Inc. Identifying the unifying subject of a set of facts
US20080015968A1 (en) * 2005-10-14 2008-01-17 Leviathan Entertainment, Llc Fee-Based Priority Queuing for Insurance Claim Processing
US7529795B2 (en) * 2006-03-20 2009-05-05 Stragent, Llc Message board aggregator
US8862573B2 (en) * 2006-04-04 2014-10-14 Textdigger, Inc. Search system and method with text function tagging
IES20060361A2 (en) 2006-05-05 2007-10-31 Big River Ltd Electronic document conversion
US20070299986A1 (en) * 2006-06-27 2007-12-27 Craig Jeremy S Systems and methods for automatic website construction
JP2008077227A (ja) 2006-09-19 2008-04-03 Access Co Ltd リンク生成装置、ブラウザプログラム、リンク生成システム
US7809697B1 (en) * 2007-11-09 2010-10-05 Google Inc. Compressing hyperlinks in a hyperlink-based document
US20090172002A1 (en) * 2007-12-26 2009-07-02 Mohamed Nooman Ahmed System and Method for Generating Hyperlinks
US8566444B1 (en) * 2008-10-30 2013-10-22 F5 Networks, Inc. Methods and system for simultaneous multiple rules checking
US8380722B2 (en) 2010-03-29 2013-02-19 Microsoft Corporation Using anchor text with hyperlink structures for web searches
US20120246561A1 (en) * 2011-03-22 2012-09-27 Toby Doig Systems and methods for extended content harvesting for contextualizing
US20130111315A1 (en) * 2011-10-27 2013-05-02 Microsoft Corporation Geographic Visualization of Data
US9141715B2 (en) * 2012-01-03 2015-09-22 International Business Machines Corporation Automated hyperlinking in electronic communication
US8914452B2 (en) * 2012-05-31 2014-12-16 International Business Machines Corporation Automatically generating a personalized digest of meetings
US9053177B1 (en) * 2012-06-11 2015-06-09 Google Inc. Sitelinks based on visual location
CN103677595B (zh) * 2012-09-07 2017-05-10 中兴通讯股份有限公司 一种触控多个超链接的方法、装置及终端
WO2014081727A1 (en) * 2012-11-20 2014-05-30 Denninghoff Karl L Search and navigation to specific document content
US9672521B1 (en) * 2012-12-07 2017-06-06 The Boeing Company Reformatting legacy system work orders with highlighted process compliance
US10007933B2 (en) * 2013-02-22 2018-06-26 Swoop Inc. Systems and methods for integrating dynamic content into electronic media
US9892096B2 (en) * 2014-03-06 2018-02-13 International Business Machines Corporation Contextual hyperlink insertion
US9753922B2 (en) * 2015-05-19 2017-09-05 Researchgate Gmbh Enhanced online user-interaction tracking
CN105574162B (zh) * 2015-12-16 2019-05-03 南京鼎岩信息科技有限公司 关键字自动超级链接的方法
US10445393B2 (en) * 2016-05-31 2019-10-15 Bootstrap Collective LLC System and method of creating and processing semantic URL
US10552544B2 (en) * 2016-09-12 2020-02-04 Sriram Chakravarthy Methods and systems of automated assistant implementation and management
US20180157629A1 (en) * 2016-12-01 2018-06-07 Raja Singh Tuli Method for reducing data transfer from a server to a portable device
US11425160B2 (en) * 2018-06-20 2022-08-23 OneTrust, LLC Automated risk assessment module with real-time compliance monitoring
US20220058234A1 (en) * 2020-08-20 2022-02-24 Eric Schneider Visual indicator generation and display system, method, and device

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
본 출원은 2021년 8월 27일에 출원된 "구조-기반 자동 하이퍼링킹을 위한 시스템 및 방법"이라는 명칭의 미국 가특허 출원 번호 63/260,682의 우선권을 주장한다. 상기 명시된 출원의 전체 내용은 모든 목적을 위해 참조로서 본원에 포함된다.

Also Published As

Publication number Publication date
US11954422B2 (en) 2024-04-09
US20240152686A1 (en) 2024-05-09
EP4377818A1 (en) 2024-06-05
WO2023028587A1 (en) 2023-03-02
AU2022335597A1 (en) 2024-04-04
US20230062267A1 (en) 2023-03-02

Similar Documents

Publication Publication Date Title
US10896214B2 (en) Artificial intelligence based-document processing
US10169453B2 (en) Automatic document summarization using search engine intelligence
US8954893B2 (en) Visually representing a hierarchy of category nodes
US7607082B2 (en) Categorizing page block functionality to improve document layout for browsing
US7552398B2 (en) Systems and methods for semantically zooming information
JP5497022B2 (ja) 入力文字列からのリソースロケータの提案
JP4637181B2 (ja) 文書構造に基づいた検索結果の表示
US8250053B2 (en) Intelligent enhancement of a search result snippet
US7861149B2 (en) Key phrase navigation map for document navigation
CN107122400B (zh) 使用视觉提示细化查询结果的方法、计算系统及存储介质
US8762326B1 (en) Personalized hot topics
JP4437500B2 (ja) データをタグ情報に対応付けて管理する技術
US20130173610A1 (en) Extracting Search-Focused Key N-Grams and/or Phrases for Relevance Rankings in Searches
US20060123042A1 (en) Block importance analysis to enhance browsing of web page search results
US9280522B2 (en) Highlighting of document elements
US8799257B1 (en) Searching based on audio and/or visual features of documents
JP2017117021A (ja) キーワード抽出装置、コンテンツ生成システム、キーワード抽出方法、およびプログラム
US20230063802A1 (en) Systems and methods for time-dependent hyperlink presentation
US11954422B2 (en) Systems and methods for structure-based automated hyperlinking
Makrydakis et al. Analyzing E-shop onsite optimization factors in the context of E-commerce search engine optimization
US20230061394A1 (en) Systems and methods for dynamic hyperlinking
JP2021043677A (ja) 辞書構築装置、マップ作成装置、検索装置、辞書構築方法、マップ作成方法、検索方法、およびプログラム
Mohajeri et al. BubbleNet: An innovative exploratory search and summarization interface with applicability in health social media
KR20100084265A (ko) 사용자 피드백을 이용하여 평가된 컨텐츠로부터 정보를 추출하고 이를 이용하기 위한 방법 및 장치
KR20240018197A (ko) 워드 프로세서의 문서에 대한 질의응답 시스템 및 방법