KR102629214B1 - 타겟 정보 생성 방법 및 시스템 - Google Patents

타겟 정보 생성 방법 및 시스템 Download PDF

Info

Publication number
KR102629214B1
KR102629214B1 KR1020210123374A KR20210123374A KR102629214B1 KR 102629214 B1 KR102629214 B1 KR 102629214B1 KR 1020210123374 A KR1020210123374 A KR 1020210123374A KR 20210123374 A KR20210123374 A KR 20210123374A KR 102629214 B1 KR102629214 B1 KR 102629214B1
Authority
KR
South Korea
Prior art keywords
target information
sample data
information
item
data sets
Prior art date
Application number
KR1020210123374A
Other languages
English (en)
Other versions
KR20230040138A (ko
Inventor
정지수
김진욱
김석훈
허지애
Original Assignee
네이버 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 네이버 주식회사 filed Critical 네이버 주식회사
Priority to KR1020210123374A priority Critical patent/KR102629214B1/ko
Priority to JP2021212157A priority patent/JP7334230B2/ja
Publication of KR20230040138A publication Critical patent/KR20230040138A/ko
Application granted granted Critical
Publication of KR102629214B1 publication Critical patent/KR102629214B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0623Item investigation
    • G06Q30/0625Directed, with specific intent or strategy
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9038Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/907Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0278Product appraisal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0641Shopping interfaces

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Databases & Information Systems (AREA)
  • Finance (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Game Theory and Decision Science (AREA)
  • Library & Information Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)

Abstract

본 발명은 아이템에 대한 타겟 정보를 생성하는 방법 및 시스템에 관한 것이다. 위에서 살펴본 과제를 해결하기 위하여, 본 발명에 따른 타겟 정보 생성 방법은, 샘플 데이터 및 상기 샘플 데이터에 대응되는 교정 데이터가 각각 포함된 서로 다른 복수의 샘플 데이터 세트(dataset)를 선정 받는 단계, 아이템에 연관된 연관 정보를 입력 받는 단계 및 상기 복수의 샘플 데이터 세트 및 상기 연관 정보를 이용하여, 상기 연관 정보와 관련된 적어도 하나의 키워드를 포함하는 상기 타겟 정보를 생성하는 단계를 포함할 수 있다.

Description

타겟 정보 생성 방법 및 시스템{METHOD AND SYSTEM FOR GENERATING TARGET INFORAMTION}
본 발명은 아이템에 대한 타겟 정보를 생성하는 방법 및 시스템에 관한 것이다.
인공지능의 사전적 의미는, 인간의 학습능력과 추론능력, 지각능력, 자연언어의 이해능력 등을 컴퓨터 프로그램으로 실현한 기술이라 할 수 있다. 이러한 인공지능은 딥러닝으로 인하여 비약적인 발전을 이루었다.
특히, 인공지능의 발달에 힘입어, 다양한 언어모델(Language Model)이 개발되었으며, 이러한 언어모델은 텍스트를 인지하고, 그 의미를 이해할 뿐만 아니라 문서 등 방대한 텍스트가 포함된 데이터로부터 정보를 추출하고, 분류하며, 나아가 직접 텍스트를 생성하는 수준에 이르렀다.
이러한 언어모델은 다양한 분야에 적극적으로 활용되고 있으며, 예를 들어, 검색 엔진, 문서 작성(ex: 이력서 작성, 보고서 작성, 게시물 작성 등), 다양한 주제에 대한 자유 대화, 주어진 텍스트에서의 데이터 파싱(ex: 데이터 요약, 분류 등), 전문 지식 제공, 프로그래밍, 주어진 문장을 적절한 스타일의 문장으로 변환 등과 같이, 텍스트를 기반으로 수행될 수 있는 다양한 분야에 존재한다.
이러한 언어모델에 기반하여, 종래 사람이 직접 수행하던 다양한 업무에 대한 자동화를 도모할 수 있다. 특히, 다양한 서비스 분야(예를 들어, 쇼핑 서비스, 뉴스 서비스 등)에서 사람에 의해 직접 생성되거나, 수정되었던 텍스트 기반의 작업에 대한 자동화가 가능하며, 이 경우, 서비스의 특성을 가미하여 언어모델을 활용하는 방법에 대한 연구가 필요하다.
본 발명은 다양한 서비스 분야에 따라 맞춤형으로 타겟 정보를 생성할 수 있는 타겟 정보 생성 방법 및 시스템을 제공하기 위한 것이다.
나아가, 본 발명은 쇼핑 서비스에 활용될 수 있는 타겟 정보를 생성하는 타겟 정보 생성 방법 및 시스템을 제공하기 위한 것이다.
나아가, 본 발명은, 언어모델을 이용하여, 상황에 적절한 텍스트로 구성된 정보를 생성할 수 있는 타겟 정보 생성 방법 및 시스템을 제공하기 위한 것이다.
위에서 살펴본 과제를 해결하기 위하여, 본 발명에 따른 타겟 정보 생성 방법은, 특정 카테고리에 해당하는 샘플 데이터 및 상기 샘플 데이터에 대응되는 교정 데이터가 한 쌍(pair)으로서 각각 포함된 서로 다른 복수의 샘플 데이터 세트(dataset)를 입력받는 단계, 상기 특정 카테고리에 해당하며, 아이템에 연관된 연관 정보를 입력받는 단계 및 상기 복수의 샘플 데이터 세트 및 상기 연관 정보를 이용하여, 상기 연관 정보와 관련된 적어도 하나의 키워드를 포함하는 상기 타겟 정보를 생성하는 단계를 포함할 수 있다.
나아가, 본 발명에 따른 타겟 정보 생성 시스템은, 특정 카테고리에 해당하는 샘플 데이터 및 상기 샘플 데이터에 대응되는 교정 데이터가 한 쌍(pair)으로서 각각 포함된 서로 다른 복수의 샘플 데이터 세트(dataset)를 저장하는 저장부 및 아이템에 연관된 연관 정보 및 상기 복수의 샘플 데이터 세트(dataset)를 이용하여, 상기 연관 정보와 관련된 적어도 하나의 키워드를 포함하는 상기 타겟 정보가 생성되도록 하는 프로세스를 수행하는 제어부를 포함할 수 있다.
나아가, 본 발명에 따른 전자기기에서 하나 이상의 프로세스에 의하여 실행되며, 컴퓨터로 판독될 수 있는 기록매체에 저장된 프로그램은, 특정 카테고리에 해당하는 샘플 데이터 및 상기 샘플 데이터에 대응되는 교정 데이터가 한 쌍(pair)으로서 각각 포함된 서로 다른 복수의 샘플 데이터 세트(dataset)를 입력받는 단계, 상기 특정 카테고리에 해당하며, 상기 아이템에 연관된 연관 정보를 입력받는 단계 및 상기 복수의 샘플 데이터 세트 및 상기 연관 정보를 이용하여, 상기 연관 정보와 관련된 적어도 하나의 키워드를 포함하는 상기 타겟 정보를 생성하는 단계를 수행하도록 하는 명령어들을 포함할 수 있다.
위에서 살펴본 것과 같이, 본 발명에 따른 타겟 정보 생성 방법 및 시스템은, 샘플 데이터 세트 및 아이템에 대한 연관 정보가 포함된 프롬프트를 입력으로 하는 언어모델을 이용하여, 아이템에 대한 타겟 정보를 생성할 수 있다. 이때, 본 발명에 따른 타겟 정보 생성 방법 및 시스템에서는, 샘플 데이터 및 상기 샘플 데이터에 대응되는 교정 데이터가 한 쌍으로서 포함되도록 샘플 데이터 세트를 구성함으로써, 언어 모델이, 프롬프트에 기반하여, 교정 데이터에 상응하는 품질의 타겟 정보를 생성하도록 유도할 수 있다.
따라서, 본 발명에 따른 타겟 정보 생성 방법 및 시스템에 의하여, 아이템에 연관된 연관 정보를 기반으로, 교정 데이터에 상응하는 품질의 타겟 정보를 생성할 수 있다. 결과적으로 사용자는, 연관 정보를 타겟 정보로 교정 또는 수정하기 위한 작업을 줄일 수 있어, 업무 효율을 극대화할 수 있다.
도 1은 본 발명에 따른 타겟 정보 생성 방법 및 시스템의 활용예를 설명하기 위한 개념도이다.
도 2는 본 발명에 따른 타겟 정보 생성 시스템을 설명하기 위한 개념도이다.
도 3은 본 발명에 따른 타겟 정보 생성 방법 및 시스템에서 활용되는 프롬프트를 설명하기 위한 개념도이다.
도 4 및 도 5는 본 발명에 따른 타겟 정보 생성 방법을 설명하기 위한 흐름도들이다.
도 6a, 도 6b, 도 6c, 도 7, 도 8, 도 9a, 도 9b, 도 9c, 도 10 및 도 11은 샘플 데이터 세트 및 타겟 정보를 설명하기 위한 개념도들이다.
이하, 첨부된 도면을 참조하여 본 명세서에 개시된 실시 예를 상세히 설명하되, 도면 부호에 관계없이 동일하거나 유사한 구성요소에는 동일한 참조 번호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다. 이하의 설명에서 사용되는 구성요소에 대한 접미사 "모듈" 및 "부"는 명세서 작성의 용이함만이 고려되어 부여되거나 혼용되는 것으로서, 그 자체로 서로 구별되는 의미 또는 역할을 갖는 것은 아니다. 또한, 본 명세서에 개시된 실시 예를 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 명세서에 개시된 실시 예의 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다. 또한, 첨부된 도면은 본 명세서에 개시된 실시 예를 쉽게 이해할 수 있도록 하기 위한 것일 뿐, 첨부된 도면에 의해 본 명세서에 개시된 기술적 사상이 제한되지 않으며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.
제1, 제2 등과 같이 서수를 포함하는 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되지는 않는다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.
단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다.
본 출원에서, "포함한다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
앞서 살펴본 것과 같이, 인공지능의 발달로 다양한 언어모델이 개발되었으며, 이에 기반하여, 종래 사람이 직접 수행하던 다양한 업무에 대한 자동화를 도모할 수 있게 되었다. 특히, 다양한 서비스 분야(예를 들어, 쇼핑 서비스, 뉴스 서비스 등)에서 사람에 의해 직접 생성되거나, 교정 또는 수정되었던 텍스트 기반의 작업에 대한 자동화가 기능해졌으며, 본 발명은 다양한 서비스 분야에 따라 맞춤형으로 정보를 생성할 수 있는 타겟 정보 생성 방법 및 시스템을 제공하기 위한 것이다.
본 발명에서는 설명의 편의를 위하여, “타겟 정보”라는 용어를 사용하여, 본 발명에 따른 타겟 정보 생성 방법 및 시스템을 통해 생성되는 정보를 정의하도록 한다. 다만, 위의 용어는 자유롭게 변형이 가능함은 물론이다.
나아가, 본 발명에서 “타겟 정보를 생성”한다고 함은, i)새로운 정보를 생성, ii) 정보를 수정 또는 교정하는 것을 모두 포함하는 의미로 받아들여질 수 있다. 정보의 수정 또는 교정의 결과물 역시, 정보가 생성된 것으로 이해되어질 수 있기 때문이다.
한편, 본 발명에 따른 타겟 정보 생성 방법 및 시스템은, 아이템(item)을 기준으로 아이템에 대한 타겟 정보를 생성할 수 있다.
본 발명에서 아이템은 본 발명이 적용되는 서비스 분야에 따라 다양하게 정의될 수 있다.
일 예로서, 도 1에 도시된 것과 같이, 본 발명이 적용되는 분야가 쇼핑 서비스 분야인 경우, 아이템은 상품(商品)을 의미할 수 있다. 이때, 본 발명에 따른 타겟 정보 생성 방법 및 시스템에서는, 도 1의 (b)에 도시된 것과 같이, 상품(예를 들어, 신발, 또는 가방 등)에 해당하는 아이템에 대한 타겟 정보(31a, 32a)를 생성할 수 있다. 이러한 타겟 정보(31a, 32a)는 쇼핑 서비스에 활용될 수 있다. 도 1의 (b)에 도시된 것과 같이, 타겟 정보(31a, 32a)는 쇼핑 서비스를 위한 쇼핑 서비스 페이지(예를 들어, 웹페이지 또는 애플리케이션(application)의 페이지, 도면부호 30 참조)에 노출되어, 아이템의 상품명으로서 활용되거나, 아이템을 설명하는 용도로 활용되는 등 다양하게 활용될 수 있다.
다른 예로서, 본 발명에 적용되는 분야가 뉴스 서비스 분야인 경우, 아이템은 기사(또는 뉴스 기사)에 해당하는 콘텐츠(content)를 의미할 수 있다. 이때, 본 발명에 따른 타겟 정보 생성 방법 및 시스템에서는, 뉴스 기사에 해당하는 아이템에 대한 타겟 정보를 생성할 수 있다. 그리고, 이러한 타겟 정보는, 아이템의 뉴스 기사 제목, 헤드라인, 아이템을 설명하는 용도로 활용되는 등 다양하게 활용될 수 있다. 나아가, 이러한 타겟 정보는, 뉴스 서비스의 페이지(예를 들어, 웹페이지 또는 애플리케이션(application)의 페이지) 상에 노출될 수 있다.
이 외에도, 본 발명은 다양한 서비스 분야에 활용되어, 본 발명에서 생성되는 타겟 정보는, 아이템의 제목, 아이템에 대한 설명, 아이템과 관련된 정보로서의 역할을 수행할 수 있다.
한편, 타겟 정보는, 아이템과 연관된 정보를 기반으로, 생성될 수 있다. 본 발명에서는 설명의 편의를 위하여, “아이템과 연관된 정보”를 “연관 정보”로 명명하도록 한다. 이러한 연관 정보는 아이템에 대하여 적어도 하나의 서버에 저장(또는 등록)되거나, 적어도 하나의 저장부(또는 저장소)에 저장된 정보일 수 있다.
이러한 연관 정보는, 본 발명에 따른 시스템 또는 적어도 하나의 다른 시스템에 의하여 생성된 정보이거나, 사용자 또는 관리자에 의하여 입력된 정보일 수 있다.
연관 정보의 일 예에 대하여 살펴보면, 도 1의 (a)에 도시된 것과 같이, 연관 정보는, 아이템(예를 들어, 쇼핑 아이템 또는 상품)에 대한 다양한 정보(21, 22) 중 적어도 하나일 수 있으며, 예를 들어, 아이템에 대한 상품명(21a, 22a)일 수 있다.
예를 들어, 도 1의 (a)에 도시된 것과 같이, 제1 아이템(예를 들어, “신발”에 해당하는 상품)에 대한 정보(21) 중 제1 연관 정보(21a)는 제1 아이템에 대한 상품명인 “살바토레 시아카 플라워 힐 벨벳 뮬 01M90”에 해당할 수 있다.
다른 예를 들어, 도 1의 (a)에 도시된 것과 같이, 제2 아이템(예를 들어, “가방”에 해당하는 상품)에 대한 정보(22) 중 제2 연관 정보(22a)는 제2 아이템에 대한 상품명인 “프라다 SACCA 새틴블랙 숄더백 BLACK”에 해당할 수 있다.
한편, 본 발명에 따른 타겟 정보 생성 방법 및 시스템에서는, 위에서 살펴본 아이템에 대한 연관 정보(예를 들어, 제1 연관 정보(21a), 제2 연관 정보(22a))를 이용하여, 도 1의 (b)에 도시된 것과 같이, 타겟 정보(예를 들어, 제1 타겟 정보(31a), 제2 타겟 정보(32b))를 생성할 수 있다.
이와 같이, 본 발명에서는, 연관 정보를 이용하여 다양한 타겟 정보를 생성할 수 있으며, 이러한 타겟 정보는 위에서 살펴본 예시와 같이, 쇼핑 아이템의 상품명이거나, 뉴스 기사의 제목 등으로 활용될 수 있다.
예를 들어, 본 발명을 쇼핑 아이템의 상품명 교정기로서 활용하는 경우, 연관 정보 중 적어도 일부는 쇼핑 아이템과 관련된 연관 정보가 포함될 수 있으며, 본 발명은 이를 기반으로 쇼핑 아이템과 관련된 타겟 정보를 생성할 수 있다.
다른 예를 들어, 본 발명을 뉴스 기사의 제목 교정기로서 활용하는 경우, 연관 정보 중 적어도 일부는 뉴스 기사와 관련된 연관 정보가 포함될 수 있으며, 본 발명은 이를 기반으로 뉴스 기사와 관련된 타겟 정보를 생성할 수 있다. 한편, 연관 정보에 기반하여 생성되는 타겟 정보는, 연관 정보가 속한 카테고리(또는 연관 정보의 속성)과 동일한 카테고리(또는 동일한 속성)에 해당하는 정보일 수 있다. 즉 본 발명의 일 예에서는, 연관 정보가 속한 카테고리와 동일한 카테고리의 타겟 정보를 생성할 수 있다. 이 경우, 타겟 정보로서 얻고 싶은 특정 카테고리의 정보가 존재하는 경우, 본 발명에서는 연관 정보로서, 상기 특정 카테고리에 해당하는 정보를 입력함으로써, 타겟 정보를 획득할 수 있다.
예를 들어, 위에서 살펴본 것과 같이, 연관 정보가 아이템에 대한 상품명인 경우, 타겟 정보 역시, 아이템에 대한 상품명일 수 있다.
나아가, 연관 정보를 이용하여 생성되는 타겟 정보는, 연관 정보가 속한 카테고리와 서로 다른 카테고리일 수 있음은 물론이다. 본 발명에서는 타겟 정보를 생성하기 위한 샘플 데이터 세트를 어떻게 구성하는지에 따라서 필요한 형태의 타겟 정보를 생성할 수 있다.
한편, 본 발명에 따른 타겟 정보 생성 방법 및 시스템에서는 언어 모델(Language Model, LM)을 이용하여, 타겟 정보를 생성할 수 있으며, 본 발명에서는 이러한 언어 모델을 “대형 언어 모델(10)”로 통일하여 명명하도록 한다. 나아가, 대형 언어 모델은 다양한 용어로 명명될 수 있으므로, 그 용어에 대해서는 본 발명에서 특별한 한정을 두지 않는다.
한편, 본 발명에서 활용되는 대형 언어 모델은 그 종류에 제한이 없으며, 다양한 정보에 대한 학습이 이루어진 언어 모델이면 족하다. 한편, 최근 활발하게 연구되고 있는 대형 언어 모델은 퓨삿 러닝(few-shot learning) 등과 같은 방식을 이용하여 파인 퓨닝(fine-tuning) 없이 추론이 가능한 언어 모델로, 기존의 일반 언어 모델에 비해 모델 크기가100배 이상 커질 수 있으며 많은 양의 데이터를 이용하여 학습이 이루어진다. 예를 들면, 하이퍼클로바(HyperCLOVA), GPT 3(Generative Pre-trained Transformer 3) 등이며, 본 발명에서도 이와 같은 대형 언어 모델들을 활용할 수 있다.
본 발명에 따른 타겟 정보 생성 방법 및 시스템에서는, 도 1에 도시된 것과 같이, 대형 언어 모델(10)에 아이템에 연관된 연관 정보 및 추가정보(예를 들어, 샘플 데이터 세트(이하 후술됨))를 입력함으로써, 타겟 정보를 생성할 수 있다.
이하에서는, 도면과 함께 본 발명에 따른 타겟 정보 생성 방법 및 시스템에 대하여 보다 구체적으로 살펴본다. 도 2는 본 발명에 따른 타겟 정보 생성 시스템을 설명하기 위한 개념도이고, 도 3은 본 발명에 따른 타겟 정보 생성 방법 및 시스템에서 활용되는 프롬프트를 설명하기 위한 개념도이다. 나아가, 도 4 및 도 5는 본 발명에 따른 타겟 정보 생성 방법을 설명하기 위한 흐름도들이고, 도 6a, 도 6b, 도 6c, 도 7, 도 8, 도 9a, 도 9b, 도 9c, 도 10 및 도 11은 샘플 데이터 세트 및 타겟 정보를 설명하기 위한 개념도들이다.
먼저, 도 2에 도시된 것과 같이, 본 발명에 따른 타겟 정보 생성 시스템(100)은 입력부(110), 저장부(120) 및 제어부(130) 중 적어도 하나를 포함할 수 있다. 나아가, 비록 도시되지는 않았으나, 타겟 정보 생성 시스템(100)은 통신부를 더 포함할 수 있으며, 통신부는 전자기기(또는 사용자의 전자기기)와 통신하도록 이루어질 수 있다.
나아가, 타겟 정보 생성 시스템(100)은 대형 언어 모델(10)과 연동하도록 이루어질 수 있다. 즉, 타겟 정보 생성 시스템(100)은 대형 언어 모델(10)을 이용하여 타겟 정보를 생성하는 것으로서, 타겟 정보 생성 시스템(100)의 구성 중 적어도 일부는 대형 언어 모델(10)로의 정보의 입력을 처리하거나, 대형 언어 모델(10)로부터 출력되는 정보를 처리하기 위한 역할을 수행할 수 있다.
나아가, 본 발명에 따른 타겟 정보 생성 시스템은 대형 언어 모델(10)을 포함하도록 이루어질 수 있음은 물론이다.
입력부(110)에 대하여 살펴보면, 입력부(110)는 대형 언어 모델(10)에 입력되는 프롬프트(prompt)를 구성하는 정보를 입력 또는 선택받기 위한 역할을 수행할 수 있다.
입력부(110)는 i)사용자와 본 발명에 따른 타겟 정보 생성 시스템(100) 사이를, 또는 ii)본 발명에 따른 타겟 정보 생성 시스템(100)과 적어도 하나의 다른 시스템을 연결하는 인터페이스(interface)를 포함할 수 있다. 나아가, 입력부(110)는 본 발명에 따른 타겟 정보 생성 시스템(100)에 포함된 구성 요소들 간을 연결하는 인터페이스를 포함할 수 있다.
본 발명에서는, 대형 언어 모델(10)에 프롬프트를 입력함으로써, 그 결과물로서 타겟 정보를 획득할 수 있다. 이때, 프롬프트(prompt)는 도 3의 (a)에 도시된 것과 같이, 대형 언어 모델(10)에 입력되는 데이터로서, 프롬프트(310)에는 다양한 데이터 세트가 포함될 수 있다.
프롬프트(310)는 적어도 하나의 샘플 데이터 세트(311, 312) 및 타겟 데이터 세트(313) 중 적어도 하나를 포함하도록 구성될 수 있다.
여기에서, 샘플 데이터 세트(311, 312)는 타겟 정보를 생성하기 위하여, 대형 언어 모델(10)이 참조하는 데이터를 포함할 수 있다. 나아가, 샘플 데이터 세트에는 각 샘플 데이터에 대한 타겟 정보가 더 포함될 수 있으며, 이에 대해서는 뒷부분에서 자세하게 설명하도록 한다.
나아가, 타겟 데이터 세트(313)는 타겟 정보의 생성의 대상이 되는 아이템에 대한 데이터를 포함할 수 있다. 앞서 살펴본 아이템에 대한 연관 정보는 타겟 데이터 세트(313)의 데이터로서 포함될 수 있다. 즉, 타겟 데이터 세트(313)에는 아이템에 대한 연관 정보가 포함될 수 있다.
샘플 데이터 세트(311, 312) 및 타겟 데이터 세트(313) 에 포함되는 데이터 각각은 적어도 하나의 카테고리(또는 속성)에 대응될 수 있다.
나아가, 샘플 데이터 세트(311, 312)와 타겟 데이터 세트(313)에 포함되는 데이터의 카테고리(또는 속성)은 적어도 하나가 동일하게 이루어질 수 있다, 예를 들어, 타겟 데이터 세트(313)에 “상품명” 카테고리가 포함된 경우, 샘플 데이터 세트(311, 312)에도 “상품명” 카테고리가 포함될 수 있다.
한편, 본 발명에서는, 위의 예와 달리, 샘플 데이터 세트(311, 312)와 타겟 데이터 세트(313)에 포함되는 데이터의 카테고리(또는 속성)이 모두 다르게 이루어질 수 있음은 물론이다,
나아가, 샘플 데이터 세트(311, 312) 및 타겟 데이터 세트(313)를 구성하는 데이터는, 각각의 카테고리(또는 데이터 타입, 데이터 속성)에 해당하는 데이터 필드(data filed) 및 데이터 값으로 구성될 수 있다.
데이터 필드는, 도 3의 (a)에 도시된 것과 같이, “상품명”, “날짜”, “교정문구”와 같이, 데이터 값이 나타내는 의미 또는 데이터 값의 종류를 정의하기 위한 것으로 이해되어질 수 있다. 이러한 데이터 필드는, “카테고리 명(name)”, “데이터 타입”, “데이터 속성” 등으로 이해되어질 수 있다.
한편, 데이터 필드는, 대형 언어 모델(10)이 인식할 수 있도록, 사전에 정의된 규칙을 따를 수 있다. 예를 들어, 대형 언어 모델(10)은 “상품명:” 이후에 입력되는 데이터는, “상품명”이라는 데이터 필드(ex: 카테고리)에 해당하는 데이터라고 인식할 수 있다.
또 다른 예를 들어, 대형 언어 모델(10)은, 특정 데이터 필드(예를 들어 “교정문구:”) 이후에 입력되는 데이터를 해당 데이터 세트에 포함된 데이터 값에 기반하여 생성되거나 교정된 데이터라고 인식할 수 있다.
예를 들어, 도 3의 (a)에 도시된 것과 같이, 대형 언어 모델(10)는 특정 샘플 데이터 세트(311)에 포함된 특정 데이터 필드(“교정문구: ”)에 대응되는 데이터 값(“커피별 텀블러”)은, 특정 샘플 데이터 세트(311)에 포함된 샘플 데이터(311a, 311b)에 기반하여 생성되거나 교정(또는 수정)된 데이터라고 인식할 수 있다.
대형 언어 모델(10)과 본 발명에 따른 타겟 정보 생성 시스템(100)은 다양한 데이터 필드가 갖는 의미 및 데이터 특성에 대하여, 사전에 정의된 규칙을 상호 공유할 수 있다.
한편, 본 발명에서는 프롬프트는(310)의 마지막을 데이터 필드로 함으로써, 이에 대응하는 데이터 값(313d)을, 프롬프트(310)를 입력으로 하는 대형 언어 모델(10)의 출력으로서 획득할 수 있다. 그 결과, 도 3의 (b)에 도시된 것과 같이, “교정문구” 데이터 필드(313c)에 대한 데이터 값(313d, “안전하고 편안한 침대”)이 획득될 수 있다.
한편, 데이터 필드의 명칭은 상황에 따라 적절한 용어로 변경될 수 있음은 물론이다.
프롬프트(310)는 서로 다른 데이터 세트를 구분하기 위한 구분자(구분 데이터 또는 식별자314)를 포함할 수 있다. 구분자는 도시와 같이, “#####”로 표현되거나, 다양한 문자 또는 기호를 이용하여 표현될 수 있다. 이러한 구분자는 대형 언어 모델(10)과 사전에 상호 정의된 규칙에 근거할 수 있다. 대형 언어 모델(10)은 프롬프트(10)에 위에서 살펴본 구분자(314)가 포함된 경우, 구분자(314) 이후에 존재하는 데이터는 구분자(314) 이전에 존재하는 데이터와 서로 다른 데이터 세트에 포함되는 데이터로 인식할 수 있다.
다음으로 저장부(120)에는 다양한 정보가 저장될 수 있다. 저장부(120)는 본 발명에 따른 타겟 정보 생성 시스템의 내부 또는 외부 중 적어도 하나에 존재할 수 있다, 저장부(120)는 서버(server)로 구성되거나, 클라우드 방식의 저장소로 이루어질 수 있음은 물론이다.
저장부(120)에는 복수의 샘플 데이터 세트 및 타겟 데이터 세트 중 적어도 하나에 대한 데이터가 저장될 수 있다. 저장부(120)에는 프롬프트(310)에 포함되는 샘플 데이터 세트 외에 추가적인 다양한 샘플 데이터 세트가 저장되어 존재할 수 있다. 프롬프트(310)에 포함되는 샘플 데이터 세트는, 저장부(120)에 존재하는 다양한 샘플 데이터 세트 중 사용자 또는 제어부(130)에 의해 선택된 적어도 일부에 해당할 수 있다.
나아가, 저장부(120)에는 아이템에 대한 연관 정보가 저장되어 존재할 수 있다. 제어부(130)는 저장부(120)에 포함된 아이템에 대한 연관 정보를 이용하여, 타겟 데이터 세트를 구성할 수 있다.
다음으로 제어부(130)는 타겟 정보를 생성하기 위하여 필요한 전반적인 제어를 수행할 수 있다. 일 예로서, 제어부(130)는 대형 언어 모델(10)에 프롬프트(310)가 입력으로서 처리되도록 대형 언어 모델(10)과 연동할 수 있다. 나아가, 본 발명에 따른 타겟 정보 생성 시스템(100)은 대형 언어 모델(10)을 일 구성으로서 포함할 수 있으며, 이 경우, 제어부(130)는 타겟 정보 생성을 위하여 대형 언어 모델(10)에 대한 적절한 제어를 수행할 수 있다.
한편, 제어부(130)는 대형 언어 모델(10)을 통해 생성된 타겟 정보에 대한 검증을 수행하고, 검증 결과에 근거하여 타겟 정보가 재생성되도록 하는 일련의 프로세스를 수행할 수 있다.
나아가, 제어부(130)는 대형 언어 모델(10)로부터 생성된 복수의 타겟 정보 중 적어도 하나를 최종적으로 선택하거나, 최종적인 선택을 위하여 복수의 타겟 정보 각각에 대한 의미 분석을 수행할 수 있다. 이러한 의미 분석은, 복수의 타겟 정보 각각과 연관 정보 간의 관련성 정도를 판단하는 것으로서, 다양한 방법에 근거하여 이루어질 수 있다.
한편, 대형 언어 모델(10)을 통해 생성되는 타겟 정보는 저장부(120)에 저장되거나, 사용자가 확인 가능하도록 출력부(미도시됨)에 출력되도록 이루어지는 등, 상황에 따라 적절하게 처리될 수 있다. 제어부(130)는 생성된 타겟 정보에 대한 처리를 수행할 수 있으며, 예를 들어, 타겟 정보가 시각적으로 사용자에게 출력되어야 하는 경우, 연동된 디스플레이부를 이용하여, 타겟 정보를 출력시킬 수 있다. 예를 들어, 출력부는, 사용자의 전자기기에 구비된 디스플레이부일 수 있다.
본 발명에 따른 타겟 정보 생성 시스템(100)는 사용자의 전자기기와 통신을 통하여, 사용자의 전자기기로부터 연관 정보를 입력받을 수 있다. 그리고, 타겟 정보 생성 시스템(100)은 대형 언어 모델(10)을 이용하여 사용자의 전자기기로부터 입력받은 연관 정보를 기초로, 타겟 정보를 생성하고, 이를 사용자의 전자기기에 전송할 수 있다.
사용자의 전자기기로부터 입력받는 연관 정보는, 적어도 하나의 카테고리에 대한 정보일 수 있다.
예를 들어, 본 발명에 따른 타겟 정보 생성 시스템(100)이 쇼핑 아이템에 대한 상품명 교정기로 활용되는 경우, 본 발명에 따른 타겟 정보 생성 시스템(100)에서는, 사용자의 전자기기로부터 쇼핑 아이템과 관련된 적어도 하나의 카테고리에 대한 정보를 입력받을 수 있다. 쇼핑 아이템과 관련된 적어도 하나의 카테고리는, 상품명, 날짜, 후기, 브랜드, 색상, 사이즈 등 다양할 수 있다.
타겟 정보 생성 시스템(100)은 사용자의 전자기기로부터 입력받은 연관 정보 및 복수의 샘플 데이터 세트를 이용하여, 타겟 정보를 생성할 수 있다.
이때, 복수의 샘플 데이터 세트의 선택은, 타겟 정보 생성 시스템(100)의 제어 하에 이루어지거나, 사용자의 요청에 근거하여 이루어질 수 있다.
이하에서는, 위에서 살펴본 본 발명에 따른 타겟 정보 생성 시스템(100)을 참조하여, 타겟 정보를 생성하는 방법에 대하여 보다 구체적으로 살펴본다.
도 4에 도시된 것과 같이, 본 발명에서는 복수의 샘플 데이터 세트를 선택(또는 선정)하는 과정이 진행될 수 있다(S410). 복수의 샘플 데이터 세트에 포함된 데이터는, 프롬프트에 포함되며, 프롬프트는 대형 언어 모델(10)에 입력되어, 타겟 정보를 생성하는데 활용될 수 있다.
샘플 데이터 세트를 구성하는 데이터에 대하여 보다 구체적으로 살펴보면, 샘플 데이터 세트는 서로 다른 복수의 카테고리에 각각 대응되는 데이터를 포함할 수 있다.
여기에서, 카테고리는 데이터의 의미, 데이터의 종류, 데이터의 타입 또는 데이터의 속성 중 적어도 하나를 정의하기 위한 것으로서, 예를 들어, 도 6a에 도시된 것과 같이, 상품명(611), 날짜(612), 교정문구(613), 도 6b에 도시된 것과 같이, 상품 종류 카테고리(633), 브랜드(634), 도 6c에 도시된 것과 같이, 태그(655) 등과 같은 다양한 카테고리가 존재할 수 있다. 한편, 위에서 열거된 카테고리의 대부분은 쇼핑 서비스에 해당하는 카테고리일 수 있다. 이와 같이, 샘플 데이터 세트를 구성하는 카테고리는, 샘플 데이터 세트에 포함되는 데이터의 내용에 따라, 다양하게 정의될 수 있다.
예를 들어, 샘플 데이터 세트를 구성하는 데이터의 내용이 뉴스 기사에 해당하는 경우, 카테고리는 언론사, 기사 제목, 날짜, 기사 분야, 댓글, 교정문구 등으로 구성될 수 있다.
한편, 본 발명에서 샘플 데이터 세트를 구성하는 데이터는 서로 다른 특성을 가질 수 있다.
먼저, 샘플 데이터 세트를 구성하는 제1 특성의 데이터는, 적어도 하나의 카테고리에 각각 대응되는 데이터로서, 본 발명에서는 이를 “샘플 데이터”로 명명할 수 있다.
본 발명에 따른 샘플 데이터 세트에는, 위에서 살펴본 샘플 데이터 및 샘플 데이터에 대응되는 타겟 정보(또는 타겟 데이터)가 한 쌍(pair)으로서 포함될 수 있다.
이때, 타겟 정보(타겟 데이터)를 제2 특성의 데이터로 정의할 수 있다. 즉, 샘플 데이터 세트에는, 타겟 정보에 해당하는 데이터(타겟문구 또는 타겟 데이터)가 포함될 수 있다.
본 발명에서, 타겟 정보에 해당하는 “교정문구” 카테고리의 데이터는, 샘플 데이터 세트를 구성하는 데이터들을 기반으로 생성되거나 교정(또는 수정)된 문구(또는 텍스트, 데이터)로 이해되어질 수 있다. 타겟 정보에 해당하는 교정 문구는 앞서 살펴본 제1 특성의 데이터를 기반으로 생성되거나 교정된 문구일 수 있다.
이와 같이, 샘플 데이터 세트에 포함된 타겟 정보는, 샘플 데이터 세트를 구성하는 데이터들을 기반으로 생성되거나 교정될 수 있다.
이때, 타겟 정보에 해당하는 데이터의 카테고리는, 샘플 데이터에 대응되는 적어도 하나의 카테고리 중 어느 하나와 동일하거나, 상이한 카테고리일 수 있다.
타겟 정보에 해당하는 데이터의 카테고리가, 샘플 데이터에 대응되는 적어도 하나의 카테고리와 동일한 경우, 예를 들어, 제1 특성의 데이터인 상기 샘플 데이터에 상품명 카테고리를 포함한 경우, 제2 특성의 데이터인 교정 문구는 상품명 카테고리에 해당하는 데이터일 수 있다.한편, 타겟 정보 카테고리에 해당하는 데이터는, 본 발명에 따른 타겟 정보 생성 시스템(100)에 의하여 생성되거나, 사용자 또는 관리자에 의하여 입력된 정보일 수 있다.
타겟 정보에 해당하는 데이터는, 해당 타겟 정보에 대한 샘플 데이터 세트를 구성하는 데이터와 연관된 키워드를 적어도 하나 포함하도록 이루어질 수 있다. 이때, 키워드는, 샘플 데이터 세트를 구성하는 데이터에 해당하는 텍스트(또는 토큰(token)) 중 적어도 일부와 동일하거나, 유사한 의미를 가질 수 있다.
여기에서 “토큰”은 자연어 처리를 위하여 하나의 단어를 세분화한 단어 조각으로 이루어질 수 있다. 한국어의 경우, 단어는 평균적으로 1개 내지 2개의 토큰으로 이루어질 수 있다. 예를 들어, '맛있어'라는 표현은 각각 '맛'과 '있어'라는 두 개의 토큰으로 구분될 수 있다.
예를 들어, 도 3의 (a) 도시된 것과 같이, 특정 샘플 데이터 세트(310)에 “상품명” 카테고리에 해당하는 데이터(“커피별 스테인레스 TOGO컵 텀블러 335ml”, 도면부호331a 참조)가 포함된 경우, 타겟 정보인 교정 문구는 “상품명” 카테고리에 포함된 데이터의 내용과 관련된 키워드를 포함하는 데이터(“커피별 텀블러”, 도면부호 331c)로 구성될 수 있다.
이와 같이, 샘플 데이터 세트에는 샘플 데이터 및 샘플 데이터에 대응되는 교정 문구(또는 교정 데이터)가 한 쌍(pair)으로서 포함될 수 있다.
S410 단계에서 선택된 복수의 샘플 데이터 세트 각각에는, 적어도 하나의 카테고리에 각각 대응되는 샘플 데이터가 포함될 수 있다. 즉, 샘플 데이터 세트에는 하나 또는 그 이상의 카테고리에 각각 대응되는 샘플 데이터가 포함될 수 있다.
따라서, 각각의 샘플 데이터 세트에는, 도 6a 내지 도 6c에 도시된 것과 같이, 제1 카테고리(상품명, 611), 제2 카테고리(날짜, 612), 제3 카테고리(상품 종류, 633), 제4 카테고리(브랜드, 634), 제5 카테고리(태그, 655) 등과 같이 다양한 카테고리 중 적어도 하나에 해당하는 샘플 데이터가 포함될 수 있다.
예를 들어, 도 3의 (a)에 도시된 것과 같이, 샘플 데이터 세트(310)에는 “상품명” 카테고리에 해당하는 샘플 데이터(311a) 및 “날짜” 카테고리에 해당하는 샘플 데이터(311c)가 포함될 수 있다.
한편, 본 발명에서, 타겟 정보를 생성하기 위하여 프롬프트에 포함되는 샘플 데이터 세트는 복수일 수 있다. 즉, S410 단계에서는, 복수의 샘플 데이터 세트가 선택될 수 있다. 본 발명에서 선택되는 샘플 데이터의 개수는 특별한 한정을 두지 않는다.
한편, 복수의 샘플 데이터 세트 각각에 포함된 데이터의 내용은, 타겟 정보를 생성하고자 하는 아이템과 관련성이 존재하는 내용일 수 있다. 예를 들어, 아이템이 상품에 대한 것인 경우, 선택된 복수의 샘플 데이터 세트 각각에 포함된 데이터의 내용은, 상품과 관련된 내용일 수 있다.
나아가, S410 단계에서 선택된 복수의 샘플 데이터 세트 각각에 포함된 데이터의 카테고리는 서로 동일할 수 있다. S410 단계에서는, 동일 프롬프트 내에는 동일한 카테고리를 갖는 데이터들 구성된 복수의 샘플 데이터 세트가 선택될 수 있다.
일 예로서, 도 6a에 도시된 것과 같이, S410 단계에서 선택된 복수의 샘플 데이터 세트(621, 622, 623) 각각에는, 상품명 카테고리(611), 날짜 카테고리(612), 교정문구 카테고리(613)에 해당하는 데이터가 존재할 수 있다.
다른 예로서, 도 6b에 도시된 것과 같이, S410 단계에서 선택된 복수의 샘플 데이터 세트(641, 642, 643) 각각에는 상품명 카테고리(631), 날짜 카테고리(632), 상품 종류 카테고리(633), 브랜드 카테고리(634), 교정문구 카테고리(635)에 해당하는 데이터가 존재할 수 있다.
또 다른 예로서, 도 6c에 도시된 것과 같이, S410 단계에서 선택된 복수의 샘플 데이터 세트(661, 662, 663) 각각에는 상품명 카테고리(651), 날짜 카테고리(652), 상품 종류 카테고리(653), 브랜드 카테고리(654), 태그 카테고리(655), 교정문구 카테고리(656)에 해당하는 데이터가 존재할 수 있다.
한편, 위에서 살펴본 예들 외에도, 선택된 복수의 샘플 데이터 세트 각각에는 다양한 카테고리에 각각 대응되는 데이터를 포함하도록 구성될 수 있다.
위에서 살펴본 것과 같이, S410단계에서 선택되는 복수의 샘플 데이터 세트 각각은, 서로 동일한 카테고리에 해당하는 데이터들로 구성되나, 도 6a, 도 6b 및 도 6c에서 살펴본 것과 같이, 복수의 샘플 데이터 세트 각각을 구성하는 카테고리의 수 및 종류에는 특별한 한정을 두지 않는다.
본 발명에서 타겟 정보는, 복수의 샘플 데이터 세트를 참조하여 생성되므로, 복수의 샘플 데이터 세트 각각을 구성하는 데이터의 내용에 따라, 서로 다른 내용을 가질 수 있다. 즉, 대형 언어 모델(10)은 프롬프트에 입력된 복수의 샘플 데이터 세트의 내용에 기반하여, 타겟 정보를 생성하므로, 복수의 샘플 데이터 세트를 구성하는 데이터의 내용이 다르면, 서로 다른 타겟 정보를 생성할 수 있다. 이에, 도 6a, 도 6b 및 도 6c에 살펴본 것과 같이, 샘플 데이터를 구성하는 카테고리의 종류가 다르면, 서로 다른 타겟 정보가 생성될 수 있다. 즉, 샘플 데이터를 구성하는 카테고리의 종류에 따라, 상기 대형 언어 모델의 출력으로서 생성되는 타겟 정보가 달라질 수 있다.
예를 들어, 복수의 샘플 데이터 세트 각각에, 상품명에 해당하는 카테고리 및 후기에 해당하는 카테고리에 각각 대응되는 데이터가 포함된 경우, 타겟 정보는, 아이템에 연관된 연관 정보와 관련된 키워드 및 아이템의 후기와 관련된 키워드를 포함할 수 있다. 즉, 타겟 정보는, 아이템에 연관된 연관 정보와 관련된 키워드 및 아이템의 후기와 관련된 키워드를 포함할 확률이 높아질 수 있다.
이때, 아이템의 후기와 관련된 키워드는, 샘플 데이터 세트를 참조하여 생성된 것일 수 있다.
또 다른 예를 들어, 복수의 샘플 데이터 세트 각각에, 상품명에 해당하는 카테고리 및 브랜드에 해당하는 추가 카테고리에 각각 대응되는 데이터가 포함된 경우, 타겟 정보는, 아이템에 연관된 연관 정보와 관련된 키워드 및 아이템의 브랜드와 관련된 키워드를 포함할 수 있다. 즉, 타겟 정보는, 아이템에 연관된 연관 정보와 관련된 키워드 및 아이템의 브랜드와 관련된 키워드를 포함할 확률이 높아질 수 있다.
한편, S410 단계에서, 샘플 데이터 세트의 선택은 제어부(130)의 제어 하에 이루어지거나, 사용자 또는 관리자의 선택에 근거하여 이루어질 수 있다.
예를 들어, 사용자 또는 관리자는, 샘플 데이터 세트에 어느 카테고리가 포함될지 여부를 선택할 수 있다. 도 7에 도시된 것과 같이, 샘플 데이터 세트의 타입(이하, “샘플 데이터 타입”으로 명명함)은, 각각의 샘플 데이터 세트에 포함되는 카테고리의 종류에 따라 복수의 샘플 데이터 타입으로 구분될 수 있다.
예를 들어, 샘플 데이터 타입 A는, 도 6a에서 살펴본 카테고리인 “상품명”, “날짜”, “교정문구” 카테고리 종류로 구성될 수 있으며, 샘플 데이터 타입 B는 도 6b에서 살펴본 카테고리인, “상품명”, “날짜”, “상품 종류”, “브랜드”, “교정문구” 카테고리 종류로 구성될 수 있다.
제어부(130)는, 사용자 또는 관리자에 의해, 복수의 샘플 데이터 타입 중 어느 하나가 선택되면, 도 8에 도시된 것과 같이, 선택된 샘플 데이터 타입에 해당하는 서로 다른 복수의 샘플 데이터 세트를 사용자 또는 관리자에게 제공할 수 있다.
저장부(120)에는 샘플 데이터 타입 별로, 각각 매칭된 서로 다른 다양한 샘플 데이터 세트가 저장되어 존재할 수 있다. 제어부(130)는 제어부의 제어 하에, 사용자 또는 관리자의 선택에 근거하여, 저장부(120)에 저장된 샘플 데이터 세트 중 타겟 정보 생성을 위하여 활용될 복수의 샘플 데이터 세트를 특정할 수 있다.
한편, 본 발명에서는, 도 8에 도시된 것과 같이, 타겟 정보 생성을 위하여 선택가능한 다양한 샘플 데이터 세트 각각에 대한 다양한 정보를 관리할 수 있다.
예를 들어, 제어부(130)는 샘플 데이터 세트 별로, 다양한 지표에 대한 정보를 저장할 수 있다. 이러한 지표는, 샘플 데이터 세트가, 타겟 정보 생성을 위하여 대형 언어 모델(10)의 프롬프트로서 입력되어, 타겟 정보 생성에 활용되었을 때, 해당 타겟 정보를 통해 달성하고자 했던 목표의 달성과 관련된 지표일 수 있다. 예를 들어, 아이템이 상품에 대한 것이고, 타겟 정보를 쇼핑 서비스에 활용하는 경우, 타겟 정보의 목표는 소비자들이 해당 상품에 관심을 갖게 하는 것일 수 있으며, 이는 곧 아이템에 대한 클릭률 내지는 전환율 등으로 평가될 수 있다.
제어부(130)는 타겟 정보가 서비스 분야에 활용되었을 때, 타겟 정보에 대한 모니터링을 수행함으로써, 타겟 정보가 목표를 달성하였는지에 대한 평가를 수행할 수 있다. 그리고, 이러한 평가 결과와 관련된 지표를, 타겟 정보 생성시 프롬프트로서 입력되었던 샘플 데이터 세트의 지표로서 저장할 수 있다.
예를 들어, 도 8에 도시된 것과 같이, 저장부(120)는 각각의 샘플 데이터 세트 마다 클릭률 지표가 매칭되어 존재할 수 있다. 따라서, 사용자 또는 관리자는 이러한 지표에 기반하여, 샘플 데이터 세트를 선택할 수 있다.
나아가, 제어부(130)는 사용자 또는 관리자의 선택이 없더라도, 샘플 데이터 세트에 각각 매칭된 지표에 기반하여, 타겟 정보 생성에 활용될 복수의 샘플 데이터 세트를 선택하거나, 추천할 수 있다.
도 8에 도시된 것과 같이, 제어부(130)는 클릭률이 높은 샘플 데이터 세트를 우선하여, 타겟 정보 생성에 활용될 샘플 데이터로서 선택할 수 있다.
한편, 앞서 언급한 것과 같이, 타겟 정보는, 복수의 샘플 데이터 세트 각각을 구성하는 데이터의 내용에 따라, 서로 다른 내용을 가질 수 있다. 즉, 대형 언어 모델(10)은 프롬프트에 입력된 복수의 샘플 데이터 세트의 내용에 기반하여, 타겟 정보를 생성하므로, 선택된 복수의 샘플 데이터 세트의 내용이 다르면, 서로 다른 타겟 정보가 생성되므로, 본 발명에서는 다양한 기준에 따라, 샘플 데이터 세트를 선택하거나, 추천할 수 있다.
이하에서는, 도 6a에 해당하는 복수의 샘플 데이터 세트(621, 622, 623)가 선택된 것을 예를 들어 살펴본다.
도 6a에 도시된 것과 같이, 복수의 샘플 데이터 세트(621, 622, 623)가 선택되면, 다음으로, 본 발명에서는 복수의 샘플 데이터 세트 및 아이템에 대한 연관 정보를 포함하여, 프롬프트를 구성하는 과정이 진행될 수 있다(S420).
보다 구체적으로, 도 5에 도시된 것과 같이, 프롬프트 구성을 위하여, 샘플 데이터 및 교정 데이터가 한 쌍(pair)으로서 각각 포함된 서로 다른 복수의 샘플 데이터 세트(dataset)를 입력 받는 과정이 진행될 수 있다(S510).
도 6a에 도시된 것과 같이, S410단계에서 선택된 복수의 샘플 데이터 세트(621, 622, 623)는, 도 6a에 도시된 것과 같이, 프롬프트(620)로 입력될 수 있다.
다음으로, 본 발명에서는, 아이템과 연관된 연관 정보를 입력 받는 과정이 진행될 수 있다(S520).
이러한 연관 정보를 입력 받는 과정은, 연관 정보를 포함하는 타겟 데이터 세트가 프롬프트로 입력되는 과정으로 이해되어질 수 있다. 연관 정보는, 사용자의 전자기기로부터 입력받을 수 있다.
도 6a에 도시된 것과 같이, 타겟 데이터 세트(624)는 타겟 정보 생성의 대상이 되는 아이템에 대한 데이터를 포함할 수 있다.
타겟 데이터 세트(624)에는, 타겟 정보 생성에 이용 가능한 적어도 하나의 카테고리에 각각 대응되는 데이터(624a, 624b)가 포함될 수 있다. 나아가, 타겟 데이터 세트(624)에는 타겟 정보에 해당하는 데이터 필드(624c)가 더 포함될 수 있다.
본 발명에 따른 타겟 정보 생성 시스템(100)과 대형 언어 모델(10)은 사전에 정의된 규칙에 의하여, 타겟 정보에 해당하는 데이터 필드(예를 들어, “교정문구: “)가 프롬프트(620)에 포함된 경우, 타겟 정보를 생성하라는 명령으로 인식할 수 있다.
나아가, 대형 언어 모델(10)은 타겟 데이터 세트(624)에 포함된 데이터(624a, 624b) 중 적어도 일부를 이용하여, 타겟 정보를 생성할 수 있다.
한편, 타겟 데이터 세트에 포함되는 데이터의 카테고리는, S410단계에서 선택된 샘플 데이터 세트에 포함된 데이터의 카테고리와 동일(또는 대응)하게 이루어질 수 있다. 나아가, 타겟 데이터 세트 및 샘플 데이터 세트에 포함된 데이터의 카테고리는 적어도 하나가 상이할 수 있음은 물론이다. 더 나아가, 타겟 데이터 세트 및 샘플 데이터 세트에 포함된 데이터의 카테고리는 모두 상이하게 이루어지는 것 또한 가능하다.
타겟 데이터 세트 및 샘플 데이터 세트에 포함된 데이터의 포함되는 데이터의 카테고리가 서로 동일(대응)하게 이루어진 경우를 예를 들어 살펴본다.
예를 들어, 도 6a에 도시된 것과 같이, 샘플 데이터 세트(621, 622, 623)에, “상품명”, “날짜” 카테고리에 해당하는 데이터가 포함된 경우, 타겟 데이터 세트(624)에도 “상품명”, “날짜” 카테고리에 해당하는 데이터(624b)가 포함될 수 있다.
또 다른 예를 들어, 도 6b에 도시된 것과 같이, 샘플 데이터 세트(641, 642, 643)에 “상품명”, “날짜”, “상품 종류”, “브랜드” 카테고리에 각각 해당하는 데이터가 포함된 경우, 타겟 데이터 세트(644)에도 “상품명”, “날짜”, “상품 종류”, “브랜드” 카테고리에 해당하는 데이터(644b)가 포함될 수 있다.
또 다른 예를 들어, 도 6c에 도시된 것과 같이, 샘플 데이터 세트(661, 662, 663)에, “상품명”, “날짜”, “상품 종류”, “브랜드”, “태그” 카테고리에 각각 해당하는 데이터가 포함된 경우, 타겟 데이터 세트(664)에도 “상품명”, “날짜”, “상품 종류”, “브랜드”, “태그” 카테고리에 해당하는 데이터(664b)가 포함될 수 있다.
S510 단계 및 S520 과정과 같이, 복수의 샘플 데이터 세트 및 샘플 데이터 세트가 입력되면, 타겟 정보를 생성하는 과정이 진행될 수 있다.
보다 구체적으로, 복수의 샘플 데이터 세트 및 연관 정보가 입력되면, 복수의 샘플 데이터 세트 및 상기 연관 정보를 이용하여, 상기 연관 정보와 관련된 적어도 하나의 키워드를 포함하는 상기 타겟 정보를 생성하는 과정이 진행될 수 있다(S530).
S530 과정은, 도 4에 도시된 S430 과정과 대응되며, 제어부(130)는 타겟 정보의 생성을 위하여, 구성된 프롬프트를 대형 언어 모델(10)의 입력으로서 처리할 수 있다.
본 발명에서 타겟 정보는 대형 언어 모델(10)의 출력으로서 생성될 수 있다.
대형 언어 모델(10)의 출력으로서 생성된 타겟 정보는, 앞서 살펴본 것과 같이 사용자의 전자기기에 전송될 수 있다. 따라서, 사용자의 전자기기의 디스플레이부에는 타겟 정보가 출력(표시)될 수 있다.
제어부(130)는 대형 언어 모델(10)과 연동하여, 또는 대형 언어 모델(10)에 대한 제어를 수행하여 타겟 정보가 출력되도록 할 수 있다.
도 9a, 도 9b 및 도 9c에 도시된 것과 같이 프롬프트(810, 820, 830)를 통하여, 타겟 정보(811b, 821b, 831b)가 출력될 수 있다. 대형 언어 모델(10)의 출력은 도시와 같이 프롬프트(810, 820, 830)를 통해 획득될 수 있다.
한편, 본 발명에서 타겟 정보에는 연관 정보와 관련된 적어도 하나의 키워드가 포함되며, 상기 키워드는, 연관 정보에 포함되나 복수의 단어 중 적어도 일부와 동일 또는 유사한 의미를 갖는 단어로 이해되어질 수 있다.
대형 언어 모델(10)에서는, 타겟 데이터 세트에 포함된 연관 정보를 기반으로, 타겟 정보가 생성되므로, 연관 정보와 동일 또는 유사한 내용이 타겟 정보에 포함되도록 타겟 정보를 생성할 수 있다. 이러한 타겟 정보는, 연관 정보가 수정 또는 교정되었다고 개념상 이해되어질 수 있다.
예를 들어, 도 6a에 도시된 것과 같이, 연관 정보(624a)로서 “프릴스 아쿠아 이지클린 패브릭 원단 패밀리 침대”가 프롬프트 상에 입력된 경우, 도 9a에 도시된 것과 같이, “패밀리 침대용 패브릭 시트”에 해당하는 타겟 정보(811b)가 생성될 수 있다. 타겟 정보(811b)는 “패밀리”, “침대”, “패브릭”과 같이, 연관 정보(624a)의 적어도 일부와 동일 또는 유사한 내용이 포함되도록 이루어질 수 있다.
이와 같이, 제어부(130)는 복수의 샘플 데이터 세트 및 타겟 데이터 세트에 기반하여, 타겟 정보가 생성되도록 대형 언어 모델(10)에 대한 적절한 제어를 수행할 수 있다.
한편, 제어부(130)는 복수의 샘플 데이터 세트 및 타겟 데이터 세트에 기반하여 생성되는 타겟 정보에, 타겟 정보에 특정 테마와 관련된 키워드(이하, “서브 키워드”라 명명함)가 포함되도록 할 수 있다.
예를 들어, 제어부(130)는 도 10에 도시된 것과 같이, 타겟 정보(1024a)에 “계절”과 관련된 테마가 포함되도록 하거나, 도 11에 도시된 것과 같이, 타겟 정보(1124a)에 “할인”과 관련된 테마가 포함되도록 할 수 있다.
이를 위하여, 제어부(130)는 특정 테마와 관련된 타겟 정보를 생성하기 위하여, 상기 특정 테마에 해당하는 키워드들이 포함된 샘플 데이터 세트를 선택(또는 생성)할 수 있다.
예를 들어, 도 10에 도시된 것과 같이, “계절”을 테마로 타겟 정보를 생성하고자 하는 경우, 샘플 데이터 세트(1021, 1022, 1023)의 각 샘플 데이터에 대한 타겟 정보(“교정문구” 카테고리)에는 “여름”, “썸머”, “봄”과 같이, “계절”을 테마로 하는 키워드들이 다수 포함될 수 있다.
다른 예를 들어, 도 11에 도시된 것과 같이, “할인”을 테마로 타겟 정보를 생성하고자 하는 경우, 샘플 데이터 세트(1121, 1122, 1123)의 각 샘플 데이터에 대한 타겟 정보(“교정문구” 카테고리에는 “세일”, “할인”과 같이, “할인”을 테마로 하는 키워드들이 다수 포함될 수 있다.이러한 특정 테마는, 다양한 방법으로 특정될 수 있으며, 예를 들어, 아이템이 속한 서비스 분야에서의 다양한 통계자료, 최근 사회이슈, 최근 뉴스 또는 사용자 선택 등 다양한 방법에 근거하여 특정될 수 있다.
사용자 선택에 근거하여 특정 테마가 특정되는 방법에 대하여 살펴보면, 본 발명에서는, 타겟 정보에 포함시키고자 하는 서브 키워드와 관련된 테마를 선택과정이 수행될 수 있다. 테마를 선택받는 시점은, S410 내지 S430 과정 중 적어도 하나의 과정에서 선택되거나, 수정될 수 있으며, 특별한 한정을 두지 않는다.
나아가, 테마의 선택은, 타겟 정보가 생성된 이후라도, 선택되는 것 또한 가능하다. 이 경우, 제어부(130)는 생성된 타겟 정보에, 선택된 테마에 해당하는 서브 키워드가 포함되었는지를 판단하고, 판단 결과, 서브 키워드가 포함되지 않은 경우, 타겟 정보에 대한 재생성을 수행할 수 있다.
한편, 선택된 테마에 근거하여 타겟 정보가 생성되는 경우, 본 발명에서는 타겟 정보에 선택된 테마와 관련된 서브 키워드가 포함될 확률이 높아질 수 있다.
예를 들어, 도 10에 도시된 것과 같이, “계절”에 대한 테마가 선택된 경우, 타겟 정보에는 계절(예를 들어, “여름”)에 대한 서브 키워드(예를 들어, “여름”, “아쿠아”)가 타겟 정보(1024a)에 포함될 수 있다.
또 다른 예를 들어, 도 11에 도시된 것과 같이, “할인”에 대한 테마가 선택된 경우, 타겟 정보에는 할인에 대한 서브 키워드(예를 들어, “할인”)가 타겟 정보(1124a)에 포함될 수 있다.
한편, 테마의 선택이, S410 또는 S410 단계와 같이, 샘플 데이터 세트를 선택하거나, 샘플 데이터 세트를 프롬프트에 입력하는 과정에서 수행된 경우, 제어부(130)는 프롬프트에 입력되는 샘플 데이터 세트(dataset) 각각에, 선택된 테마와 관련된 단어가 포함되도록 할 수 있다.
이 경우, 제어부(130)는 샘플 데이터 세트 각각에, 선택된 테마와 관련된 내용을 포함한 데이터 및 선택된 테마와 관련된 내용을 포함한 데이터와 한 쌍을 이루는 교정문구에 해당하는 데이터에, 선택된 테마와 관련된 단어가 포함되도록, 샘플 데이터 세트를 선택하거나, 입력할 수 있다.
한편, 대형 언어 모델(10)는 샘플 데이터 세트에 포함된 데이터와 이에 대응되는 교정문구 간의 패턴(또는 규칙)에 근거하여, 타겟 정보를 생성하나, 이러한 패턴(또는 규칙)은 정형화되지 않을 수 있으므로, 본 발명에서는 이에 대한 특별한 한정을 두지 않는다.
다음으로, 위에서 살펴본 것과 같이 타겟 정보가 생성되면, 다음으로 본 발명에서는 타겟 정보에 대한 검증을 수행하는 과정이 진행될 수 있다(S440).
제어부(130)는 대형 언어 모델을 통해 타겟 정보가 생성되는 것에 근거하여, 타겟 정보가 기 설정된 검증 기준을 만족하는지 판단할 수 있다.
여기에서, 기 설정된 검증 기준은, 다양하게 설정될 수 있다 예를 들어, 기 설정된 검증 기준은 타겟 정보에 포함된 텍스트의 길이 및 타겟 정보에 기 설정된 금지어가 포함되었는지 여부 중 적어도 하나와 관련될 수 있다.
예를 들어, 모바일 화면이나 정해진 길이의 화면에 표시하기 위한 텍스트를 생성하기 위해서, 기 설정된 검증 기준으로서, 타겟 정보를 구성하는 텍스트는 기 설정된 수(예를 들어, 20글자)를 초과하는지 여부를 판단하도록 설정될 수 있다.
제어부(130)는 타겟 정보가 생성된 경우, 생성된 타겟 정보가 기 설정된 수의 글자를 초과하는지 여부를 판단할 수 있다.
판단 결과, 생성된 타겟 정보가 기 설정된 수의 글자를 초과하는 경우, 제어부(130)는 생성된 타겟 정보가 기 설정된 검증 기준을 만족하지 못하였다고 판단할 수 있다. 기 설정된 수의 글자가 20글자이고, 타겟 정보에 포함된 텍스트가 22글자를 포함하는 경우, 제어부(130)는 타겟 정보가 기 설정된 검증 기준을 만족하지 못하였다고 판단할 수 있다.
또 예를 들어, 기 설정된 검증 기준으로서, 타겟 정보를 구성하는 텍스트에 기 설정된 금지어가 포함되었는지 여부를 판단하도록 설정될 수 있다. 판단 결과, 생성된 타겟 정보에 기 설정된 금지어가 포함된 경우, 제어부(130)는 생성된 타겟 정보가 기 설정된 검증 기준을 만족하지 못하였다고 판단할 수 있다. 기 설정된 금지어의 설정은, 제어부(130)의 제어 하에, 사용자 또는 관리자의 요청 하에 이루어질 수 있다. 기 설정된 금지어는 아이템이 속한 거래업계의 공정 거래를 해치는 용어, 비속어 등에 해당할 수 있다.
이와 같이, 판단 결과, 타겟 정보가 기 설정된 검증 기준을 만족하지 못한 경우, 제어부(130)는 아이템과 관련된 타겟 정보를 재생성 하는 과정을 수행할 수 있다.
즉, 제어부(130)는 기 생성된 타겟 정보와 다른 타겟 정보가 생성되도록 대형 언어 모델(10)에 대한 적절한 제어를 수행할 수 있다. 제어부(130)는 대형 언어 모델(10)에 대해, 타겟 정보의 재생성을 요청하는 신호를 전송할 수 있다.
한편, 제어부(130)는 기 생성된 타겟 정보와 다른 타겟 정보가 생성되도록, 대형 언어 모델(10)의 적어도 하나의 인퍼런스 파라미터(inference parameter)를 조정할 수 있다.
이러한 인퍼런스 파라미터는, 대형 언어 모델(10)의 출력값이 변경되도록 하는 인자로서, 대형 언어 모델(10)에서 처리되는 토큰과 관련된 확률값을 조정하는 인자로 이해되어질 수 있다.
대형 언어 모델(10)은 확률에 기반하여 타겟 정보를 생성하는 모델로 이루어질 수 있으며, 대형 언어 모델(10)에서의 인퍼런스 파라미터 조정은 타겟 정보로서 선택되는 토큰에 대한 확률의 조정으로 이해할 수 있다. 따라서, 인퍼런스 파라미터의 조정으로 인하여, 타겟 정보 재생성시 기 생성되었던 타겟 정보에 포함된 토큰과 서로 다른 토큰이 포함될 확률이 높아질 수 있다.
대형 언어 모델(10)과 관련된 인퍼런스 파라미터는 다양할 수 있으며, 일 예로서, 제1 인퍼런스 파라미터(예를 들어, Top P 샘플링)는 토큰에 대한 누적 확률 값과 관련된 것일 수 있다. 대형 언어 모델(10)에서는 제1 인퍼런스 파라미터로서 기 설정된 확률값에 근거하여, 기 설정된 확률값에 해당하는 토큰에 대해서만 타겟 정보로서 포함될 수 있는 토큰의 후보로서 선택할 수 있다. 예를 들어, 제1 인퍼런스 파라미터 값이 0.8로 기 설정된 경우, 대형 언어 모델(10)은 상위 80%에 포함된 토큰에 대해서만, 타겟 정보로서 포함될 수 있는 토큰의 후보로서 선택할 수 있다.
따라서, 제어부(130)는 제1 인퍼런스 파라미터를 조정함으로써, 타겟 정보로서 포함될 수 있는 토큰의 범위를 변경할 수 있으며, 그 결과, 타겟 정보 재생성시 기 생성되었던 타겟 정보와 다른 타겟 정보가 생성되도록 유도할 수 있다.
다른 예로서, 제1 인퍼런스 파라미터와 다른 제2 인퍼런스 파라미터(예를 들어, Temperature)는 확률 분포에 가중치 변화를 주어 타겟 정보로서 생성되는 문장의 다양성을 조절하는 값과 관련될 것일 수 있다. 예를 들어, 제2 인퍼런스 파라미터 값이 낮게 설정되면, 타겟 정보로서 포함될 수 있는 토큰들(또는 “후보 토큰”이라 명명될 수 있음)의 순위는 변경되지 않으나, 타겟 정보로서 포함될 높았던 토큰은 확률값이 더욱 높아지고, 타겟 정보로서 포함될 확률이 낮았던 토큰은 확률값이 더욱 낮아질 수 있다. 제2 인퍼런스 파라미터의 값이 높아질수록 타겟 정보로서 포함될 가능성이 가장 높은 순위의 토큰이 선택될 확률이 높아질 수 있다.
제어부(130)는 위에서 살펴본 제1 인퍼런스 파라미터 및 제2 인퍼런스 파라미터 중 적어도 하나 또는 대형 언어 모델(10)과 관련된 다양한 인퍼런스 파라미터를 변경함으로써, 타겟 정보로서 포함될 수 있는 토큰과 관련된 확률을 조정할 수 있다. 이를 통해, 본 발명에서는, 타겟 정보 재생성시 기 생성되었던 타겟 정보와 동일한 타겟 정보가 생성되는 것을 피할 수 있다.
한편, 제어부(130)는 타겟 정보가 재생성되는 경우, 재생성된 타겟 정보에 대해서 앞서 살펴본 S440단계를 동일하게 수행할 수 있다. 즉, 제어부(130)는 재생성된 타겟 정보가 기 설정된 검증 조건을 만족하는지 판단을 수행할 수 있으며, 재생성된 타겟 정보가 기 설정된 검증 조건을 만족하지 못한 경우, 타겟 정보에 대한 재생성을 다시 수행할 수 있다.
이때, 제어부(130)는 타겟 정보의 재생성을 기 설정된 횟수만큼 수행할 수 있으며, 기 설정된 횟수 만큼 타겟 정보 재생성 결과에도 불구하고, 재생성된 타겟 정보가 기 설정된 검증 조건을 만족하지 못한 경우, S410 단계에서 선택된 복수의 샘플 데이터 세트에 근거한 타겟 정보의 재생성을 수행하지 않을 수 있다.
예를 들어, 기 설정된 타겟 횟수가 3회인 경우, 제어부(130)는 타겟 정보의 재생성 횟수가 3회가 될 때까지, 대형 언어 모델(10)의 인퍼런스 파라미터를 조정하며 타겟 정보의 재생성을 수행할 수 있다. 이때, 재생성 횟수가 3회 되기 전이라도, 재생성된 타겟 정보가 기 설정된 검증 조건을 만족하는 경우, 타겟 정보의 재생성은 더 이상 이루어지지 않을 수 있다.
나아가, 제어부(130)는 기 설정된 횟수만큼 타겟 정보 재생성 결과에도 불구하고, 재생성된 타겟 정보가 기 설정된 검증 조건을 만족하지 못한 경우, S410단계에서 선택된 복수의 샘플 데이터 중 적어도 하나를 변경하여, 타겟 정보의 생성 과정을 다시 수행할 수 있다.
그리고, 제어부(130)는 상기 관련성 정도가 기 설정된 기준을 만족하는 경우, 상기 타겟 정보를 상기 아이템에 대한 타겟 정보로서 이용할 수 있다. 그리고, 상기 관련성 정도가 상기 기 설정된 기준을 만족하지 못한 경우, 상기 타겟 정보는 재생성 될 수 있다.
제어부(130)는 다양한 서비스 분야에 타겟 정보를 이용(또는 활용)할 수 있으며, 예를 들어, 쇼핑 서비스 분야에 타겟 정보가 활용하는 경우, 타겟 정보를, 쇼핑 서비스의 웹페이지 또는 애플리케이션의 페이지 상에 노출되도록 처리될 수 있다.
한편, 타겟 정보와 아이템 관의 관련성 정도가 기 설정된 기준을 만족하는지 여부는, 아이템의 연관 정보와 타겟 정보 간의 벡터 기반의 유사도 정도에 근거하여 판단될 수 있다. 이때, 벡터 기반의 유사도를 판단하는 방법은 매우 다양하며, 본 발명에서는 이에 대한 특별한 한정을 두지 않는다. 이때, 유사도 정도는, 타겟 정보가 아이템에 연관된 연관 정보의 내용을 잘 반영하는지 여부에 대한 것일 수 있다.
한편, 제어부(130)는 유사도 정도가 기 설정된 기준을 만족하지 못하는 경우, 앞서 살펴본 방식으로 타겟 정보에 대한 재생성을 수행할 수 있다. 그리고, 제어부(130)는 유사도 정도가 기 설정된 기준을 만족하는 경우, 타겟 정보를 최종적으로 아이템에 대한 타겟 정보로서 선택할 수 있다.
나아가, 타겟 정보와 아이템 간의 관련성 정도가 기 설정된 기준을 만족하는지 여부는, 아이템에 연관된 이미지와 타겟 정보 간의 유사도 정도에 근거하여 판단될 수 있다. 아이템에 연관된 이미지는 저장부(120) 또는 적어도 하나의 외부 서버에 아이템과 관련한여 저장 또는 등록된 이미지일 수 있다. 예를 들어, 아이템이 쇼핑 아이템(예를 들어, “신발”)인 경우, 제어부(130)는 아이템과 관련된 이미지(예를 들어, 쇼핑 아이템에 해당하는 “신발 사진”)와 타겟 정보 간의 유사도를 판단하여, 아이템과 관련된 이미지와 타겟 정보 간의 유사도 정도를 판단할 수 있다. 그리고, 제어부(130)는 유사도 정도가 기 설정된 기준을 만족하는 경우, 타겟 정보를 최종적으로 아이템에 대한 타겟 정보로서 선택할 수 있다. 이때, 유사도 정도는, 타겟 정보가 아이템과 관련된 이미지에 해당하는 내용을 잘 반영하는지 여부에 대한 것을 수 있다.
한편, 제어부(130)는 앞서 살펴본 S410 과정 및 S440 과정을 복수번 수행하여, 서로 다른 타겟 정보를 각각 생성할 수 있다.
이때, 본 발명에서는, 기 설정된 검증 조건을 만족한 타겟 정보 중 특정 타겟 정보를 선택하는 과정이 수행될 수 있다(S450, 도 4 참조). 즉, 제어부(130)는 검증을 통과한 타겟 정보 중 특정 타겟 정보를 최종적으로 선택할 수 있다.
제어부(130)는 선택되는 샘플 데이터 세트를 달리하여, 서로 다른 타겟 정보를 생성할 수 있다. 예를 들어, 도 6a, 도 6b 및 도 6c에 도시된 것과 같이, 제어부(130)는 서로 다른 샘플 데이터 세트가 포함된 프롬프트(620, 640, 660)를 통하여, 도 9a, 도 9b 및 도 9c에 도시된 것과 같이, 서로 다른 타겟 정보(811b, 821b, 831b)를 각각 생성할 수 있다. 이때, 서로 다른 타겟 정보 생성을 위하여, 선택되는 서로 다른 샘플 데이터 세트는, 도 6a, 도 6b 및 도 6c에 도시된 것과 같이, 적어도 하나의 카테고리에 해당하는 데이터(예를 들어, 상품명 카테고리에 해당하는 데이터)는 동일할 수 있다.
이와 달리, 서로 다른 타겟 정보 생성을 위하여 선택되는 서로 다른 샘플 데이터 세트는, 샘플 데이터 세트를 구성하는 데이터의 내용이 모두 상이한 것도 가능하다.
이와 같이, S410 과정 및 S440 과정을 복수번 수행하여, 서로 다른 복수의 타겟 정보(예를 들어, 도 9의 811b, 821b, 831b)가 존재하는 경우, 제어부(130)는 복수의 타겟 정보 중 어느 하나를 최종적으로 선택할 수 있다. 최종적으로 선택되는 타겟 정보는, 앞서 살펴본 타겟 정보가 활용되는 서비스 분야에 활용될 수 있다. 예를 들어, 쇼핑 서비스 분야에 타겟 정보가 활용되는 경우, 최종적으로 선택된 타겟 정보는, 웹페이지 또는 애플리케이션의 페이지 상에 노출되도록 처리될 수 있다.
한편, 타겟 정보의 최종적인 선택을 위하여, 제어부(130)는 복수의 타겟 정보 각각이, 앞서 살펴본 기 설정된 검증 기준을 만족한 경우, 복수의 타겟 정보 각각과 아이템 간의 관련성 정도를 판단하는 과정을 수행할 수 있다.
예를 들어, 제어부(130)는 상기 기 설정된 검증 기준을 만족한 타겟 정보가 복수개 존재하는 경우, 복수개의 타겟 정보 각각과 아이템에 연관된 연관 정보 간의 유사도를 판단할 수 있다.
그리고, 제어부(130)는 상기 복수개의 타겟 정보 중 상기 연관 정보와의 유사도가 가장 높은 어느 하나의 타겟 정보를, 아이템에 대한 최종 타겟 정보로서 결정할 수 있다. 이때, 타겟 정보와 연관 정보 간의 유사도를 판단하는 설명은 앞선 설명으로 대체하도록 한다.
나아가, 제어부(130)는 상기 관련성 정도의 판단은, 상기 복수개의 타겟 정보 각각과 아이템과 관련된 이미지 간의 유사도 정도를 판단하여, 유사도가 가장 높은 특정 타겟 정보를 아이템에 대한 최종 타겟 정보로서 결정할 수 있다.
위에서 살펴본 것과 같이, 본 발명에 따른 타겟 정보 생성 방법 및 시스템은, 샘플 데이터 세트 및 아이템에 대한 연관 정보가 포함된 프롬프트를 입력으로 하는 언어모델을 이용하여, 아이템에 대한 타겟 정보를 생성할 수 있다. 이때, 본 발명에 따른 타겟 정보 생성 방법 및 시스템에서는, 샘플 데이터 및 상기 샘플 데이터에 대응되는 교정 데이터가 한 쌍으로서 포함되도록 샘플 데이터 세트를 구성함으로써, 언어 모델이, 프롬프트에 기반하여, 교정 데이터에 상응하는 품질의 타겟 정보를 생성하도록 유도할 수 있다.
따라서, 본 발명에 따른 타겟 정보 생성 방법 및 시스템에 의하여, 아이템에 연관된 연관 정보를 기반으로, 교정 데이터에 상응하는 품질의 타겟 정보를 생성할 수 있다. 결과적으로 사용자는, 연관 정보를 타겟 정보로 교정 또는 수정하기 위한 작업을 줄일 수 있어, 업무 효율을 극대화할 수 있다.
한편, 위에서 살펴본 본 발명은, 컴퓨터에서 하나 이상의 프로세스에 의하여 실행되며, 이러한 컴퓨터로 판독될 수 있는 매체(또는 기록 매체)에 저장 가능한 프로그램으로서 구현될 수 있다.
나아가, 위에서 살펴본 본 발명은, 프로그램이 기록된 매체에 컴퓨터가 읽을 수 있는 코드 또는 명령어로서 구현하는 것이 가능하다. 즉, 본 발명은 프로그램의 형태로 제공될 수 있다.
한편, 컴퓨터가 읽을 수 있는 매체는, 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 매체의 예로는, HDD(Hard Disk Drive), SSD(Solid State Disk), SDD(Silicon Disk Drive), ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광 데이터 저장 장치 등이 있다.
나아가, 컴퓨터가 읽을 수 있는 매체는, 저장소를 포함하며 전자기기가 통신을 통하여 접근할 수 있는 서버 또는 클라우드 저장소일 수 있다. 이 경우, 컴퓨터는 유선 또는 무선 통신을 통하여, 서버 또는 클라우드 저장소로부터 본 발명에 따른 프로그램을 다운로드 받을 수 있다.
나아가, 본 발명에서는 위에서 설명한 컴퓨터는 프로세서, 즉 CPU(Central Processing Unit, 중앙처리장치)가 탑재된 전자기기로서, 그 종류에 대하여 특별한 한정을 두지 않는다.
한편, 상기의 상세한 설명은 모든 면에서 제한적으로 해석되어서는 아니되고 예시적인 것으로 고려되어야 한다. 본 발명의 범위는 첨부된 청구항의 합리적 해석에 의해 결정되어야 하고, 본 발명의 등가적 범위 내에서의 모든 변경은 본 발명의 범위에 포함된다.

Claims (15)

  1. 아이템에 대한 타겟 정보를 생성하는 방법에 있어서,
    타겟 정보 생성 시스템에서, 샘플 데이터 및 상기 샘플 데이터에 대응되는 타겟 데이터가 포함된 서로 다른 복수의 샘플 데이터 세트(dataset)를 선정하는 단계;
    상기 타겟 정보 생성 시스템에서, 상기 아이템에 연관된 연관 정보를 입력 받는 단계;
    상기 타겟 정보 생성 시스템에서, 상기 복수의 샘플 데이터 세트 및 상기 연관 정보를 포함하는 프롬프트를 구성하는 단계;
    상기 타겟 정보 생성 시스템에서, 상기 프롬프트를 기 특정된 대형 언어 모델의 입력으로서 처리하는 단계; 및
    상기 복수의 샘플 데이터 세트 및 상기 연관 정보를 상기 프롬프트를 통해 입력받은 상기 대형 언어 모델을 이용하여, 상기 타겟 정보 생성 시스템에서, 상기 연관 정보와 관련된 적어도 하나의 키워드를 포함하는 상기 아이템에 대한 타겟 정보를 생성하는 단계를 포함하고,
    상기 타겟 정보를 생성하는 단계에서는,
    상기 복수의 샘플 데이터 세트를 참조하여, 상기 연관 정보를 수정 또는 교정하여 상기 타겟 정보를 생성하는 것을 특징으로 하는 타겟 정보 생성 방법.
  2. 제1항에 있어서,
    상기 프롬프트에는,
    상기 대형 언어 모델이 상기 연관 정보를 이용하여 상기 타겟 정보를 생성하라는 명령으로 인식하도록 상기 타겟 정보에 대응되는 데이터 필드가 포함되고,
    상기 타겟 정보는,
    상기 대형 언어 모델의 출력으로서 생성되는 것을 특징으로 하는 타겟 정보 생성 방법.
  3. 제2항에 있어서,
    상기 아이템이 상품(商品)에 해당하는 경우,
    상기 적어도 하나의 카테고리는, 상품명, 상품 종류, 브랜드(brand), 날짜, 후기(後記), 태그(tag), 색상, 사이즈(size) 및 원산지 중 적어도 하나에 해당하는 것을 특징으로 하는 타겟 정보 생성 방법.
  4. 제3항에 있어서,
    상기 서로 다른 복수의 샘플 데이터 세트 각각에,
    상품명에 해당하는 카테고리 및 후기에 해당하는 카테고리에 각각 대응되는 데이터가 포함된 경우,
    상기 타겟 정보는,
    상기 연관 정보와 관련된 키워드 및 상기 아이템의 후기와 관련된 키워드를 포함하고,
    상기 서로 다른 복수의 샘플 데이터 세트 각각에,
    상품명에 해당하는 카테고리 및 브랜드에 해당하는 카테고리에 각각 대응되는 데이터가 포함된 경우,
    상기 타겟 정보는,
    상기 연관 정보와 관련된 키워드 및 상기 아이템의 브랜드와 관련된 키워드를 포함하는 것을 특징으로 하는 타겟 정보 생성 방법.
  5. 제2항에 있어서,
    상기 대형 언어 모델을 통해 상기 타겟 정보가 생성되는 것에 근거하여, 상기 타겟 정보 생성 시스템에서, 상기 타겟 정보가 기 설정된 검증 기준을 만족하는지 판단하는 단계를 더 포함하고,
    상기 기 설정된 검증 기준은,
    상기 타겟 정보에 포함된 텍스트의 길이, 기 설정된 금지어 포함여부 및 상기 타겟 정보와 상기 아이템 간의 관련성 정도 중 적어도 하나와 관련된 것을 특징으로 하는 타겟 정보 생성 방법.
  6. 제5항에 있어서,
    상기 판단 결과, 상기 타겟 정보가 상기 기 설정된 검증 기준을 만족하지 못한 경우, 상기 타겟 정보 생성 시스템에서, 상기 아이템과 관련된 타겟 정보를 재생성 하는 단계를 더 포함하는 것을 특징으로 하는 타겟 정보 생성 방법.
  7. 제6항에 있어서,
    상기 재생성 하는 단계에서는,
    상기 타겟 정보 생성 시스템에서, 기 생성된 타겟 정보와 다른 타겟 정보가 생성되도록, 상기 대형 언어 모델의 적어도 하나의 인퍼런스 파라미터를 조정하는 것을 특징으로 하는 타겟 정보 생성 방법.
  8. 제5항에 있어서,
    상기 기 설정된 검증 기준을 만족한 타겟 정보가 복수개 존재하는 경우, 복수개의 타겟 정보 각각과 상기 아이템 간의 유사도가 판단되고,
    상기 복수개의 타겟 정보 중 상기 아이템 간의 유사도가 가장 높은 어느 하나의 타겟 정보가, 상기 아이템에 대한 최종 타겟 정보로서 결정되는 것을 특징으로 하는 타겟 정보 생성 방법.
  9. 제8항에 있어서,
    상기 유사도의 판단은,
    상기 타겟 정보 및 상기 연관 정보 간의 유사도 및 상기 아이템에 대해 기 등록된 이미지와 상기 타겟 정보 간의 유사도 정도 중 적어도 하나에 근거하여 판단되는 것을 특징으로 하는 타겟 정보 생성 방법.
  10. 제1항에 있어서,
    상기 타겟 정보 생성 시스템에서, 상기 타겟 정보에 포함시키고자 하는 서브 키워드와 관련된 테마를 선택받는 단계를 더 포함하고,
    타겟 정보에 상기 테마가 선택되는 것에 근거하여, 상기 타겟 정보에 상기 테마와 관련된 서브 키워드가 포함될 확률이 높아지는 것을 특징으로 하는 타겟 정보 생성 방법.
  11. 제10항에 있어서,
    상기 테마가 선택되는 것에 근거하여, 상기 서로 다른 복수의 샘플 데이터 세트(dataset) 각각은, 상기 테마와 관련된 단어가 포함되도록 구성되는 것을 특징으로 하는 타겟 정보 생성 방법.
  12. 아이템에 대한 타겟 정보를 생성하는 시스템에 있어서,
    상기 시스템은,
    샘플 데이터 및 상기 샘플 데이터에 대응되는 타겟 데이터가 포함된 서로 다른 복수의 샘플 데이터 세트(dataset)를 저장하는 저장부; 및
    상기 복수의 샘플 데이터 세트 및 연관 정보를 포함하는 프롬프트를 구성하고, 상기 프롬프트를 기 특정된 대형 언어 모델의 입력으로서 처리하는 제어부를 포함하고,
    상기 제어부는,
    상기 복수의 샘플 데이터 세트 및 상기 연관 정보를 상기 프롬프트를 통해 입력받은 상기 대형 언어 모델을 이용하여, 상기 연관 정보와 관련된 적어도 하나의 키워드를 포함하는 상기 아이템에 대한 타겟 정보를 생성하며,
    상기 대형 언어 모델은,
    상기 복수의 샘플 데이터 세트를 참조하여, 상기 연관 정보를 수정 또는 교정하여 상기 타겟 정보를 생성하는 것을 특징으로 하는 타겟 정보 생성 시스템.
  13. 전자기기에서 하나 이상의 프로세스에 의하여 실행되며, 컴퓨터로 판독될 수 있는 기록매체에 저장된 프로그램으로서,
    상기 프로그램은,
    샘플 데이터 및 상기 샘플 데이터에 대응되는 타겟 데이터가 포함된 서로 다른 복수의 샘플 데이터 세트(dataset)를 선정 받는 단계;
    아이템에 연관된 연관 정보를 입력 받는 단계;
    상기 복수의 샘플 데이터 세트 및 상기 연관 정보를 포함하는 프롬프트를 구성하는 단계;
    상기 프롬프트를 기 특정된 대형 언어 모델의 입력으로서 처리하는 단계; 및
    상기 복수의 샘플 데이터 세트 및 상기 연관 정보를 상기 프롬프트를 통해 입력받은 상기 대형 언어 모델을 이용하여, 상기 연관 정보와 관련된 적어도 하나의 키워드를 포함하는 상기 아이템에 대한 타겟 정보를 생성하는 단계를 수행하도록 하는 명령어들을 포함하고,
    상기 타겟 정보를 생성하는 단계에서는,
    상기 복수의 샘플 데이터 세트를 참조하여, 상기 연관 정보를 수정 또는 교정하여 상기 타겟 정보를 생성하는 것을 특징으로 하는 컴퓨터로 판독될 수 있는 기록매체에 저장된 프로그램.
  14. 아이템에 대한 타겟 정보를 생성하는 시스템에 있어서,
    상기 시스템은,
    복수의 샘플 데이터 세트를 저장하는 저장부;
    사용자의 전자기기와 통신하는 통신부; 및
    상기 통신부를 통해 상기 사용자의 전자기기로부터 적어도 하나의 카테고리에 각각 대응되는 연관 정보를 입력 받고,
    상기 복수의 샘플 데이터 세트 및 상기 연관 정보를 포함하는 프롬프트를 구성하고, 상기 프롬프트를 기 특정된 대형 언어 모델의 입력으로서 처리하는 제어부를 포함하고,
    상기 제어부는,
    상기 복수의 샘플 데이터 세트 및 상기 연관 정보를 상기 프롬프트를 통해 입력받은 상기 대형 언어 모델을 이용하여, 상기 연관 정보와 관련된 적어도 하나의 키워드를 포함하는 상기 아이템에 대한 타겟 정보를 생성하고, 상기 타겟 정보가 상기 사용자의 전자기기에 출력되도록 상기 통신부를 통해 상기 타겟 정보를 상기 사용자의 전자기기로 전송하고,
    상기 대형 언어 모델은,
    상기 복수의 샘플 데이터 세트를 참조하여, 상기 연관 정보를 수정 또는 교정하여 상기 타겟 정보를 생성하는 것을 특징으로 하는 타겟 정보 생성 시스템.
  15. 타겟 정보 생성 시스템에서, 사용자의 전자기기로부터, 특정 아이템과 관련된 적어도 하나의 카테고리에 각각 대응되는 연관 정보를 수신하는 단계;
    상기 타겟 정보 생성 시스템에서, 복수의 샘플 데이터 세트를 선택하는 단계;
    상기 타겟 정보 생성 시스템에서, 샘플 데이터 및 상기 샘플 데이터에 대응되는 교정 데이터가 각각 포함된 서로 다른 복수의 샘플 데이터 세트(dataset)를 선택하는 단계;
    상기 타겟 정보 생성 시스템에서, 상기 서로 다른 복수의 샘플 데이터 세트 및 상기 연관 정보를 포함하는 프롬프트를 구성하는 단계;
    상기 타겟 정보 생성 시스템에서, 상기 프롬프트를 기 특정된 대형 언어 모델의 입력으로서 처리하는 단계;
    상기 타겟 정보 생성 시스템에서, 상기 복수의 샘플 데이터 및 상기 연관 정보를 상기 프롬프트를 통해 입력받은 상기 대형 언어 모델을 이용하여, 상기 연관 정보와 관련된 적어도 하나의 키워드를 포함하는 상기 특정 아이템에 대한 타겟 정보를 획득하는 단계; 및
    상기 타겟 정보가 상기 사용자의 전자기기에 출력되도록, 상기 타겟 정보 생성 시스템에서, 상기 타겟 정보를 상기 사용자의 전자기기로 전송하는 단계를 포함하고,
    상기 타겟 정보를 획득하는 단계에서는,
    상기 복수의 샘플 데이터 세트를 참조하여 상기 연관 정보를 수정 또는 교정하여 상기 타겟 정보를 생성하는 것을 특징으로 하는 타겟 정보 생성 방법.
KR1020210123374A 2021-09-15 2021-09-15 타겟 정보 생성 방법 및 시스템 KR102629214B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020210123374A KR102629214B1 (ko) 2021-09-15 2021-09-15 타겟 정보 생성 방법 및 시스템
JP2021212157A JP7334230B2 (ja) 2021-09-15 2021-12-27 ターゲット情報生成方法及びシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210123374A KR102629214B1 (ko) 2021-09-15 2021-09-15 타겟 정보 생성 방법 및 시스템

Publications (2)

Publication Number Publication Date
KR20230040138A KR20230040138A (ko) 2023-03-22
KR102629214B1 true KR102629214B1 (ko) 2024-01-24

Family

ID=85724046

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210123374A KR102629214B1 (ko) 2021-09-15 2021-09-15 타겟 정보 생성 방법 및 시스템

Country Status (2)

Country Link
JP (1) JP7334230B2 (ko)
KR (1) KR102629214B1 (ko)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116934438A (zh) * 2023-04-14 2023-10-24 济南明泉数字商务有限公司 一种基于chatGPT模型和算力的AI竞拍决策方法及系统
CN116955613B (zh) * 2023-06-12 2024-02-27 广州数说故事信息科技有限公司 一种基于研报数据和大语言模型生成产品概念的方法
CN117194410B (zh) * 2023-07-13 2024-05-14 广州白码科技有限公司 一种人工智能语言模型生成业务报表的方法及系统
CN117111917B (zh) * 2023-10-23 2024-02-27 福建自贸试验区厦门片区Manteia数据科技有限公司 医疗辅助系统的交互方法、装置、电子设备及存储介质
KR102657627B1 (ko) * 2024-01-19 2024-04-17 주식회사 더매트릭스 생성형 ai 모델을 이용한 색채 추천 및 이미지 생성 서비스를 제공하는 서버, 시스템, 방법 및 프로그램
CN117725191B (zh) * 2024-02-18 2024-05-28 卓世智星(天津)科技有限公司 大语言模型的引导信息生成方法、装置及电子设备

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005327107A (ja) 2004-05-14 2005-11-24 Fuji Xerox Co Ltd 固有名カテゴリ推定装置及びプログラム
JP5542251B1 (ja) 2013-10-30 2014-07-09 楽天株式会社 処理装置、処理方法、プログラム、及び記録媒体
KR20190140521A (ko) * 2018-05-30 2019-12-20 페이업 주식회사 챗봇에 기반한 상품 정보 제공 장치 및 이를 이용한 상품 정보 제공 방법
KR20200017306A (ko) * 2018-08-08 2020-02-18 삼성전자주식회사 카테고리에 기반하여 아이템에 관한 정보를 제공하는 전자 장치
JP7082014B2 (ja) 2018-09-07 2022-06-07 ヤフー株式会社 情報処理装置、情報処理方法、及びプログラム

Also Published As

Publication number Publication date
JP7334230B2 (ja) 2023-08-28
JP2023043129A (ja) 2023-03-28
KR20230040138A (ko) 2023-03-22

Similar Documents

Publication Publication Date Title
KR102629214B1 (ko) 타겟 정보 생성 방법 및 시스템
US20220067104A1 (en) Natural Language Question Answering Systems
US11442932B2 (en) Mapping natural language to queries using a query grammar
US10474478B2 (en) Methods, systems, and computer program product for implementing software applications with dynamic conditions and dynamic actions
US11481388B2 (en) Methods and apparatus for using machine learning to securely and efficiently retrieve and present search results
US20190147000A1 (en) Systems and methods for performing search and retrieval of electronic documents using a big index
CN112437917A (zh) 使用自主代理和词库的数据库的自然语言接口
US20190130305A1 (en) Methods, systems, and computer program product for implementing an intelligent system with dynamic configurability
US9830404B2 (en) Analyzing language dependency structures
US20220012296A1 (en) Systems and methods to automatically categorize social media posts and recommend social media posts
CN102955848B (zh) 一种基于语义的三维模型检索系统和方法
US10366117B2 (en) Computer-implemented systems and methods for taxonomy development
US20200233927A1 (en) Context-based translation retrieval via multilingual space
CN112035506A (zh) 一种语义识别方法及其设备
EP3598436A1 (en) Structuring and grouping of voice queries
WO2020167557A1 (en) Natural language querying of a data lake using contextualized knowledge bases
US20200409951A1 (en) Intelligence Augmentation System for Data Analysis and Decision Making
CN114997288A (zh) 一种设计资源关联方法
WO2024015323A1 (en) Methods and systems for improved document processing and information retrieval
Scharkow Content analysis, automatic
US11947581B2 (en) Dynamic taxonomy builder and smart feed compiler
JP5438603B2 (ja) 感性辞書編集支援システム及びプログラム
Wang et al. Sentiment classification based on weak tagging information and imbalanced data
WO2008032037A1 (en) Method and system for filtering and searching data using word frequencies
CN110706021A (zh) 一种广告投放方法及系统

Legal Events

Date Code Title Description
AMND Amendment
E601 Decision to refuse application
X091 Application refused [patent]
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant