WO2024096370A1 - 분산된 지식 정보의 싱글 윈도우 내 통합 검색 및 사용자 검색 패턴 기반 지식 정보의 추천을 수행하는 플랫폼 서버, 이를 포함하는 서비스 제공 시스템 및 서비스 제공 방법 - Google Patents

분산된 지식 정보의 싱글 윈도우 내 통합 검색 및 사용자 검색 패턴 기반 지식 정보의 추천을 수행하는 플랫폼 서버, 이를 포함하는 서비스 제공 시스템 및 서비스 제공 방법 Download PDF

Info

Publication number
WO2024096370A1
WO2024096370A1 PCT/KR2023/015897 KR2023015897W WO2024096370A1 WO 2024096370 A1 WO2024096370 A1 WO 2024096370A1 KR 2023015897 W KR2023015897 W KR 2023015897W WO 2024096370 A1 WO2024096370 A1 WO 2024096370A1
Authority
WO
WIPO (PCT)
Prior art keywords
knowledge information
user
search
interest
keywords
Prior art date
Application number
PCT/KR2023/015897
Other languages
English (en)
French (fr)
Inventor
송광종
박새롬
권은별
Original Assignee
한화솔루션(주)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020230036507A external-priority patent/KR20240062887A/ko
Application filed by 한화솔루션(주) filed Critical 한화솔루션(주)
Publication of WO2024096370A1 publication Critical patent/WO2024096370A1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/904Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services

Definitions

  • the present invention relates to a platform server that performs search and recommendation of knowledge information, a service provision system, and a service provision method.
  • knowledge information Various types of information (hereinafter referred to as knowledge information), such as papers, patents, and technical reports, exist distributed across multiple external sites, and as the types of knowledge information provided become more diverse due to the advancement of the company's internal system, users The amount of accessible information is increasing explosively.
  • an analysis foundation is needed to conduct prediction-based research on ongoing tasks and estimate the mid- to long-term macroscopic direction of technology through analysis of unstructured information among knowledge information.
  • the purpose of the present invention is to provide a service provision system and service provision method capable of providing customized information for each user by searching target knowledge information from various angles.
  • the purpose of the present invention is to provide a service provision system and service provision method that can provide an analysis environment for each user purpose using unstructured information.
  • a search request for each user Constructing a keyword dictionary containing keywords of interest for each user using interest knowledge information extracted based on the keywords;
  • a search request from a first user extracting and visualizing first knowledge information corresponding to the first search request using a keyword included in the first search request and a keyword dictionary of the first user.
  • step extracting and visualizing second knowledge information using the search history of at least one second user having keywords of interest similar to keywords of interest included in the keyword dictionary of the first user; It includes a step of analyzing unstructured third-party knowledge information prepared in relation to other companies and visualizing the analysis environment for each user's purpose.
  • the step of constructing the keyword dictionary may include constructing the keyword dictionary by extracting noun phrases included in the knowledge information of interest.
  • the step of constructing the keyword dictionary may include constructing the keyword dictionary using a predefined number of noun phrases with a high extraction count among the noun phrases as the keywords of interest.
  • the extracting and visualizing the first knowledge information includes extracting images included in the distributed knowledge information and at least one keyword related to the images and tagging each image; It may include extracting the first knowledge information including at least one image tagged with a keyword included in the first search request.
  • the step of extracting and visualizing the second knowledge information may include providing the user with at least one piece of knowledge information that is not identified in the search history of the first user among the second knowledge information at predefined intervals. there is.
  • the step of extracting and visualizing the second knowledge information includes at least one knowledge information containing keywords of interest of the first user among the second knowledge information or the first knowledge information among the keywords included in the second knowledge information. It may include providing a list of at least one keyword similar to the user's keywords of interest.
  • the service provision method further includes, when receiving a user input for selecting one of the first knowledge information and the second knowledge information, extracting and visualizing at least one knowledge information that has a high degree of similarity to the selected knowledge information. It can be included.
  • knowledge information of interest extracted based on search requests for each user When constructing a keyword dictionary containing keywords of interest for each user, and receiving the first search request from the first user, the keyword included in the first search request and the keyword dictionary of the first user Extract and visualize first knowledge information corresponding to the first search request using, and search history of at least one second user having keywords of interest similar to keywords of interest included in the keyword dictionary of the first user. It includes a server processor that extracts and visualizes secondary knowledge information and analyzes the unstructured third knowledge information prepared in relation to other companies to visualize the analysis environment for each user's purpose.
  • the server processor may construct the keyword dictionary by extracting noun phrases included in the knowledge information of interest.
  • the server processor may construct the keyword dictionary in which a predefined number of noun phrases with a high extraction count among the noun phrases are used as keywords of interest.
  • the server processor extracts images included in the distributed knowledge information and at least one keyword related to the images and tags each image, and tags at least one keyword included in the first search request.
  • the first knowledge information including one image can be extracted.
  • the server processor may provide the user with at least one piece of knowledge information that is not identified in the search history of the first user among the second knowledge information at predefined intervals.
  • the server processor may select at least one knowledge information that includes keywords of interest of the first user among the second knowledge information, or at least one that is similar to keywords of interest of the first user among keywords included in the second knowledge information.
  • a list of one keyword can be provided.
  • the server processor may extract and visualize at least one fifth knowledge information that has a high degree of similarity to the selected knowledge information.
  • a service providing system that performs integrated search within a single window of distributed knowledge information and recommendation of knowledge information based on user search patterns, comprising: a database; And when constructing a keyword dictionary containing keywords of interest for each user using interest knowledge information extracted from the database based on search requests for each user, and receiving the first search request from the first user, Extract and visualize first knowledge information corresponding to the first search request using the keyword included in the first search request and the first user's keyword dictionary, and keywords of interest included in the first user's keyword dictionary extracts and visualizes secondary knowledge information using the search history of at least one second user with similar keywords of interest, and analyzes the unstructured third knowledge information prepared in relation to other companies to visualize the analysis environment for each user's purpose.
  • necessary knowledge information can be efficiently collected through multi-faceted knowledge information search, and market feasibility can be easily analyzed to propose a research task.
  • FIG. 1 is a schematic diagram showing a service provision system according to an embodiment of the present invention.
  • FIG. 2 is a block diagram showing the configuration of a platform server according to an embodiment of the present invention.
  • Figure 3 is a flowchart showing a service provision method according to an embodiment of the present invention.
  • Figure 4 is a diagram showing processing of knowledge information according to an embodiment of the present invention.
  • Figure 5 is a diagram illustrating the first screen of a search portal according to an embodiment of the present invention.
  • Figure 6 is a diagram illustrating the second screen of a search portal according to an embodiment of the present invention.
  • Figure 7 is a diagram illustrating the third screen of a search portal according to an embodiment of the present invention.
  • Figure 8 is a diagram illustrating the fourth screen of a search portal according to an embodiment of the present invention.
  • Figure 9 is a diagram illustrating the fifth screen of an analysis portal according to an embodiment of the present invention.
  • Figure 10 is a diagram illustrating the sixth screen of the analysis portal according to an embodiment of the present invention.
  • Figure 11 is a diagram illustrating the seventh screen of the analysis portal according to an embodiment of the present invention.
  • Figure 12 is a diagram showing the eighth screen of the analysis portal according to an embodiment of the present invention.
  • Figure 13 is a diagram illustrating the ninth screen of the analysis portal according to an embodiment of the present invention.
  • FIG. 1 is a schematic diagram showing a service provision system according to an embodiment of the present invention.
  • the service provision system 1 (hereinafter referred to as system 1) provides an integrated search within a single window of distributed knowledge information and a recommendation service for knowledge information based on user search patterns. It is a system that provides a platform server 100, a database 200, and at least one user terminal 300.
  • the platform server 100 analyzes the user's search pattern, interest, search purpose, etc. to search for target knowledge information in various ways, and visualizes customized knowledge information for each user to create a platform (tech It is a server device provided through a sensing platform (also called Tech Sensing Platform).
  • the database 200 is a storage device that stores knowledge information.
  • the database 200 may be implemented as an external database, internal database, group infrastructure, etc. depending on the storage location, and may be implemented based on a cloud or network, or implemented based on hardware.
  • Knowledge information stored in the database 200 includes papers (research papers, academic papers, industry-specific database-oriented literature, etc.), patents, product information (information for third party/product analysis), industry trend reports, market reports, etc. News, chemical formulas, international standard codes, internal reports (research notes, approval documents, various internal documents related to R&D, etc.) are not limited to those listed above and can be very diverse, and the form of the knowledge information such as structured/unstructured is limited. I never do that.
  • At least one user terminal 300 is an electronic device that can use knowledge information provided by accessing a platform for integrated search and recommendation of knowledge information implemented by the platform server 100. As such, it can be implemented in computers, laptops, mobile phones, etc.
  • the platform server 100, the database 200, and the user terminal 300 are connected for communication through the network 10, and the platform server 100 searches the user terminal 300.
  • Knowledge information can be provided upon request, or search personalization can be performed through artificial intelligence/machine learning-based user search pattern learning and interest analysis, and knowledge information can be recommended based on that.
  • the present invention proposes a service provision system and service provision method that can search target knowledge information from various angles to provide customized information for each user and provide an analysis environment for each user purpose using unstructured information.
  • FIG. 2 is a block diagram showing the configuration of the platform server 100 according to an embodiment of the present invention.
  • the platform server 100 includes an input unit 110, a communication unit 120, a display unit 130, a memory 140, and a server processor 150.
  • the input unit 110 generates input data in response to user input of the platform server 100.
  • user input can be applied without limitation in the case of user input for performing integrated search within a single window of distributed knowledge information, such as user input required to implement a tech sensing platform, and recommendation of knowledge information based on user search patterns. .
  • the input unit 110 includes at least one input means.
  • the input unit 110 includes a keyboard, key pad, dome switch, touch panel, touch key, mouse, menu button, etc. may include.
  • the user input may be received from the input unit 110 provided in the platform server 100, but is not limited to this and may be an input signal received from the input unit provided in each of the plurality of user terminals 300.
  • the input signal will be described later. It can be received through the communication unit 120.
  • the communication unit 120 performs communication with external devices such as a database 200, a plurality of user terminals 300, and an external server in order to receive necessary information or signals through the network 10.
  • the communication unit 120 uses wireless communication such as 5th generation communication (5G), long term evolution-advanced (LTE-A), long term evolution (LTE), wireless fidelity (Wi-Fi), or local area network (LAN). ), WAN (Wide Area Network), and power line communication can be performed.
  • 5G 5th generation communication
  • LTE-A long term evolution-advanced
  • LTE long term evolution
  • Wi-Fi wireless fidelity
  • LAN local area network
  • WAN Wide Area Network
  • the display unit 130 displays display data according to the operation of the platform server 100.
  • the display unit 130 displays display data necessary to provide the service, for example, a screen displaying knowledge information extracted in response to a user's search request, a screen displaying recommended knowledge information by comparing and analyzing interest similarities between users, etc. can be displayed.
  • the display unit 130 includes a liquid crystal display (LCD), a light emitting diode (LED) display, an organic light emitting diode (OLED) display, and a micro electro mechanical systems (MEMS) display. and electronic paper displays.
  • LCD liquid crystal display
  • LED light emitting diode
  • OLED organic light emitting diode
  • MEMS micro electro mechanical systems
  • the display unit 130 may be combined with the input unit 110 and implemented as a touch screen.
  • the memory 140 stores operation programs of the platform server 100.
  • the memory 140 is a non-volatile storage that can preserve data (information) regardless of whether power is provided, and data to be processed by the server processor 150 is loaded and is stored when power is not provided. Includes volatile memory in which data cannot be preserved. Storage includes flash memory, HDD (hard-disc drive), SSD (solid-state drive), ROM (Read Only Memory), etc., and memory includes buffer and RAM (Random Access Memory). there is.
  • the memory 140 can store computational programs necessary in the process of building a keyword dictionary, extracting knowledge information, visualization, and analyzing information.
  • the server processor 150 may execute software such as a program to control at least one other component (eg, hardware or software component) of the platform server 100 and may perform various data processing or calculations.
  • the server processor 150 may include a main processor that functions as a central processing unit (CPU) or an application processor, and a graphics processing unit (GPU) that can operate independently or together.
  • CPU central processing unit
  • GPU graphics processing unit
  • the server processor 150 builds a keyword dictionary containing keywords of interest for each user using interest knowledge information extracted based on search requests for each user, and receives the first search request from the first user,
  • the first knowledge information corresponding to the first search request is extracted and visualized using the keyword included in the first search request and the keyword dictionary of the first user, and the keyword of interest included in the keyword dictionary of the first user extracting and visualizing secondary knowledge information using the search history of at least one second user with similar keywords of interest, and visualizing the analysis environment for each user's purpose by analyzing unstructured third knowledge information prepared in relation to other companies. do.
  • the server processor 150 performs at least some of the data analysis, processing, and resulting information generation to perform the above operations using machine learning, neural network, or deep rule-based or artificial intelligence algorithms. It can be performed using at least one of the learning algorithms.
  • neural networks may include models such as Convolutional Neural Network (CNN), Deep Neural Network (DNN), and Recurrent Neural Network (RNN).
  • FIG. 3 is a flowchart showing a service provision method according to an embodiment of the present invention. At this time, the operations of the platform server 100 are considered to be operated by the server processor 150, unless otherwise specified.
  • the method according to an embodiment of the present invention includes the step of constructing a keyword dictionary containing keywords of interest for each user using interest knowledge information extracted based on search requests for each user (S10).
  • the platform server 100 can receive a search request (can be received in the form of a signal) from the user terminal 300 through the communication unit 120, and the search request is sent by the user. This may occur based on receiving a user input for requesting a search through the terminal 300.
  • the platform server 100 may extract knowledge information through the database 200 based on at least one keyword included in the search request. Specifically, the platform server 100 may collect knowledge information from the database 200 through cloud infrastructure (eg, AWS (Amazon Web Services) cloud-based infrastructure, etc.). In addition, the platform server 100 performs data mining/text mining on the collected structured/unstructured knowledge information and can collect a lot of meta information (abstract, author, etc.) from this. .
  • cloud infrastructure eg, AWS (Amazon Web Services) cloud-based infrastructure, etc.
  • the platform server 100 performs data mining/text mining on the collected structured/unstructured knowledge information and can collect a lot of meta information (abstract, author, etc.) from this. .
  • the step of building a keyword dictionary is to extract noun phrases included in the knowledge information extracted based on the received search requests (hereinafter, the knowledge information extracted during the keyword dictionary construction process is referred to as knowledge information of interest for convenience) and create the keyword dictionary. Includes construction steps.
  • the platform server 100 configures a query set using keywords included in search requests (queries) for each user.
  • the platform server 100 searches for knowledge information of interest based on all queries included in each query set, extracts noun phrases included in the retrieved knowledge information of interest, and then builds a keyword dictionary using the noun phrases.
  • keyword dictionaries can be built for each user and language, and query sets or noun phrases can be constructed and extracted for each language to build a keyword dictionary for each language.
  • the platform server 100 may set a predefined number of noun phrases with a high number of extractions as keywords of interest.
  • the platform server 100 may continuously update the keyword dictionary for each user and keywords of interest for each user as it receives additional search requests from users in the future.
  • the method according to an embodiment of the present invention is, when receiving a first search request from a first user, a first search request corresponding to the first search request using a keyword included in the first search request and a keyword dictionary of the first user. It includes the step of extracting and visualizing knowledge information (S20).
  • the platform server 100 may personalize search results according to search history for each user and interest analysis results for each user. At this time, the platform server 100 may identify interest analysis results based on interest keywords for each user and update the keyword dictionary for each user according to the interest analysis results. At this time, the platform server 100 may additionally provide functions such as registering, modifying, and deleting keywords of interest included in the keyword dictionary through user input received through the input unit 110 or the user terminal 300.
  • the extracted first knowledge information is not limited to documents and may also include images.
  • the method according to an embodiment of the present invention includes extracting and visualizing second knowledge information using the search history of at least one second user having keywords of interest similar to keywords of interest included in the keyword dictionary of the first user. Includes (S30).
  • the platform server 100 may identify keyword similarities of interest between users (also referred to as similarity between users) based on keyword dictionaries built between the first user and other users. Specifically, to measure similarity, the number of noun phrases to be extracted from the keyword dictionary is specified, and the specified number of noun phrases is extracted from each keyword dictionary. At this time, if a keyword dictionary is built for each language, noun phrases are extracted for each language. Among the extracted noun phrases, the similarity between users is confirmed by checking the number of overlapping noun phrases between the two users. If noun phrases are extracted for each language, similarity will also be derived for each language.
  • the highest value among the similarities derived for each language is identified as the similarity between the two users.
  • it is not limited to this and can be set in various ways, such as using the average value of the similarities or identifying the similarity based on the Korean similarity.
  • the platform server 100 uses the similarity between users to derive at least one user (referred to as a second user) having keywords of interest similar to keywords of interest included in the keyword dictionary of the first user.
  • the second user may be a user whose similarity identified with the first user exceeds a predefined similarity value, or may be determined as a predefined number of users in the order of high similarity identified with the first user. It can be selected in various ways using similarity.
  • the platform server 100 may extract second knowledge information using the second user's search history, and the search history includes the second user's search requests, knowledge information provided according to the second user's search request, and the second user's search history. It may include all history of using the search portal, such as knowledge information viewed by the user, bookmarked by a second user, or left a comment.
  • the visualization method when visualizing using the extracted second knowledge information, can be implemented in various ways, such as implementing it on a search portal or providing the second knowledge information to the user. At this time, examples implemented on the search portal can be confirmed through Figures 5 to 8.
  • the platform server 100 when providing the extracted second knowledge information to the user, for example, the platform server 100 provides at least one knowledge information that is not identified in the search history of the first user among the second knowledge information at a predefined period. can be provided to the user. At this time, the platform server 100 may transmit the identified knowledge information to the user's email address or as a notification, message, etc. on the platform accessed through the user terminal 300.
  • the method according to an embodiment of the present invention includes the step of analyzing third-party knowledge information prepared in relation to other companies and visualizing the analysis environment for each user's purpose (S40).
  • the third-party knowledge information subject to analysis is not limited to structured/unstructured knowledge information, and the analysis environment for each purpose is comparative analysis of physical properties of related products of other companies, including competitors, analysis of related patent keywords, analysis of related researchers, and related news keywords. May include analysis, etc.
  • the platform server 100 may provide first knowledge information, second knowledge information, and an analysis environment for each purpose in steps S20 to S40, and each step may be performed in parallel without being restricted by order. It can be done objectively.
  • the service may be provided in the corresponding situation, such as receiving a user's search request, a predefined cycle arriving, or receiving user input accessing an analysis portal or search portal.
  • necessary knowledge information can be efficiently collected through multi-faceted knowledge information search, and market feasibility can be easily analyzed to propose a research task.
  • Figure 4 is a diagram showing processing of knowledge information according to an embodiment of the present invention.
  • knowledge information may include papers, patents, market information, product information, internal data, user-related information (user basic information, user activity information, user interest keywords, etc.).
  • the platform server 100 can provide various services by combining it with artificial intelligence/machine learning technology.
  • knowledge information and models designed based on each artificial intelligence/machine learning technology.
  • knowledge information and models may be used in combination of at least one or more.
  • the platform server 100 uses basic user information (which may include research field, affiliation, age group, gender, etc.) and user activity information (which may include search history such as search requests). Through the individual profiling model, keywords of interest for each user can be identified, and keyword updates can be performed on a monthly/quarterly basis. Additionally, the platform server 100 can feed newly collected knowledge information based on the user's keywords of interest.
  • basic user information which may include research field, affiliation, age group, gender, etc.
  • user activity information which may include search history such as search requests.
  • keywords of interest for each user can be identified, and keyword updates can be performed on a monthly/quarterly basis. Additionally, the platform server 100 can feed newly collected knowledge information based on the user's keywords of interest.
  • the platform server 100 may extract keywords of interest for each user for similarity analysis through a similarity analysis model using user interest keywords, and may extract a predefined number of other keywords of interest similar to that of the user. Users can be identified.
  • the platform server 100 may identify at least one piece of knowledge information that is not identified in the search history of the user based on the search history of other users with similar interests and feed it to the user, and may provide the information to the user with a high search frequency among related users. It can provide a list of popular search words in order of keywords, a list of popular knowledge information in order of frequently searched knowledge, etc.
  • the platform server 100 may visualize knowledge information such as patents and papers as a contour map using a clustering model.
  • a specific example of the contour map is shown in FIG. 13 and will be described with reference to FIG. 13 .
  • the platform server 100 uses keyword extraction and image cropping models of knowledge information such as papers and patents to identify images included in distributed knowledge information and at least one image related to each image. You can extract (crop) one keyword and tag each image with the extracted keyword.
  • a specific example of this is shown in FIG. 8 and will be described with reference to FIG. 8 .
  • the platform server 100 may perform similarity analysis between knowledge information through a similarity analysis model using knowledge information such as papers and patents.
  • knowledge information such as papers and patents.
  • at least one knowledge information (referred to as fifth knowledge information) with high similarity to the selected knowledge information can be extracted and provided.
  • similarity analysis between knowledge information may be performed based on a cosine similarity analysis method, but is not limited to this.
  • information provided based on similarity analysis between knowledge information may be provided for search on a search portal or for trend analysis on an analysis portal, and examples of visualization implementation may vary depending on portal characteristics.
  • the platform server 100 uses knowledge information such as papers and patents to extract keyword frequencies within the knowledge information through a keyword frequency model and perform preprocessing steps such as stop word processing for keyword trend analysis. You can.
  • the platform server 100 can provide various keyword trends such as ascending, descending, and latest order, and can further provide keyword frequencies in other companies' patents.
  • the platform server 100 may use knowledge information such as market information (news, etc.) to extract main content of the market information through a keyword extraction model.
  • the platform server 100 can extract the main content in sentence units or summarize it in sentence units, and use optical character recognition (OCR) technology to extract keywords according to the document format of the market information.
  • OCR optical character recognition
  • the platform server 100 can use market information such as news to extract and visualize keywords, key sentences, etc. linked to products of each company through a keyword classification model.
  • Figures 5 to 13 show visualizations of the search portal and analysis portal of the present invention.
  • this is only an implementation example, and it is natural that the design, composition, and content of the visualization can be modified.
  • FIG. 5 is a diagram illustrating the first screen of a search portal according to an embodiment of the present invention.
  • the first screen 500 of FIG. 5 includes a search window 510, a recent search word list 520, and a popular search word list 530.
  • the platform server 100 When receiving a search request through the user terminal 300, the platform server 100 extracts knowledge information corresponding to the search request using the keyword included in the search request and the user's keyword dictionary. At this time, the platform server 100 receives a search request based on receiving a user input of entering a search term (e.g., keyword, author, title, etc.) and a search button in the search box 510 through the user terminal 300. can do.
  • a search term e.g., keyword, author, title, etc.
  • the platform server 100 may display a recent search word list 520 using the user's search history, and the recent search word list 520 may be continuously updated.
  • the platform server 100 uses similarity between users to connect at least one second user with keywords of interest similar to keywords of interest included in the keyword dictionary of the first user. Using the search history of (similar researchers), secondary knowledge information can be extracted and visualized.
  • the platform server 100 provides at least one knowledge information containing keywords of interest of the first user among the second knowledge information, or at least one similar to keywords of interest of the first user among keywords included in the second knowledge information.
  • a list of one keyword can be provided.
  • the platform server 100 can visualize keywords searched by similar researchers or the entire research institute as a list of popular search terms 530.
  • Figure 6 is a diagram illustrating the second screen of a search portal according to an embodiment of the present invention.
  • the second screen 600 of FIG. 6 includes a search tab 610 for each type of knowledge information, a search result 620, a search filter 630, etc.
  • the search tab 610 may be implemented by type of knowledge information, such as an integrated search tab, paper tab, patent tab, market information tab, report tab, material tab, internal data tab, research note tab, and image tab, but is not limited to these. However, it can be implemented in various ways, such as adding other tabs or integrating two or more tabs.
  • the second screen 600 shows search results 620 based on a search request for “polymer” in the paper tab.
  • Search results can list the knowledge information extracted based on the search request in order of highest relevance, and in addition, the knowledge information can be listed in the order of newest, likes (user preference), and view order.
  • the searched keywords may be highlighted in the search results 620, and users can share, bookmark, or like the documents listed in the search results 620 through the user terminal 300. You can check specific details by selecting one of the results (620). The screen for confirming specific details is shown in FIG. 7.
  • the search filter 630 includes filter items such as publication year, journal name, author name, and research institution so that the extracted knowledge information can be re-filtered. Additionally, upon receiving a user input by pressing the trend analysis icon of the search filter 630, trends among knowledge information extracted through the search request can be analyzed. Trend analysis is explained through the analysis portal screen below.
  • Figure 7 is a diagram illustrating the third screen of a search portal according to an embodiment of the present invention.
  • the third screen 700 of FIG. 7 includes contents 710 of a specific paper and papers 720 similar to the specific paper.
  • the content 710 of a specific paper may include bibliographic information such as the paper title, author information, and journal name, the abstract of the paper, and images included in the paper.
  • the platform server 100 can extract, analyze, and summarize content in knowledge information. This can be processed, analyzed and summarized in real time, but can also be called after it has already been performed and established in the memory 140. Users can share, bookmark, or like documents in the search results 620 through the user terminal 300.
  • the platform server 100 can identify and list papers that cite the paper, and papers that the paper cites, and display them upon receiving a user input of selecting the “Citation” icon. This can be applied not only to papers but also to patents.
  • Figure 8 is a diagram illustrating the fourth screen of a search portal according to an embodiment of the present invention.
  • the fourth screen 800 of FIG. 8 includes an image search result 810 among the knowledge information extracted based on the search request.
  • the platform server 100 extracts images included in knowledge information and at least one keyword related to the images, tags each image, and extracts at least one image tagged with the keyword included in the search request.
  • Knowledge information including can be extracted and visualized.
  • the platform server 100 uses machine learning-based keyword extraction and image cropping models to extract unstructured images included in distributed knowledge information and at least one keyword related to each image. You can crop and tag each image with the extracted keywords.
  • the platform server 100 may build an unstructured image database in the memory 140 by tagging unstructured images included in distributed knowledge information with keywords.
  • Figure 9 is a diagram illustrating the fifth screen of an analysis portal according to an embodiment of the present invention.
  • the fifth screen 900 of FIG. 9 shows a table 910 showing the status of related products, related patents, related researchers, and related news among manufacturers (third parties) for the product group, an analysis tab 920, and product analysis contents 930. ) includes.
  • the analysis tab 920 includes a product analysis tab, a patent analysis tab, a researcher analysis tab, and a news analysis tab. Hereinafter, each tab will be described through FIGS. 9 to 13.
  • Product analysis content 930 can be visualized in the form of a graph comparing the selected physical properties of the product or a table comparing the physical properties of each product.
  • Figure 10 is a diagram illustrating the sixth screen of the analysis portal according to an embodiment of the present invention.
  • the sixth screen 1000 of FIG. 10 shows patent analysis content 1010 when the patent analysis tab is selected from the analysis tab 920 of the fifth screen 900 of FIG. 9.
  • Patent analysis content (1010) extracts and analyzes keywords included in other companies' patents and displays major keywords in various ways, such as keyword cloud, Top 10 keyword trends, and keyword ranking. At this time, major keywords can be displayed by language. there is. Additionally, other companies' patents can be displayed in a table format to include related information.
  • Figure 11 is a diagram illustrating the seventh screen of the analysis portal according to an embodiment of the present invention.
  • the seventh screen 1100 of FIG. 11 shows researcher analysis contents 1110 when the researcher analysis tab is selected from the analysis tab 920 of the fifth screen 900 of FIG. 9 .
  • Figure 12 is a diagram showing the eighth screen of the analysis portal according to an embodiment of the present invention.
  • the eighth screen 1200 of FIG. 12 shows news analysis content 1210 when the news analysis tab is selected from the analysis tab 920 of the fifth screen 900 of FIG. 9.
  • keywords can be extracted and analyzed through market information such as news related to other companies and displayed in various ways such as keyword circle, Top 10 keyword trends, keyword ranking, etc. At this time, major keywords can be displayed by language. . Additionally, it can be displayed in a table format to include information related to other companies' market information.
  • Figure 13 is a diagram illustrating the ninth screen of the analysis portal according to an embodiment of the present invention.
  • the ninth screen 1300 of FIG. 13 shows a contour map clustering knowledge information such as patents and papers.
  • the platform server 100 can cluster knowledge information such as patents and papers using a clustering (Document Clustering) model and visualize it as a contour map.
  • clustering Document Clustering
  • the platform server 100 may cluster knowledge information into a plurality of clusters using a similarity algorithm such as K-means vector and cosine similarity. Specifically, the platform server 100 may cluster knowledge information as shown in FIG. 13 using the number of documents for each clustered cluster, center coordinates for each cluster, main keywords, and coordinates for each knowledge information.
  • a similarity algorithm such as K-means vector and cosine similarity.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명의 일 실시예에 따른 플랫폼 서버에 의해 수행되는 분산된 지식 정보의 싱글 윈도우(single window) 내 통합 검색 및 사용자 검색 패턴 기반 지식 정보의 추천을 수행하는 서비스 제공 방법에 있어서, 사용자 별 검색 요청들을 기반으로 추출한 관심 지식 정보를 이용하여 사용자 별 관심 키워드들을 포함하는 키워드 딕셔너리(keyword dictionary)를 구축하는 단계; 제1사용자의 제1검색 요청을 수신하는 경우, 상기 제1검색 요청에 포함된 키워드 및 상기 제1사용자의 키워드 딕셔너리를 이용하여 상기 제1검색 요청에 대응하는 제1지식 정보를 추출하여 시각화하는 단계; 상기 제1사용자의 키워드 딕셔너리에 포함된 관심 키워드들과 유사한 관심 키워드들을 가지는 적어도 하나의 제2사용자의 검색 이력을 이용하여 제2지식 정보를 추출하여 시각화하는 단계; 타사와 관련하여 마련된 비정형 제3지식 정보를 분석하여 사용자의 목적별 분석 환경을 시각화하는 단계;를 포함한다.

Description

분산된 지식 정보의 싱글 윈도우 내 통합 검색 및 사용자 검색 패턴 기반 지식 정보의 추천을 수행하는 플랫폼 서버, 이를 포함하는 서비스 제공 시스템 및 서비스 제공 방법
본 발명은 지식 정보의 검색 및 추천을 수행하는 플랫폼 서버, 서비스 제공 시스템 및 서비스 제공 방법에 관한 것이다.
논문, 특허, 기술 보고서 등 여러 형태의 정보(이하, 지식 정보라 한다.)가 다수의 외부 사이트에 분산되어 존재하고, 회사 내부 시스템의 고도화로 제공되는 지식 정보의 종류가 다양해짐에 따라 사용자가 접근 가능한 정보량이 폭발적으로 증가하고 있다.
또한, 과학 기술 발전과 함께 연구 대상 분야가 광범위해짐으로써 동일 지식 정보(Source) 내에서도 사용자 별로 탐색하고자 하는 정보의 종류 및 내용이 상이한 바, 이에 따라 업무 및 연구 진행에 요구되는 양질의 정보를 확보하는 것이 점차 어려워지고 있다.
따라서, 사용자들이 자료 조사 업무를 효율화하고, 개인이 이해한 내용이 조직에 공유될 수 있는 환경을 제공하거나, 주기적이고 지속적으로 신기술을 스크리닝(screening)하고, 사용자 맞춤형 지식 정보를 선별하고 이를 자동으로 제공(feeding)하는 환경이 필요하다.
뿐만 아니라, 지식 정보 중 비정형의 정보 분석을 통해 현재 진행 중인 과제의 예측 기반 연구 수행 및 기술의 중장기 거시적 방향성을 가늠해 볼 수 있는 분석 토대가 필요하다.
본 발명의 목적은 목표로 하는 지식 정보를 다각적으로 탐색하여 사용자 별 맞춤 정보 제공이 가능한 서비스 제공 시스템 및 서비스 제공 방법을 제공하는 것이다.
본 발명의 목적은 비정형 정보를 이용하여 사용자 목적 별 분석 환경 제공이 가능한 서비스 제공 시스템 및 서비스 제공 방법을 제공하는 것이다.
본 발명의 일 실시예에 따른 플랫폼 서버에 의해 수행되는 분산된 지식 정보의 싱글 윈도우(single window) 내 통합 검색 및 사용자 검색 패턴 기반 지식 정보의 추천을 수행하는 서비스 제공 방법에 있어서, 사용자 별 검색 요청들을 기반으로 추출한 관심 지식 정보를 이용하여 사용자 별 관심 키워드들을 포함하는 키워드 딕셔너리(keyword dictionary)를 구축하는 단계; 제1사용자의 제1검색 요청을 수신하는 경우, 상기 제1검색 요청에 포함된 키워드 및 상기 제1사용자의 키워드 딕셔너리를 이용하여 상기 제1검색 요청에 대응하는 제1지식 정보를 추출하여 시각화하는 단계; 상기 제1사용자의 키워드 딕셔너리에 포함된 관심 키워드들과 유사한 관심 키워드들을 가지는 적어도 하나의 제2사용자의 검색 이력을 이용하여 제2지식 정보를 추출하여 시각화하는 단계; 타사와 관련하여 마련된 비정형 제3지식 정보를 분석하여 사용자의 목적별 분석 환경을 시각화하는 단계;를 포함한다.
상기 키워드 딕셔너리를 구축하는 단계는, 상기 관심 지식 정보 내에 포함된 명사구들을 추출하여 상기 키워드 딕셔너리를 구축하는 단계를 포함할 수 있다.
상기 키워드 딕셔너리를 구축하는 단계는, 상기 명사구들 중 추출 횟수가 높은 기 정의된 수의 명사구들을 상기 관심 키워드들로 하는 상기 키워드 딕셔너리를 구축하는 단계를 포함할 수 있다.
상기 제1지식 정보를 추출하여 시각화하는 단계는, 상기 분산된 지식 정보에 포함된 이미지들 및 상기 이미지들과 관련된 적어도 하나의 키워드를 추출하여 각 이미지에 태깅(tagging)하는 단계; 상기 제1검색 요청에 포함된 키워드가 태깅된 적어도 하나의 이미지를 포함하는 상기 제1지식 정보를 추출하는 단계를 포함할 수 있다.
상기 제2지식 정보를 추출하여 시각화하는 단계는, 기 정의된 주기마다 상기 제2지식 정보 중 상기 제1사용자의 검색 이력 상 식별되지 않는 적어도 하나의 지식 정보를 사용자에게 제공하는 단계를 포함할 수 있다.
상기 제2지식 정보를 추출하여 시각화하는 단계는, 상기 제2지식 정보 중 상기 제1사용자의 관심 키워드들을 포함하고 있는 적어도 하나의 지식 정보 혹은 상기 제2지식 정보에 포함된 키워드들 중 상기 제1사용자의 관심 키워드들과 유사한 적어도 하나의 키워드에 관한 리스트를 제공하는 단계를 포함할 수 있다.
상기 서비스 제공 방법은, 상기 제1지식 정보 및 상기 제2지식 정보 중 어느 하나를 선택하는 사용자 입력을 수신하는 경우, 선택된 지식 정보와 유사도가 높은 적어도 하나의 지식 정보를 추출하여 시각화하는 단계를 더 포함할 수 있다.
본 발명의 일 실시예에 따른 분산된 지식 정보의 싱글 윈도우(single window) 내 통합 검색 및 사용자 검색 패턴 기반 지식 정보의 추천을 수행하는 플랫폼 서버에 있어서, 사용자 별 검색 요청들을 기반으로 추출한 관심 지식 정보를 이용하여 사용자 별 관심 키워드들을 포함하는 키워드 딕셔너리(keyword dictionary)를 구축하고, 제1사용자의 제1검색 요청을 수신하는 경우, 상기 제1검색 요청에 포함된 키워드 및 상기 제1사용자의 키워드 딕셔너리를 이용하여 상기 제1검색 요청에 대응하는 제1지식 정보를 추출하여 시각화하고, 상기 제1사용자의 키워드 딕셔너리에 포함된 관심 키워드들과 유사한 관심 키워드들을 가지는 적어도 하나의 제2사용자의 검색 이력을 이용하여 제2지식 정보를 추출하여 시각화하고, 타사와 관련하여 마련된 비정형 제3지식 정보를 분석하여 사용자의 목적별 분석 환경을 시각화하는 서버 프로세서를 포함한다.
상기 서버 프로세서는, 상기 관심 지식 정보 내에 포함된 명사구들을 추출하여 상기 키워드 딕셔너리를 구축할 수 있다.
상기 서버 프로세서는, 상기 명사구들 중 추출 횟수가 높은 기 정의된 수의 명사구들을 상기 관심 키워드들로 하는 상기 키워드 딕셔너리를 구축할 수 있다.
상기 서버 프로세서는, 상기 분산된 지식 정보에 포함된 이미지들 및 상기 이미지들과 관련된 적어도 하나의 키워드를 추출하여 각 이미지에 태깅(tagging)하고, 상기 제1검색 요청에 포함된 키워드가 태깅된 적어도 하나의 이미지를 포함하는 상기 제1지식 정보를 추출할 수 있다.
상기 서버 프로세서는, 기 정의된 주기마다 상기 제2지식 정보 중 상기 제1사용자의 검색 이력 상 식별되지 않는 적어도 하나의 지식 정보를 사용자에게 제공할 수 있다.
상기 서버 프로세서는, 상기 제2지식 정보 중 상기 제1사용자의 관심 키워드들을 포함하고 있는 적어도 하나의 지식 정보 혹은 상기 제2지식 정보에 포함된 키워드들 중 상기 제1사용자의 관심 키워드들과 유사한 적어도 하나의 키워드에 관한 리스트를 제공할 수 있다.
상기 서버 프로세서는, 상기 제1지식 정보 및 상기 제2지식 정보 중 어느 하나를 선택하는 사용자 입력을 수신하는 경우, 선택된 지식 정보와 유사도가 높은 적어도 하나의 제5지식 정보를 추출하여 시각화할 수 있다.
본 발명의 일 실시예에 따르면, 분산된 지식 정보의 싱글 윈도우(single window) 내 통합 검색 및 사용자 검색 패턴 기반 지식 정보의 추천을 수행하는 서비스 제공 시스템에 있어서, 데이터 베이스; 및 상기 데이터 베이스로부터 사용자 별 검색 요청들을 기반으로 추출한 관심 지식 정보를 이용하여 사용자 별 관심 키워드들을 포함하는 키워드 딕셔너리(keyword dictionary)를 구축하고, 제1사용자의 제1검색 요청을 수신하는 경우, 상기 제1검색 요청에 포함된 키워드 및 상기 제1사용자의 키워드 딕셔너리를 이용하여 상기 제1검색 요청에 대응하는 제1지식 정보를 추출하여 시각화하고, 상기 제1사용자의 키워드 딕셔너리에 포함된 관심 키워드들과 유사한 관심 키워드들을 가지는 적어도 하나의 제2사용자의 검색 이력을 이용하여 제2지식 정보를 추출하여 시각화하고, 타사와 관련하여 마련된 비정형 제3지식 정보를 분석하여 사용자의 목적별 분석 환경을 시각화하는 플랫폼 서버를 포함한다.
본 발명의 일 실시예에 따르면, 다각도의 지식 정보 검색을 통해 필요한 지식 정보를 효율적으로 수집할 수 있고, 시장 타당성에 대해 손쉽게 분석하여 연구 과제를 제안할 수 있다.
본 발명의 일 실시예에 따르면, 원하는 최신 지식 정보를 능동적으로 피딩(feeding)받을 수 있으며, 중장기 과제 전략 운영의 민첩성(agility)을 구비할 수 있다.
본 발명의 일 실시예에 따르면, 다양한 지식 정보에 인공지능/머신러닝 기술을 접목함으로써, 사용자 별 개인화된 지식 정보의 확보 용이성을 획득함과 동시에 사용자 간 협업 기능 기반으로 전반적인 정보 접근성을 확대하고 연구 문화 선진화를 선도할 수 있다.
도 1은 본 발명의 일 실시예에 따른 서비스 제공 시스템을 도시한 개략도이다.
도 2는 본 발명의 일 실시예에 따른 플랫폼 서버의 구성을 도시한 블록도이다.
도 3은 본 발명의 일 실시예에 따른 서비스 제공 방법을 도시한 흐름도이다.
도 4는 본 발명의 일 실시예에 따른 지식 정보를 처리하는 모습을 도시한 도면이다.
도 5는 본 발명의 일 실시예에 따른 검색 포털(portal)의 제1화면을 도시한 도면이다.
도 6은 본 발명의 일 실시예에 따른 검색 포털의 제2화면을 도시한 도면이다.
도 7은 본 발명의 일 실시예에 따른 검색 포털의 제3화면을 도시한 도면이다.
도 8은 본 발명의 일 실시예에 따른 검색 포털의 제4화면을 도시한 도면이다.
도 9는 본 발명의 일 실시예에 따른 분석 포털(portal)의 제5화면을 도시한 도면이다.
도 10은 본 발명의 일 실시예에 따른 분석 포털의 제6화면을 도시한 도면이다.
도 11은 본 발명의 일 실시예에 따른 분석 포털의 제7화면을 도시한 도면이다.
도 12는 본 발명의 일 실시예에 따른 분석 포털의 제8화면을 도시한 도면이다.
도 13은 본 발명의 일 실시예에 따른 분석 포털의 제9화면을 도시한 도면이다.
이하, 본 발명에 따른 바람직한 실시 형태를 첨부된 도면을 참조하여 상세하게 설명한다. 첨부된 도면과 함께 이하에 개시될 상세한 설명은 본 발명의 예시적인 실시형태를 설명하고자 하는 것이며, 본 발명이 실시될 수 있는 유일한 실시형태를 나타내고자 하는 것이 아니다. 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략할 수 있고, 명세서 전체를 통하여 동일 또는 유사한 구성 요소에 대해서는 동일한 참조 부호를 사용할 수 있다.
도 1은 본 발명의 일 실시예에 따른 서비스 제공 시스템을 도시한 개략도이다.
본 발명의 일 실시예에 따르면, 서비스 제공 시스템(1)(이하 시스템(1)이라 한다.)은 분산된 지식 정보의 싱글 윈도우(single window) 내 통합 검색 및 사용자 검색 패턴 기반 지식 정보의 추천 서비스를 제공하는 시스템으로, 플랫폼 서버(100), 데이터 베이스(200), 적어도 하나의 사용자 단말(300)을 포함한다.
본 발명의 일 실시예에 따른 플랫폼 서버(100)는 사용자의 검색 패턴이나, 관심도, 검색 목적 등을 분석하여 목표로 하는 지식 정보를 다각적으로 탐색하고, 사용자 별 맞춤 지식 정보를 시각화하여 플랫폼(테크 센싱 플랫폼(Tech Sensing Platform)이라고도 한다.)을 통해 제공하는 서버 장치이다.
본 발명의 일 실시예에 따른 데이터 베이스(200)는 지식 정보가 저장된 저장 장치이다. 데이터 베이스(200)는 저장 위치에 따라 외부 데이터 베이스, 내부 데이터 베이스, 그룹 인프라(group infra) 등으로 구현될 수 있으며, 클라우드나 네트워크 기반으로 구현되거나, 하드웨어 기반으로 구현될 수 있다.
데이터 베이스(200)에 저장되는 지식 정보는 논문(연구 논문, 학술 논문, 산업 전문 데이터 베이스 중심의 문헌 등), 특허, 제품 정보(타사/제품 분석을 위한 정보), 업계 동향 보고서, 시장 보고서, 뉴스, 화학식, 국제규격코드, 내부 보고서(연구노트, 결재문서 등 R&D와 연관된 각종 내부 문서 등) 등 앞서 열거된 바에 한정되지 않고 매우 다양할 수 있으며, 정형/비정형 등 그 지식 정보의 형태를 제한하지 않는다.
본 발명의 일 실시예에 따른 적어도 하나의 사용자 단말(300)은 플랫폼 서버(100)에 의해 구현된 지식 정보의 통합 검색 및 추천을 위한 플랫폼 상에 접속하여 제공되는 지식 정보들을 이용할 수 있는 전자장치로써, 컴퓨터, 노트북, 휴대폰 등으로 구현될 수 있다.
본 발명의 일 실시예에 따르면, 플랫폼 서버(100), 데이터 베이스(200), 사용자 단말(300)은 네트워크(10)를 통해 통신 연결되어, 플랫폼 서버(100)는 사용자 단말(300)의 검색 요청에 따른 지식 정보를 제공하거나, 인공지능/머신러닝 기반 사용자 검색 패턴 학습 및 관심도 분석을 통한 검색 개인화를 수행하고, 그에 기반하여 지식 정보를 추천할 수 있다.
본 발명에서는 목표로 하는 지식 정보를 다각적으로 탐색하여 사용자 별 맞춤 정보 제공을 수행하고, 비정형 정보를 이용하여 사용자 목적 별 분석 환경을 제공할 수 있는 서비스 제공 시스템 및 서비스 제공 방법을 제안한다.
이하, 도면들을 참조하여 본 발명의 일 실시예에 따른 플랫폼 서버(100)의 구성 및 동작에 대해 보다 구체적으로 설명한다.
도 2는 본 발명의 일 실시예에 따른 플랫폼 서버(100)의 구성을 도시한 블록도이다.
본 발명의 일 실시예에 따른 플랫폼 서버(100)는 입력부(110), 통신부(120), 표시부(130), 메모리(140) 및 서버 프로세서(150)를 포함한다.
입력부(110)는 플랫폼 서버(100)의 사용자 입력에 대응하여 입력데이터를 발생시킨다. 예를 들어, 사용자 입력은 테크 센싱 플랫폼을 구현하는데 필요한 사용자 입력 등 분산된 지식 정보의 싱글 윈도우 내 통합 검색 및 사용자 검색 패턴 기반 지식 정보의 추천을 수행하기 위한 사용자 입력인 경우 제한하지 않고 적용 가능하다.
입력부(110)는 적어도 하나의 입력수단을 포함한다. 입력부(110)는 키보드(key board), 키패드(key pad), 돔 스위치(dome switch), 터치패널(touch panel), 터치 키(touch key), 마우스(mouse), 메뉴 버튼(menu button) 등을 포함할 수 있다.
이때, 사용자 입력은 플랫폼 서버(100)에 구비되는 입력부(110)로부터 수신할 수 있으나, 이에 한정되지 않고 복수의 사용자 단말(300에 각각 구비되는 입력부로부터 수신하는 입력 신호일 수 있다. 입력 신호는 후술되는 통신부(120)를 통해 수신할 수 있다.
통신부(120)는 네트워크(10)를 통해 필요한 정보나 신호를 수신하기 위해 데이터 베이스(200), 복수의 사용자 단말(300), 외부 서버 등 외부장치와의 통신을 수행한다. 이를 위해, 통신부(120)는 5G(5th generation communication), LTE-A(long term evolution-advanced), LTE(long term evolution), Wi-Fi(wireless fidelity) 등의 무선 통신 혹은 LAN(local area network), WAN(Wide Area Network), 전력선 통신 등의 유선 통신을 수행할 수 있다.
표시부(130)는 플랫폼 서버(100)의 동작에 따른 표시 데이터를 표시한다. 표시부(130)는 서비스를 제공하기 위해 필요한 표시 데이터, 예를 들어, 사용자의 검색 요청에 대응하여 추출된 지식 정보를 나타내는 화면, 사용자들 간 관심 유사도를 비교 분석하여 추천하는 지식 정보를 나타내는 화면 등을 표시할 수 있다.
표시부(130)는 액정 디스플레이(LCD; liquid crystal display), 발광 다이오드(LED; light emitting diode) 디스플레이, 유기 발광 다이오드(OLED; organic LED) 디스플레이, 마이크로 전자기계 시스템(MEMS; micro electro mechanical systems) 디스플레이 및 전자 종이(electronic paper) 디스플레이를 포함한다. 표시부(130)는 입력부(110)와 결합되어 터치 스크린(touch screen)으로 구현될 수 있다.
메모리(140)는 플랫폼 서버(100)의 동작 프로그램들을 저장한다. 메모리(140)는 전원의 제공 유무와 무관하게 데이터(정보)를 보존할 수 있는 비휘발성 속성의 스토리지(storage)와, 서버 프로세서(150)에 의해 처리되기 위한 데이터가 로딩되며 전원이 제공되지 않으면 데이터를 보존할 수 없는 휘발성 속성의 메모리(memory)를 포함한다. 스토리지에는 플래시메모리(flash-memory), HDD(hard-disc drive), SSD(solid-state drive) ROM(Read Only Memory) 등이 있으며, 메모리에는 버퍼(buffer), RAM(Random Access Memory) 등이 있다.
메모리(140)는 키워드 딕셔너리를 구축, 지식 정보 추출, 시각화, 정보 분석 등의 과정에서 필요한 연산 프로그램 등을 저장할 수 있다.
서버 프로세서(150)는 프로그램 등 소프트웨어를 실행하여 플랫폼 서버(100)의 적어도 하나의 다른 구성요소(예: 하드웨어 또는 소프트웨어 구성요소)를 제어할 수 있고, 다양한 데이터 처리 또는 연산을 수행할 수 있다. 일 실시예에 따르면, 서버 프로세서(150)는 중앙 처리 장치(CPU) 또는 어플리케이션 프로세서 역할을 수행하는 메인 프로세서와 이와는 독립적으로 또는 함께 운영 가능한 그래픽 처리 장치(GPU)를 포함할 수 있다.
서버 프로세서(150)는 사용자 별 검색 요청들을 기반으로 추출한 관심 지식 정보를 이용하여 사용자 별 관심 키워드들을 포함하는 키워드 딕셔너리(keyword dictionary)를 구축하고, 제1사용자의 제1검색 요청을 수신하는 경우, 상기 제1검색 요청에 포함된 키워드 및 상기 제1사용자의 키워드 딕셔너리를 이용하여 상기 제1검색 요청에 대응하는 제1지식 정보를 추출하여 시각화하고, 상기 제1사용자의 키워드 딕셔너리에 포함된 관심 키워드들과 유사한 관심 키워드들을 가지는 적어도 하나의 제2사용자의 검색 이력을 이용하여 제2지식 정보를 추출하여 시각화하고, 타사와 관련하여 마련된 비정형 제3지식 정보를 분석하여 사용자의 목적별 분석 환경을 시각화한다.
한편, 서버 프로세서(150)는 상기 동작들을 수행하기 위한 데이터 분석, 처리, 및 결과 정보 생성 중 적어도 일부를 규칙 기반 또는 인공지능(Artificial Intelligence) 알고리즘으로서 기계학습, 신경망 네트워크(neural network), 또는 딥러닝 알고리즘 중 적어도 하나를 이용하여 수행할 수 있다. 신경망 네트워크의 예로는, CNN (Convolutional Neural Network), DNN (Deep Neural Network), RNN (Recurrent Neural Network)과 같은 모델을 포함할 수 있다.
도 3은 본 발명의 일 실시예에 따른 서비스 제공 방법을 도시한 흐름도이다. 이때, 플랫폼 서버(100)의 동작들은 특별한 언급이 없는 경우를 제외하고는 서버 프로세서(150)에 의해 동작하는 것으로 본다.
본 발명의 일 실시예에 따른 방법은 사용자 별 검색 요청들을 기반으로 추출한 관심 지식 정보를 이용하여 사용자 별 관심 키워드들을 포함하는 키워드 딕셔너리(keyword dictionary)를 구축하는 단계를 포함한다(S10).
본 발명의 일 실시예에 따르면, 플랫폼 서버(100)는 통신부(120)를 통해 사용자 단말(300)로부터 검색 요청(신호의 형태로 수신할 수 있다.)을 수신할 수 있으며, 검색 요청은 사용자 단말(300)을 통해 검색을 요청하기 위한 사용자 입력을 수신하는 것에 기초하여 발생할 수 있다.
플랫폼 서버(100)는 검색 요청에 포함된 적어도 하나의 키워드를 기반으로 데이터 베이스(200)를 통해 지식 정보를 추출할 수 있다. 구체적으로, 플랫폼 서버(100)는 클라우드 인프라(예를 들어, AWS(Amazon Web Services) 클라우드 기반 인프라 등)를 통해 데이터 베이스(200)로부터 지식 정보를 수집할 수 있다. 또한, 플랫폼 서버(100)는 수집한 정형/비정형 지식 정보에 대한 데이터 마이닝(Data Mining)/텍스트 마이닝(Text Mining)을 수행하고, 이로부터 많은 메타 정보(Abstract, 저자 등)를 수집할 수 있다.
키워드 딕셔너리를 구축하는 단계는, 수신한 검색 요청들을 기반으로 추출한 지식 정보(이하, 키워드 딕셔너리 구축 과정에서 추출되는 지식 정보를 편의상 관심 지식 정보라 한다.) 내에 포함된 명사구들을 추출하여 상기 키워드 딕셔너리를 구축하는 단계를 포함한다.
보다 구체적으로, 플랫폼 서버(100)는 사용자 별 검색 요청(쿼리(query))들에 포함된 키워드들을 이용하여 쿼리 집합을 구성한다. 플랫폼 서버(100)는 각 쿼리 집합에 포함된 모든 쿼리를 기반으로 관심 지식 정보를 검색하고, 검색된 관심 지식 정보에 포함된 명사구를 추출한 뒤, 명사구들로 키워드 딕셔너리를 구축한다. 이때, 키워드 딕셔너리는 사용자 별로, 언어 별로 구축될 수 있으며, 언어 별 키워드 딕셔너리를 구축하기 위해 쿼리 집합이나 명사구들은 언어 별로 구성, 추출될 수 있다.
한편, 플랫폼 서버(100)는 명사구들 중 추출 횟수가 높은 기 정의된 수의 명사구들을 관심 키워드들로 설정할 수 있다.
본 발명의 일 실시예에 따르면, 플랫폼 서버(100)는 추후 사용자의 검색 요청들을 추가로 수신함에 따라 구축된 사용자 별 키워드 딕셔너리, 사용자 별 관심 키워드들을 지속적으로 업데이트할 수 있다.
본 발명의 일 실시예에 따른 방법은 제1사용자의 제1검색 요청을 수신하는 경우, 제1검색 요청에 포함된 키워드 및 제1사용자의 키워드 딕셔너리를 이용하여 제1검색 요청에 대응하는 제1지식 정보를 추출하여 시각화하는 단계를 포함한다(S20).
본 발명의 일 실시예에 따르면, 플랫폼 서버(100)는 사용자 별 검색 이력 및 사용자 별 관심도 분석 결과에 따라 검색 결과를 개인화할 수 있다. 이때, 플랫폼 서버(100)는 사용자 별 관심 키워드들에 기초하여 관심도 분석 결과를 식별할 수 있고, 관심도 분석 결과에 따라 사용자 별 키워드 딕셔너리를 업데이트할 수 있다. 이때, 플랫폼 서버(100)는 입력부(110) 또는 사용자 단말(300)을 통해 수신하는 사용자 입력을 통해 키워드 딕셔너리에 포함되는 관심 키워드들을 등록, 수정, 삭제 등의 기능을 추가로 제공할 수 있다.
또한, 추출되는 제1지식 정보의 경우, 문서에만 한정되지 않으며, 이미지도 포함될 수 있다.
본 발명의 일 실시예에 따르면, 추출된 제1지식 정보를 시각화하는 경우, 검색 포털(portal) 상에 구현될 수 있으며, 이에 대한 예시는 도 5 내지 도 8에 도시되어 있다.
본 발명의 일 실시예에 따른 방법은 제1사용자의 키워드 딕셔너리에 포함된 관심 키워드들과 유사한 관심 키워드들을 가지는 적어도 하나의 제2사용자의 검색 이력을 이용하여 제2지식 정보를 추출하여 시각화하는 단계를 포함한다(S30).
본 발명의 일 실시예에 따르면, 플랫폼 서버(100)는 제1사용자와 다른 사용자의 구축된 키워드 딕셔너리를 기반으로 사용자간 관심 키워드 유사도(사용자 간의 유사도라고도 한다.)를 식별할 수 있다. 구체적으로, 유사도 측정을 위해 키워드 딕셔너리에서 추출할 명사구 개수를 지정하고, 각 키워드 딕셔너리에서 지정된 개수만큼의 명사구를 추출한다. 이때, 언어 별로 키워드 딕셔너리가 구축된 경우, 언어 별로 명사구를 추출한다. 추출된 명사구 중 두 사용자 간 겹치는 명사구 개수를 확인하여 사용자 간의 유사도를 확인한다. 언어 별로 명사구를 추출한 경우, 유사도 또한 언어 별로 도출될 것이다.
상기 설명한 내용은 다음 수학식 1에 의해 수식화될 수 있다.
Figure PCTKR2023015897-appb-img-000001
최종적으로, 언어 별로 도출된 유사도 중 가장 높은 값을 두 사용자 간의 유사도로 식별한다. 다만, 이에 한정되지 않으며, 유사도들의 평균값을 이용하거나, 한국어 유사도를 중심으로 유사도를 식별하는 등 다양하게 설정될 수 있다.
플랫폼 서버(100)는 사용자 간 유사도를 이용하여 제1사용자의 키워드 딕셔너리에 포함된 관심 키워드들과 유사한 관심 키워드들을 가지는 적어도 하나의 사용자(제2사용자라 한다.)를 도출한다. 이때, 제2사용자는 제1사용자와 식별한 유사도가 기 정의된 유사도 값을 초과하는 사용자이거나, 혹은 제1사용자와 식별한 유사도가 높은 순으로 기 정의된 수의 사용자로 결정될 수 있으며, 이 외에도 유사도를 이용하여 다양한 방법으로 선정될 수 있다.
플랫폼 서버(100)는 제2사용자의 검색 이력을 이용하여 제2지식 정보를 추출할 수 있으며, 검색 이력은 제2사용자의 검색 요청들, 제2사용자의 검색 요청에 따라 제공된 지식 정보, 제2사용자가 열람한 지식 정보, 제2사용자가 북마크(bookmark)하거나, 코멘트를 남기는 등 검색 포탈을 이용한 모든 이력을 포함할 수 있다.
본 발명의 일 실시예에 따르면, 추출된 제2지식 정보를 이용하여 시각화하는 경우, 검색 포털 상에 구현하거나, 제2지식 정보를 사용자에게 제공하는 등 그 시각화 방법이 다양하게 구현될 수 있다. 이때, 검색 포털 상에 구현되는 예시는 도 5 내지 도 8을 통해 확인할 수 있다.
한편, 추출된 제2지식 정보를 사용자에게 제공하는 경우, 예를 들어, 플랫폼 서버(100)는 기 정의된 주기마다 제2지식 정보 중 제1사용자의 검색 이력 상 식별되지 않는 적어도 하나의 지식 정보를 사용자에게 제공할 수 있다. 이때, 플랫폼 서버(100)는 식별한 지식 정보를 사용자의 메일 주소로 전송하거나, 사용자 단말(300)을 통해 접속한 플랫폼 상에 알림, 쪽지 등으로 전송할 수 있다.
본 발명의 일 실시예에 따른 방법은 타사와 관련하여 마련된 제3지식 정보를 분석하여 사용자의 목적별 분석 환경을 시각화하는 단계를 포함한다(S40).
분석 대상이 되는 제3지식 정보는 정형/비정형의 지식 정보를 제한하지 않으며, 목적별 분석 환경은 경쟁사를 포함하는 타사의 관련 제품의 물성 비교 분석, 관련 특허 키워드 분석, 관련 연구원 분석, 관련 뉴스 키워드 분석 등을 포함할 수 있다.
본 발명의 일 실시예에 따르면, 사용자의 목적별 분석 환경을 시각화하는 경우, 분석 포털(portal) 상에 구현될 수 있으며, 이에 대한 예시는 도 9 내지 도 13에 도시되어 있다.
본 발명의 일 실시예에 따르면, 플랫폼 서버(100)는 S20 내지 S40 단계에서 각각 제1지식 정보, 제2지식 정보 및 목적별 분석 환경을 제공할 수 있으며, 각 단계들은 순서에 구애받지 않고 병렬적으로 수행될 수 있다. 혹은 각 단계에서 설명된 바와 같이, 사용자의 검색 요청을 수신하거나, 기 정의된 주기가 도래하거나, 분석 포털 혹은 검색 포털에 접속하는 사용자 입력을 수신하는 등 해당 상황에서 서비스가 제공될 수 있다.
본 발명의 일 실시예에 따르면, 다각도의 지식 정보 검색을 통해 필요한 지식 정보를 효율적으로 수집할 수 있고, 시장 타당성에 대해 손쉽게 분석하여 연구 과제를 제안할 수 있다.
본 발명의 일 실시예에 따르면, 원하는 최신 지식 정보를 능동적으로 피딩(feeding)받을 수 있으며, 중장기 과제 전략 운영의 민첩성(agility)을 구비할 수 있다.
도 4는 본 발명의 일 실시예에 따른 지식 정보를 처리하는 모습을 도시한 도면이다.
앞서 서술한 바와 같이, 지식 정보는 논문, 특허, 시장 정보, 제품 정보, 내부 자료, 사용자 관련 정보(사용자 기본 정보, 사용자 활동 정보, 사용자 관심 키워드 등) 등을 포함할 수 있다.
본 발명의 일 실시예에 따른 플랫폼 서버(100)는 이를 인공지능/머신러닝 기술과 접목하여 다양한 서비스를 제공할 수 있다.
이하, 지식 정보를 각 인공지능/머신러닝 기술에 기초하여 설계된 모델을 이용하여 제공 가능한 서비스에 대해 설명한다. 이때, 지식 정보 및 모델들은 적어도 하나 이상의 조합으로 이용될 수 있다.
먼저, 일 예로, 플랫폼 서버(100)는 사용자 기본 정보(연구 분야, 소속, 연령대, 성별 등을 포함할 수 있다.), 사용자 활동 정보(검색 요청 등 검색 이력을 포함할 수 있다.)를 이용하여 개별화된 프로파일링(Individual Profiling) 모델을 통해 사용자 별 관심 키워드를 식별하고, 월/분기 등 주기별 키워드 업데이트 등을 수행할 수 있다. 또한, 플랫폼 서버(100)는 이를 기반으로 신규 수집된 지식 정보를 사용자의 관심 키워드 기반으로 피딩할 수 있다.
다른 예로, 플랫폼 서버(100)는 사용자 관심 키워드를 이용하여 유사도 분석(Similarity Analysis) 모델을 통해 유사도 분석을 위한 사용자 별 관심 키워드를 추출할 수 있고, 해당 사용자와 관심도가 유사한 기 정의된 수의 다른 사용자를 식별할 수 있다. 플랫폼 서버(100)는 관심도가 유사한 다른 사용자들의 검색 이력을 기초로 해당 사용자의 검색 이력 상 식별되지 않는 적어도 하나의 지식 정보를 식별하여 해당 사용자에게 피딩할 수 있으며, 관련 사용자들 간 검색 빈도수가 높은 키워드 순으로 인기 검색어 리스트, 검색 빈도수가 높은 지식 정보 순으로 인기 지식 정보 리스트 등을 제공할 수 있다.
다른 예로, 플랫폼 서버(100)는 특허, 논문 등 지식 정보를 클러스터링(Document Clustering) 모델을 이용하여 등고선 맵 등으로 시각화할 수 있다. 등고선 맵에 대한 구체적인 예는 도 13에 도시되어 있는 바, 도 13을 참조하여 설명한다.
다른 예로, 플랫폼 서버(100)는 논문과 특허 등 지식 정보의 키워드 추출(Keyword Extraction), 이미지 크롭핑(Image Cropping) 모델을 이용하여, 분산된 지식 정보 내 포함된 이미지들 및 각 이미지와 관련된 적어도 하나의 키워드를 추출(crop)하고, 추출된 키워드를 각 이미지에 태깅(tagging)할 수 있다.
이는, 추후 플랫폼 서버(100)가 검색 요청 수신 시, 검색 요청에 포함된 키워드가 태깅된 적어도 하나의 이미지를 포함하는 지식 정보를 추출하여 제공하는데 이용될 수 있다. 이에 대한 구체적인 예는 도 8에 도시되어 있는 바, 도 8을 참조하여 설명한다.
다른 예로, 플랫폼 서버(100)는 논문, 특허 등 지식 정보를 이용하여 유사도 분석(Similarity Analysis) 모델을 통해 지식 정보간 유사도 분석을 수행할 수 있다. 특정 지식 정보를 선택하는 사용자 입력을 수신하는 경우, 선택된 지식 정보와 유사도가 높은 적어도 하나의 지식 정보(제5지식 정보라 한다.)를 추출하여 제공할 수 있다. 이때, 지식 정보 간 유사도 분석은 코사인 유사도 분석 방법에 기초하여 수행될 수 있으나, 이에 한정되는 것은 아니다. 이때, 지식 정보 간 유사도 분석에 따른 정보 제공은, 검색 포털 상에서 검색용으로 제공될 수 있고, 분석 포털 상에서 동향 분석용으로 제공될 수 있으며, 포털 특성에 따라 시각화 구현 예가 상이할 수 있다.
다른 예로, 플랫폼 서버(100)는 논문, 특허 등 지식 정보를 이용하여 키워드 빈도수(Keyword Frequency) 모델을 통해, 지식 정보 내 키워드 빈도수를 추출하고, 키워드 동향 분석을 위한 불용어 처리 등 전처리 단계를 수행할 수 있다. 또한, 플랫폼 서버(100)는 키워드 동향을 오름차순, 내림차순, 최신순 등 다양하게 제공할 수 있으며, 나아가 타사 특허 내 키워드 빈도수 등을 제공할 수 있다.
다른 예로, 플랫폼 서버(100)는 시장 정보(뉴스 등) 등 지식 정보를 이용하여 키워드 추출(Keyword Extraction) 모델을 통해 시장 정보의 주요 내용을 추출할 수 있다. 이때, 플랫폼 서버(100)는 주요 내용을 문장 단위로 추출하거나, 문장 단위로 요약할 수 있으며, 시장 정보의 문서 형식에 따라 키워드 추출을 수행하기 위해 OCR(optical character recognition) 기술을 이용할 수 있다.
다른 예로, 플랫폼 서버(100)는 뉴스 등 시장 정보를 이용하여 키워드 분류(Keyword Classification) 모델을 통해 타사별 제품과 연계된 키워드, 주요 문장 등을 추출하여 시각화할 수 있다.
이 외에도, 지식 정보의 종류 및 구현 가능한 모델의 종류에 따라 다양한 서비스를 제공할 수 있으며, 상기 나열한 예에 한정되는 것은 아니다.
본 발명의 일 실시예에 따르면, 다양한 지식 정보에 인공지능/머신러닝 기술을 접목함으로써, 사용자 별 개인화된 지식 정보의 확보 용이성을 획득함과 동시에 사용자 간 협업 기능 기반으로 전반적인 정보 접근성을 확대하고 연구 문화 선진화를 선도할 수 있다.
이하, 도 5 내지 도 13에서 본 발명의 검색 포털 및 분석 포털의 시각화 모습을 도시한다. 다만, 이는 구현예에 지나지 않으며, 시각화 모습의 디자인, 구성, 내용 등을 변형 할 수 있음은 당연하다.
도 5는 본 발명의 일 실시예에 따른 검색 포털의 제1화면을 도시한 도면이다. 도 5의 제1화면(500)은 검색창(510), 최근 검색어 리스트(520), 인기 검색어 리스트(530)를 포함한다.
플랫폼 서버(100)는 사용자 단말(300)을 통해 검색 요청을 수신하는 경우, 검색 요청에 포함된 키워드 및 해당 사용자의 키워드 딕셔너리를 이용하여 검색 요청에 대응하는 지식 정보를 추출한다. 이때, 플랫폼 서버(100)는 사용자 단말(300)을 통해 검색창(510)에 검색어(예: 키워드, 저자, 제목 등) 및 검색 버튼을 입력하는 사용자 입력을 수신하는 것에 기초하여 검색 요청을 수신할 수 있다.
플랫폼 서버(100)는 사용자의 검색 이력을 이용하여 최근 검색어 리스트(520)를 표시할 수 있고, 최근 검색어 리스트(520)는 지속적으로 업데이트될 수 있다.
플랫폼 서버(100)는, 앞서 도 3의 S30과 관련하여 서술한 바와 같이, 사용자 간 유사도를 이용하여 제1사용자의 키워드 딕셔너리에 포함된 관심 키워드들과 유사한 관심 키워드들을 가지는 적어도 하나의 제2사용자(비슷한 연구원)의 검색 이력을 이용하여 제2지식 정보를 추출하여 시각화 할 수 있다.
구체적으로, 플랫폼 서버(100)는 제2지식 정보 중 제1사용자의 관심 키워드들을 포함하고 있는 적어도 하나의 지식 정보 혹은 제2지식 정보에 포함된 키워드들 중 제1사용자의 관심 키워드들과 유사한 적어도 하나의 키워드에 관한 리스트를 제공할 수 있다.
도 5를 참조하면, 플랫폼 서버(100)는 비슷한 연구원들, 혹은 연구소 전체에서 검색한 키워드를 인기 검색어 리스트(530)로 시각화할 수 있다.
도 6은 본 발명의 일 실시예에 따른 검색 포털의 제2화면을 도시한 도면이다.
도 6의 제2화면(600)은 지식 정보 종류 별 검색 탭(610), 검색 결과(620), 검색 필터(630) 등을 포함한다.
검색 탭(610)은 통합 검색 탭, 논문 탭, 특허 탭, 시장 정보 탭, 보고서 탭, 물질 탭, 내부자료 탭, 연구노트 탭, 이미지 탭과 같이 지식 정보 종류별로 구현될 수 있으며, 이에 한정되지 않고, 다른 탭이 추가되거나 2이상의 탭이 통합되는 등 다양하게 구현될 수 잇다.
제2화면(600)은 그 중 논문 탭으로 "polymer"에 대한 검색 요청을 기반으로 검색 결과(620)를 도시한다. 검색 결과는 검색 요청을 기반으로 추출된 지식 정보 들을 연관도 높은 순으로 나열할 수 있으며, 이 외에도 지식 정보의 최신순, 좋아요순(사용자 선호도 순), 조회순으로 나열될 수 있다. 이때, 검색 결과(620)에는 검색된 키워드가 하이라이트 표시될 수 있고, 사용자들은 사용자 단말(300)을 통해 검색 결과(620) 내 리스트된 문헌들을 공유하거나, 북마크 하거나, 좋아요 표시를 할 수 있고, 검색 결과(620) 중 어느 하나를 선택하여 구체적인 내용을 확인할 수 있다. 구체적인 내용을 확인하는 화면은 도 7에 도시된다.
검색 필터(630)는 추출된 지식 정보들을 다시 필터링할 수 있도록, 발행년도, 저널명, 저자명, 연구기관 등의 필터 항목을 포함한다. 또한, 검색 필터(630)의 동향분석 아이콘을 누르는 사용자 입력을 수신하면 해당 검색 요청으로 추출된 지식 정보 간의 동향을 분석할 수 있다. 동향 분석에 관하여는 이하 분석 포털의 화면을 통해 설명한다.
도 7은 본 발명의 일 실시예에 따른 검색 포털의 제3화면을 도시한 도면이다.
도 7의 제3화면(700)은 특정 논문의 내용(710) 및 특정 논문과 유사한 논문(720)을 포함한다.
특정 논문의 내용(710)은 논문 제목, 저자 정보, 저널명 등 서지사항과, 논문의 초록(Abstract), 논문에 포함된 이미지 등 내용을 포함할 수 있다. 이를 위해, 플랫폼 서버(100)는 지식 정보 내의 내용을 추출하여 분석 및 요약할 수 있다. 이는 실시간으로 처리되어 분석 및 요약될 수 있지만, 기 수행되어 메모리(140) 내 구축된 후 호출될 수 있다. 사용자들은 사용자 단말(300)을 통해 검색 결과(620) 내 문헌들을 공유하거나, 북마크 하거나, 좋아요 표시를 할 수 있다.
플랫폼 서버(100)는 해당 논문을 인용하는 논문과, 해당 논문이 인용하는 논문을 식별하여 리스트화할 수 있으며, "Citation" 아이콘을 선택하는 사용자 입력을 수신함에 따라, 이를 표시할 수 있다. 이는, 논문 뿐 아니라 특허에도 적용이 가능하다.
유사한 논문(720)의 경우, 해당 논문과 연관성 있는 논문을 추출하여 리스트화한 것으로, 플랫폼 서버(100)는 지식 정보 내의 키워드, 해당 논문을 열람한 사용자들의 키워드 딕셔너리, 검색 이력 등을 통해 유사한 논문을 식별할 수 있다.
도 8은 본 발명의 일 실시예에 따른 검색 포털의 제4화면을 도시한 도면이다.
도 8의 제4화면(800)은 검색 요청에 기초하여 추출한 지식 정보 중 이미지 검색 결과(810)를 포함한다.
앞서 서술한 바와 같이, 플랫폼 서버(100)는 지식 정보에 포함된 이미지들 및 이미지들과 관련된 적어도 하나의 키워드를 추출하여 각 이미지에 태깅하고, 검색 요청에 포함된 키워드가 태깅된 적어도 하나의 이미지를 포함하는 지식 정보를 추출하여 시각화할 수 있다.
이를 위해, 플랫폼 서버(100)는 머신러닝 기반 키워드 추출(Keyword Extraction), 이미지 크롭핑(Image Cropping) 모델을 이용하여, 분산된 지식 정보 내 포함된 비정형 이미지들 및 각 이미지와 관련된 적어도 하나의 키워드를 추출(crop)하고, 추출된 키워드를 각 이미지에 태깅(tagging)할 수 있다. 플랫폼 서버(100)는 분산된 지식 정보에 포함된 비정형 이미지들에 키워드를 태깅하여 메모리(140)에 비정형 이미지 데이터 베이스를 구축할 수 있다.
도 9는 본 발명의 일 실시예에 따른 분석 포털(portal)의 제5화면을 도시한 도면이다.
도 9의 제5화면(900)은 제품 군에 대한 제조사(타사) 간 관련 제품, 관련 특허, 관련 연구원, 관련 뉴스들의 현황을 나타내는 테이블(910), 분석 탭(920), 제품 분석 내용(930)을 포함한다.
분석 탭(920)은 제품 분석 탭, 특허 분석 탭, 연구원 분석 탭, 뉴스 분석 탭을 포함한다. 이하, 도 9 내지 도 13을 통해 각 탭에 대해 설명한다.
제품 분석 내용(930)은 제품의 선택된 물성을 비교한 그래프, 제품별 물성들을 비교한 테이블 형식으로 시각화될 수 있다.
도 10은 본 발명의 일 실시예에 따른 분석 포털의 제6화면을 도시한 도면이다.
도 10의 제6화면(1000)은 도 9의 제5화면(900)의 분석 탭(920)에서 특허 분석 탭을 선택한 경우 특허 분석 내용(1010)을 도시한다.
특허 분석 내용(1010)으로는 타사의 특허에 포함된 키워드들을 추출 및 분석하여 주요 키워드들을 키워드 클라우드나, Top10 키워드 트렌드, 키워드 순위 등 다양한 방법으로 표시할 수 있으며, 이때 주요 키워드를 언어 별로 나타낼 수 있다. 또한, 타사의 특허들을 관련 정보들을 포함하도록 테이블화하여 표시할 수 있다.
도 11은 본 발명의 일 실시예에 따른 분석 포털의 제7화면을 도시한 도면이다.
도 11의 제7화면(1100)은 도 9의 제5화면(900)의 분석 탭(920)에서 연구원 분석 탭을 선택한 경우 연구원 분석 내용(1110)을 도시한다.
연구원 분석 내용(1110)에는 타사 연구원들의 소속이나, 연구원들이 발명자로 기재된 특허, 논문 등의 지식 정보를 테이블화하여 표시할 수 있다.
도 12는 본 발명의 일 실시예에 따른 분석 포털의 제8화면을 도시한 도면이다.
도 12의 제8화면(1200)은 도 9의 제5화면(900)의 분석 탭(920)에서 뉴스 분석 탭을 선택한 경우 뉴스 분석 내용(1210)을 도시한다.
뉴스 분석 내용(1210)에는 타사와 관련된 뉴스 등 시장 정보를 통해 키워드를 추출 및 분석하여 키워드 circle이나, Top10 키워드 트렌드, 키워드 순위 등 다양한 방법으로 표시할 수 있으며, 이때 주요 키워드를 언어 별로 나타낼 수 있다. 또한, 타사의 시장 정보들과 관련된 정보들을 포함하도록 테이블화하여 표시할 수 있다.
도 13은 본 발명의 일 실시예에 따른 분석 포털의 제9화면을 도시한 도면이다.
도 13의 제9화면(1300)은 특허, 논문 등 지식 정보를 클러스터링한 등고선 맵을 도시한다.
본 발명의 일 실시예에 따르면, 플랫폼 서버(100)는 특허, 논문 등 지식 정보를 클러스터링(Document Clustering) 모델을 이용하여 클러스터링 하고, 이를 등고선 맵으로 시각화할 수 있다.
플랫폼 서버(100)는 지식 정보들을 K-means 벡터, 코사인 유사도 등 유사도 알고리즘을 이용하여 복수의 군집으로 클러스터링할 수 있다. 구체적으로, 플랫폼 서버(100)는 클러스터링 된 군집별 문헌 수, 군집 별 센터 좌표, 주요 키워드, 지식 정보 별 좌표 등을 이용하여 도 13에 도시된 바와 같이 지식 정보들을 클러스터링할 수 있다.

Claims (15)

  1. 플랫폼 서버에 의해 수행되는 분산된 지식 정보의 싱글 윈도우(single window) 내 통합 검색 및 사용자 검색 패턴 기반 지식 정보의 추천을 수행하는 서비스 제공 방법에 있어서,
    사용자 별 검색 요청들을 기반으로 추출한 관심 지식 정보를 이용하여 사용자 별 관심 키워드들을 포함하는 키워드 딕셔너리(keyword dictionary)를 구축하는 단계;
    제1사용자의 제1검색 요청을 수신하는 경우, 상기 제1검색 요청에 포함된 키워드 및 상기 제1사용자의 키워드 딕셔너리를 이용하여 상기 제1검색 요청에 대응하는 제1지식 정보를 추출하여 시각화하는 단계;
    상기 제1사용자의 키워드 딕셔너리에 포함된 관심 키워드들과 유사한 관심 키워드들을 가지는 적어도 하나의 제2사용자의 검색 이력을 이용하여 제2지식 정보를 추출하여 시각화하는 단계;
    타사와 관련하여 마련된 비정형 제3지식 정보를 분석하여 사용자의 목적별 분석 환경을 시각화하는 단계;를 포함하는 서비스 제공 방법.
  2. 제1항에 있어서,
    상기 키워드 딕셔너리를 구축하는 단계는,
    상기 관심 지식 정보 내에 포함된 명사구들을 추출하여 상기 키워드 딕셔너리를 구축하는 단계를 포함하는 서비스 제공 방법.
  3. 제2항에 있어서,
    상기 키워드 딕셔너리를 구축하는 단계는,
    상기 명사구들 중 추출 횟수가 높은 기 정의된 수의 명사구들을 상기 관심 키워드들로 하는 상기 키워드 딕셔너리를 구축하는 단계를 포함하는 서비스 제공 방법.
  4. 제1항에 있어서,
    상기 제1지식 정보를 추출하여 시각화하는 단계는,
    상기 분산된 지식 정보에 포함된 이미지들 및 상기 이미지들과 관련된 적어도 하나의 키워드를 추출하여 각 이미지에 태깅(tagging)하는 단계;
    상기 제1검색 요청에 포함된 키워드가 태깅된 적어도 하나의 이미지를 포함하는 상기 제1지식 정보를 추출하는 단계를 포함하는 서비스 제공 방법.
  5. 제1항에 있어서,
    상기 제2지식 정보를 추출하여 시각화하는 단계는,
    기 정의된 주기마다 상기 제2지식 정보 중 상기 제1사용자의 검색 이력 상 식별되지 않는 적어도 하나의 지식 정보를 사용자에게 제공하는 단계를 포함하는 서비스 제공 방법.
  6. 제1항에 있어서,
    상기 제2지식 정보를 추출하여 시각화하는 단계는,
    상기 제2지식 정보 중 상기 제1사용자의 관심 키워드들을 포함하고 있는 적어도 하나의 지식 정보 혹은 상기 제2지식 정보에 포함된 키워드들 중 상기 제1사용자의 관심 키워드들과 유사한 적어도 하나의 키워드에 관한 리스트를 제공하는 단계를 포함하는 서비스 제공 방법.
  7. 제1항에 있어서,
    상기 제1지식 정보 및 상기 제2지식 정보 중 어느 하나를 선택하는 사용자 입력을 수신하는 경우, 선택된 지식 정보와 유사도가 높은 적어도 하나의 제5지식 정보를 추출하여 시각화하는 단계를 더 포함하는 서비스 제공 방법.
  8. 분산된 지식 정보의 싱글 윈도우(single window) 내 통합 검색 및 사용자 검색 패턴 기반 지식 정보의 추천을 수행하는 플랫폼 서버에 있어서,
    사용자 별 검색 요청들을 기반으로 추출한 관심 지식 정보를 이용하여 사용자 별 관심 키워드들을 포함하는 키워드 딕셔너리(keyword dictionary)를 구축하고,
    제1사용자의 제1검색 요청을 수신하는 경우, 상기 제1검색 요청에 포함된 키워드 및 상기 제1사용자의 키워드 딕셔너리를 이용하여 상기 제1검색 요청에 대응하는 제1지식 정보를 추출하여 시각화하고,
    상기 제1사용자의 키워드 딕셔너리에 포함된 관심 키워드들과 유사한 관심 키워드들을 가지는 적어도 하나의 제2사용자의 검색 이력을 이용하여 제2지식 정보를 추출하여 시각화하고,
    타사와 관련하여 마련된 비정형 제3지식 정보를 분석하여 사용자의 목적별 분석 환경을 시각화하는 서버 프로세서를 포함하는 플랫폼 서버.
  9. 제8항에 있어서,
    상기 서버 프로세서는,
    상기 관심 지식 정보 내에 포함된 명사구들을 추출하여 상기 키워드 딕셔너리를 구축하는 플랫폼 서버.
  10. 제9항에 있어서,
    상기 서버 프로세서는,
    상기 명사구들 중 추출 횟수가 높은 기 정의된 수의 명사구들을 상기 관심 키워드들로 하는 상기 키워드 딕셔너리를 구축하는 플랫폼 서버.
  11. 제8항에 있어서,
    상기 서버 프로세서는,
    상기 분산된 지식 정보에 포함된 이미지들 및 상기 이미지들과 관련된 적어도 하나의 키워드를 추출하여 각 이미지에 태깅(tagging)하고,
    상기 제1검색 요청에 포함된 키워드가 태깅된 적어도 하나의 이미지를 포함하는 상기 제1지식 정보를 추출하는 플랫폼 서버.
  12. 제8항에 있어서,
    상기 서버 프로세서는,
    기 정의된 주기마다 상기 제2지식 정보 중 상기 제1사용자의 검색 이력 상 식별되지 않는 적어도 하나의 지식 정보를 사용자에게 제공하는 플랫폼 서버.
  13. 제8항에 있어서,
    상기 서버 프로세서는,
    상기 제2지식 정보 중 상기 제1사용자의 관심 키워드들을 포함하고 있는 적어도 하나의 지식 정보 혹은 상기 제2지식 정보에 포함된 키워드들 중 상기 제1사용자의 관심 키워드들과 유사한 적어도 하나의 키워드에 관한 리스트를 제공하는 플랫폼 서버.
  14. 제8항에 있어서,
    상기 서버 프로세서는,
    상기 제1지식 정보 및 상기 제2지식 정보 중 어느 하나를 선택하는 사용자 입력을 수신하는 경우, 선택된 지식 정보와 유사도가 높은 적어도 하나의 제5지식 정보를 추출하여 시각화하는 플랫폼 서버.
  15. 분산된 지식 정보의 싱글 윈도우(single window) 내 통합 검색 및 사용자 검색 패턴 기반 지식 정보의 추천을 수행하는 서비스 제공 시스템에 있어서,
    데이터 베이스; 및
    상기 데이터 베이스로부터 사용자 별 검색 요청들을 기반으로 추출한 관심 지식 정보를 이용하여 사용자 별 관심 키워드들을 포함하는 키워드 딕셔너리(keyword dictionary)를 구축하고,
    제1사용자의 제1검색 요청을 수신하는 경우, 상기 제1검색 요청에 포함된 키워드 및 상기 제1사용자의 키워드 딕셔너리를 이용하여 상기 제1검색 요청에 대응하는 제1지식 정보를 추출하여 시각화하고,
    상기 제1사용자의 키워드 딕셔너리에 포함된 관심 키워드들과 유사한 관심 키워드들을 가지는 적어도 하나의 제2사용자의 검색 이력을 이용하여 제2지식 정보를 추출하여 시각화하고,
    타사와 관련하여 마련된 비정형 제3지식 정보를 분석하여 사용자의 목적별 분석 환경을 시각화하는 플랫폼 서버를 포함하는 서비스 제공 시스템.
PCT/KR2023/015897 2022-11-01 2023-10-16 분산된 지식 정보의 싱글 윈도우 내 통합 검색 및 사용자 검색 패턴 기반 지식 정보의 추천을 수행하는 플랫폼 서버, 이를 포함하는 서비스 제공 시스템 및 서비스 제공 방법 WO2024096370A1 (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
KR20220143472 2022-11-01
KR10-2022-0143472 2022-11-01
KR1020230036507A KR20240062887A (ko) 2022-11-01 2023-03-21 분산된 지식 정보의 싱글 윈도우 내 통합 검색 및 사용자 검색 패턴 기반 지식 정보의 추천을 수행하는 플랫폼 서버, 이를 포함하는 서비스 제공 시스템 및 서비스 제공 방법
KR10-2023-0036507 2023-03-21

Publications (1)

Publication Number Publication Date
WO2024096370A1 true WO2024096370A1 (ko) 2024-05-10

Family

ID=90931012

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2023/015897 WO2024096370A1 (ko) 2022-11-01 2023-10-16 분산된 지식 정보의 싱글 윈도우 내 통합 검색 및 사용자 검색 패턴 기반 지식 정보의 추천을 수행하는 플랫폼 서버, 이를 포함하는 서비스 제공 시스템 및 서비스 제공 방법

Country Status (1)

Country Link
WO (1) WO2024096370A1 (ko)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006209222A (ja) * 2005-01-25 2006-08-10 Yamaha Corp ファイル検索装置
JP2007183859A (ja) * 2006-01-10 2007-07-19 Konica Minolta Holdings Inc 情報検索システム、情報検索方法、及び情報管理装置
JP2017091054A (ja) * 2015-11-05 2017-05-25 Necパーソナルコンピュータ株式会社 広告システム及び広告配信方法
KR20170136679A (ko) * 2016-06-01 2017-12-12 주식회사 두두원 빅 데이터 기반 지식 콘텐츠 추천 방법 및 시스템
KR20220003085A (ko) * 2019-12-27 2022-01-07 바이두 온라인 네트웍 테크놀러지 (베이징) 캄파니 리미티드 검색 결과를 결정하는 방법, 장치, 기기 및 컴퓨터 기록 매체
KR102416254B1 (ko) * 2022-02-24 2022-07-06 주식회사 케이엘케이소프트 키워드 기반의 뉴스 리스트 제공 시스템 및 방법

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006209222A (ja) * 2005-01-25 2006-08-10 Yamaha Corp ファイル検索装置
JP2007183859A (ja) * 2006-01-10 2007-07-19 Konica Minolta Holdings Inc 情報検索システム、情報検索方法、及び情報管理装置
JP2017091054A (ja) * 2015-11-05 2017-05-25 Necパーソナルコンピュータ株式会社 広告システム及び広告配信方法
KR20170136679A (ko) * 2016-06-01 2017-12-12 주식회사 두두원 빅 데이터 기반 지식 콘텐츠 추천 방법 및 시스템
KR20220003085A (ko) * 2019-12-27 2022-01-07 바이두 온라인 네트웍 테크놀러지 (베이징) 캄파니 리미티드 검색 결과를 결정하는 방법, 장치, 기기 및 컴퓨터 기록 매체
KR102416254B1 (ko) * 2022-02-24 2022-07-06 주식회사 케이엘케이소프트 키워드 기반의 뉴스 리스트 제공 시스템 및 방법

Similar Documents

Publication Publication Date Title
US20190005141A1 (en) Analyzing Concepts Over Time
WO2011065630A1 (ko) 연구자의 연구정보 분석 장치 및 그 방법 그리고 방법에 관한 컴퓨터가 실행할 수 있는 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체
US20150169710A1 (en) Method and apparatus for providing search results
WO2014069755A1 (ko) 컨텐츠 추천 서비스 제공 시스템 및 방법
JP5492814B2 (ja) 検索装置、検索システム、方法およびプログラム
WO2017115994A1 (ko) 인공 지능 기반 연관도 계산을 이용한 노트 제공 방법 및 장치
WO2021141419A1 (en) Method and apparatus for generating customized content based on user intent
WO2020190103A1 (en) Method and system for providing personalized multimodal objects in real time
WO2021157897A1 (en) A system and method for efficient multi-relational entity understanding and retrieval
EP3685279A1 (en) Method for content search and electronic device therefor
WO2021060920A1 (en) System and method for solving text sensitivity based bias in language model
WO2019164119A1 (ko) 전자 장치 및 그 제어 방법
CN112328806A (zh) 一种数据的处理方法、系统、计算机设备和存储介质
CN114399396A (zh) 保险产品推荐方法、装置、计算机设备及存储介质
WO2017099454A1 (ko) 마인드맵 기반 키워드 검색 방법 및 이를 위한 장치
CN113609308B (zh) 知识图谱构建方法、装置、存储介质及电子设备
WO2019107674A1 (en) Computing apparatus and information input method of the computing apparatus
WO2024096370A1 (ko) 분산된 지식 정보의 싱글 윈도우 내 통합 검색 및 사용자 검색 패턴 기반 지식 정보의 추천을 수행하는 플랫폼 서버, 이를 포함하는 서비스 제공 시스템 및 서비스 제공 방법
WO2014148664A1 (ko) 단어의 의미를 기반으로 하는 다국어 검색 시스템, 다국어 검색 방법 및 이를 이용한 이미지 검색 시스템
CN116992010A (zh) 一种基于多模态大模型的内容分发和交互方法及系统
WO2019112223A1 (ko) 전자 문서 검색 방법 및 그 서버
WO2021107446A1 (ko) 지식 그래프 기반 마케팅 정보 분석 챗봇 서비스 제공 방법 및 그 장치
WO2017105119A1 (ko) 선행기술조사의 분배처리 방법 및 이를 운용하는 서버 및 시스템
WO2019045441A1 (en) METHOD FOR PROVIDING MULTIMODAL PREDICTIONS BASED ON COGNITIVE SEMIOTICS AND ASSOCIATED ELECTRONIC DEVICE
WO2013089390A1 (ko) 콘텐츠의 생성 및 소비에 기반한 개인 정보 제공 시스템