RU2763458C1 - Method for entering and multilevel verification of intensively supplied data in large scientometric information and analytical systems - Google Patents

Method for entering and multilevel verification of intensively supplied data in large scientometric information and analytical systems Download PDF

Info

Publication number
RU2763458C1
RU2763458C1 RU2020140158A RU2020140158A RU2763458C1 RU 2763458 C1 RU2763458 C1 RU 2763458C1 RU 2020140158 A RU2020140158 A RU 2020140158A RU 2020140158 A RU2020140158 A RU 2020140158A RU 2763458 C1 RU2763458 C1 RU 2763458C1
Authority
RU
Russia
Prior art keywords
data
information
results
scientific
analytical system
Prior art date
Application number
RU2020140158A
Other languages
Russian (ru)
Inventor
Валерий Александрович Васенин
Сергей Александрович Афонин
Артем Эдуардович Гаспарянц
Андрей Александрович Зензинов
Original Assignee
Валерий Александрович Васенин
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Валерий Александрович Васенин filed Critical Валерий Александрович Васенин
Priority to RU2020140158A priority Critical patent/RU2763458C1/en
Application granted granted Critical
Publication of RU2763458C1 publication Critical patent/RU2763458C1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

FIELD: information technology.
SUBSTANCE: computer-implemented method for entering and multilevel verification of large scientometric data into an interactive information and analytical system comprises the stages of: unloading the primary data on the results of scientific and technical, development and design, and innovation and technological activities; conducting automatic fuzzy search for duplicates in the preset primary data; conducting automated comparison of the authors of the results of scientific and technical, development design, and innovation and technological activities with the existing authors; affiliating the primary data with the existing objects; saving the primary data and creating a new object in an interactive information and analytical system; automatically verifying a new object.
EFFECT: increase in the quality of preprocessing of the data subject to entering and verification of the entered data.
3 cl, 3 dwg

Description

ОБЛАСТЬ ТЕХНИКИFIELD OF TECHNOLOGY

Настоящее техническое решение относится к области вычислительной техники, в частности к компьютерно-реализуемому способу ввода больших наукометрических данных в интерактивную информационно-аналитическую систему. The present technical solution relates to the field of computer technology, in particular to a computer-implemented method for entering large scientometric data into an interactive information and analytical system.

УРОВЕНЬ ТЕХНИКИBACKGROUND OF THE INVENTION

В сфере науки и высшего образования для поддержки принятия административно-управленческих решений, как правило, используются информационно-аналитические наукометрические системы, именуемые также CRIS-системами (Current Research Information Systems). Такие системы аккумулируют данные о научно-технической, опытно-конструкторской, инновационно-технологической и педагогической деятельности не только организации в целом или отдельным коллективам, но и о результатах отдельных её работников. При решении вопросов административно-управленческого характера, как правило, опираются на аналитические данные по организациям в целом (формирование рейтинговых показателей на разных уровнях, аналитических материалов по отдельным направлениям исследований, отчётных материалов и т.п.), на данные по структурным подразделениям организации и по отдельным работникам (например, конкурсное избрание). Для эффективного и адекватного реалиям решения этих задач необходимо, чтобы перманентно во времени формировалось единое, легко верифицируемое информационное пространство. Такое пространство характеризуется не только тем, что данные верифицированы с использованием всех доступных современных цифровых технологий и административных механизмов, но и тем, что они актуальны, легко воспроизводимы и проверяемы, а также всесторонне отражают научно-техническую, опытно-конструкторскую, инновационно-технологическую деятельность и работу по подготовке соответствующих кадров специалистов субъектами на всех уровнях такой деятельности (организации, коллектива или отдельного работника).In the field of science and higher education, information and analytical scientometric systems, also called CRIS systems (Current Research Information Systems), are usually used to support the adoption of administrative and managerial decisions. Such systems accumulate data on scientific, technical, experimental design, innovative, technological and pedagogical activities not only of the organization as a whole or individual teams, but also on the results of its individual employees. When addressing issues of an administrative and managerial nature, as a rule, they rely on analytical data on organizations as a whole (the formation of rating indicators at different levels, analytical materials in certain areas of research, reporting materials, etc.), on data on structural divisions of the organization and for individual employees (for example, competitive election). To solve these problems effectively and adequately to the realities, it is necessary that a single, easily verifiable information space be formed permanently in time. Such a space is characterized not only by the fact that the data is verified using all available modern digital technologies and administrative mechanisms, but also by the fact that they are relevant, easily reproducible and verifiable, and also comprehensively reflect scientific, technical, developmental, innovative and technological activities. and work on the training of appropriate personnel of specialists by subjects at all levels of such activity (organization, team or individual employee).

Из уровня техники известно решение, выбранное в качестве наиболее близкого аналога, RU 2569363 C1. Данное решение относится к информационным системам, а именно к системам, позволяющим анализировать публикационную и издательскую активность сотрудников научно-образовательных организаций.The prior art solution is chosen as the closest analogue, RU 2569363 C1. This solution refers to information systems, namely to systems that allow analyzing the publication and publishing activity of employees of scientific and educational organizations.

Решение, раскрытое в источнике, направлено на создание автоматизированной информационной системы, позволяющей осуществлять сбор и накопление в разрезе сотрудников организации данных об их публикациях, анализ публикационной активности с различным уровнем детализации, строить настраиваемые пользовательские отчеты в соответствии с формами, предъявляемыми Минобрнауки РФ к результатам интеллектуальной деятельности научно-образовательных организаций. The solution disclosed in the source is aimed at creating an automated information system that allows collecting and accumulating data on their publications in the context of employees of the organization, analyzing publication activity with various levels of detail, building custom reports in accordance with the forms required by the Ministry of Education and Science of the Russian Federation for the results of intellectual activities of scientific and educational organizations.

Предлагаемое решение направлено на устранение недостатков современного уровня техники и отличается от известных решений тем, что предложенный способ, обеспечивает оперативную предобработку вводимых данных и качественную верификацию введенных данных.The proposed solution is aimed at eliminating the shortcomings of the state of the art and differs from the known solutions in that the proposed method provides prompt pre-processing of the input data and high-quality verification of the input data.

СУЩНОСТЬ ИЗОБРЕТЕНИЯSUMMARY OF THE INVENTION

Технической проблемой, на решение которой направлено заявленное решение, является создание компьютерно-реализуемого способа ввода и верификации больших наукометрических данных в интерактивную информационно-аналитическую систему. Дополнительные варианты реализации настоящего изобретения представлены в зависимых пунктах изобретения.The technical problem to be solved by the claimed solution is the creation of a computer-implemented method for input and verification of large scientometric data into an interactive information-analytical system. Additional embodiments of the present invention are presented in dependent claims.

Технический результат заключается в повышении качества предобработки вводимых данных и повышении качества верификации введенных данных. The technical result consists in improving the quality of input data preprocessing and improving the quality of input data verification.

Заявленный результат достигается за счет осуществления компьютерно-реализуемого способа ввода и многоуровневой верификации больших наукометрических данных в интерактивную информационно-аналитическую систему, содержащего этапы, на которых:The claimed result is achieved through the implementation of a computer-implemented method of input and multi-level verification of large scientometric data into an interactive information and analytical system, which contains the steps at which:

выгружают первичные данные о результатах научно-технической, опытно-конструкторской и инновационно-технологической деятельности посредством файла выгрузки и/или посредством интерфейса внешней информационной системы;uploading primary data on the results of scientific and technical, experimental design and innovation and technological activities through the upload file and/or through the interface of an external information system;

осуществляют автоматический нечёткий поиск дубликатов по заранее заданным первичным данным в интерактивной информационно-аналитической системе;carry out an automatic fuzzy search for duplicates according to predetermined primary data in an interactive information and analytical system;

осуществляют автоматизированное сопоставление авторов результатов научно-технической, опытно-конструкторской и инновационно-технологической деятельности с уже существующими авторами в интерактивной информационно-аналитической системе;carry out an automated comparison of the authors of the results of scientific and technical, experimental design and innovation and technological activities with existing authors in an interactive information and analytical system;

осуществляют аффилиацию первичных данных с существующими объектами в интерактивной информационно-аналитической системе;carry out affiliation of primary data with existing objects in an interactive information and analytical system;

сохраняют первичные данные и создают новый объект в интерактивной информационно-аналитической системе;save the primary data and create a new object in the interactive information and analytical system;

осуществляют автоматизированную верификацию нового объекта, созданного в интерактивной информационно-аналитической системе, на разных административных уровнях. carry out automated verification of a new object created in an interactive information-analytical system at different administrative levels.

В частном варианте реализации описываемого способа, в автоматизированном режиме загружают библиометрическую и иную справочную информацию посредством файла выгрузки и/или посредством интерфейса внешней информационной системы.In a particular embodiment of the described method, bibliometric and other reference information is automatically loaded via an upload file and/or via an interface of an external information system.

В частном варианте реализации описываемого способа, в автоматическом режиме верифицируют информацию о результате научно-технической, опытно-конструкторской и инновационно-технологической деятельности посредством интерфейса внешней информационной системы.In a particular embodiment of the described method, information about the result of scientific and technical, experimental design and innovation and technological activities is automatically verified through the interface of an external information system.

В частном варианте реализации описываемого способа, в автоматическом режиме отправляют уведомления о добавлении нового результата научно-технической, опытно-конструкторской и инновационно-технологической деятельности пользователей интерактивной информационно-аналитической системы, являющихся авторами этого результата.In a particular embodiment of the described method, notifications are automatically sent about the addition of a new result of scientific, technical, experimental design and innovation-technological activities to users of the interactive information and analytical system who are the authors of this result.

ОПИСАНИЕ ЧЕРТЕЖЕЙDESCRIPTION OF THE DRAWINGS

Реализация изобретения будет описана в дальнейшем в соответствии с прилагаемыми чертежами, которые представлены для пояснения сути изобретения и никоим образом не ограничивают область изобретения. К заявке прилагаются следующие чертежи:The implementation of the invention will be described hereinafter in accordance with the accompanying drawings, which are presented to explain the essence of the invention and in no way limit the scope of the invention. The following drawings are attached to the application:

Фиг. 1 иллюстрирует блок-схему, представляющую модель ввода данных о результатах научно-технической, опытно-конструкторской, инновационно-технологической и деятельности по подготовке кадров специалистов.Fig. 1 illustrates a block diagram representing a data entry model on the results of scientific and technical, experimental design, innovation and technological and training activities.

Фиг. 2 иллюстрирует блок-схему, представляющую модель многоуровневой верификации данных о результатах научно-технической, опытно-конструкторской, инновационно-технологической и деятельности по подготовке кадров специалистов.Fig. 2 illustrates a block diagram representing a model of multi-level verification of data on the results of scientific and technical, experimental design, innovation and technological and training activities.

Фиг. 3 иллюстрирует схему вычислительного устройства. Fig. 3 illustrates a diagram of a computing device.

ДЕТАЛЬНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯDETAILED DESCRIPTION OF THE INVENTION

В приведенном ниже подробном описании реализации изобретения приведены многочисленные детали реализации, призванные обеспечить отчетливое понимание настоящего изобретения. Однако, квалифицированному в предметной области специалисту, будет очевидно каким образом можно использовать настоящее изобретение, как с данными деталями реализации, так и без них. В других случаях хорошо известные методы, процедуры и компоненты не были описаны подробно, чтобы не затруднять излишне понимание особенностей настоящего изобретения.In the following detailed description of the implementation of the invention, numerous implementation details are provided to provide a clear understanding of the present invention. However, one skilled in the art will appreciate how the present invention can be used, both with and without these implementation details. In other instances, well-known methods, procedures, and components have not been described in detail so as not to unnecessarily obscure the features of the present invention.

Кроме того, из приведенного изложения будет ясно, что изобретение не ограничивается приведенной реализацией. Многочисленные возможные модификации, изменения, вариации и замены, сохраняющие суть и форму настоящего изобретения, будут очевидными для квалифицированных в предметной области специалистов.Furthermore, it will be clear from the foregoing that the invention is not limited to the present implementation. Numerous possible modifications, changes, variations and substitutions that retain the spirit and form of the present invention will be apparent to those skilled in the subject area.

Предлагаемое решение, в рамках большой, по масштабу данных, и сложно организованной наукометрической информационно-аналитической системы обеспечивает ввод, предобработку и хранение максимально полных, верифицированных данных о результатах научно-технической, опытно-конструкторской и инновационно-технологической деятельности участвующих в ней работников, коллективов исполнителей проектов и организаций, которые они представляют, путём использования моделей и программных механизмов преимущественного ввода «снизу-вверх» авторами с последующей их верификацией в автоматическом режиме соавторами, ответственными (уполномоченными от организации) за сопровождение информации в системе. The proposed solution, within the framework of a large, in terms of data scale, and complexly organized scientometric information and analytical system, provides input, preprocessing and storage of the most complete, verified data on the results of scientific, technical, experimental design and innovation and technological activities of employees, teams participating in it project executors and the organizations they represent, by using models and software mechanisms of preferential bottom-up input by the authors, followed by their automatic verification by the co-authors responsible (authorized by the organization) for maintaining information in the system.

Предметная область, в рамках которой используется предлагаемый способ, состоит в интерактивном сборе, предобработке и хранении большого объёма разноплановых данных о результатах научно-технической, опытно-конструкторской, инновационно-технологической и педагогической деятельности субъектов на разных уровнях её организации (проведении), их перманентном анализе и получении интегральных рейтинговых оценок её результативности (эффективности).The subject area within which the proposed method is used consists in the interactive collection, preprocessing and storage of a large amount of diverse data on the results of scientific, technical, experimental design, innovation-technological and pedagogical activities of subjects at different levels of its organization (carrying out), their permanent analysis and obtaining integral rating estimates of its effectiveness (efficiency).

Предлагаемое решение представляет собой способ ввода больших наукометрических данных в интерактивную информационно-аналитическую систему (далее - Система) и их верификации на нескольких взаимодополняющих друг друга административных уровнях организации научно-технической, опытно-конструкторской, инновационно-технологической и деятельности по подготовке для неё кадров, реализованный в виде программного средства Системы.The proposed solution is a way to enter large scientometric data into an interactive information and analytical system (hereinafter referred to as the System) and verify them at several mutually complementary administrative levels of organization of scientific and technical, experimental design, innovation and technological and personnel training activities for it, implemented as a software tool of the System.

Субъектами предлагаемого решения являются пользователи Системы, взаимодействующие с ней в интерактивном режиме с целью ввода и верификации данных: инициаторы ввода; соавторы результата деятельности, который вводится в систему инициатором; работники, ответственные за сопровождение Системы от структурных подразделений организации, работником которой является инициатор.The subjects of the proposed solution are the users of the System who interact with it in an interactive mode in order to enter and verify data: the initiators of the entry; co-authors of the result of the activity, which is entered into the system by the initiator; employees responsible for maintaining the System from structural subdivisions of the organization, of which the initiator is an employee.

Взаимодействие субъектов в процессах ввода и верификации осуществляется посредством использования программно-аппаратных механизмов (интерфейсов), реализующих предлагаемый способ.The interaction of subjects in the input and verification processes is carried out through the use of software and hardware mechanisms (interfaces) that implement the proposed method.

Предметные положения, характеризующие способ.Subject provisions characterizing the method.

1. Информационно-аналитические наукометрические системы в их широком понимании рассматриваются как инструментальные средства поддержки принятия управленческих решений в сфере научно-технической, опытно-конструкторской, инновационно-технологической и деятельности по подготовке для неё кадров специалистов.1. Information-analytical scientometric systems in their broadest sense are considered as tools to support managerial decision-making in the field of scientific and technical, experimental design, innovation and technological activities and training specialists for it.

2. Для решения различных вопросов управленческого характера (стимулирование эффективной работы, деятельности на приоритетных направлениях и т.д.) требуются аналитические данные на разных административных уровнях: организация; структурное подразделение; научный коллектив; отдельный работник.2. To solve various issues of a managerial nature (stimulating effective work, activities in priority areas, etc.), analytical data is required at different administrative levels: organization; structural subdivision; scientific team; individual worker.

3. Ввод и верификация — одна из ключевых компонент Системы для формирования максимально полного и верифицированного информационного пространства.3. Input and verification is one of the key components of the System for the formation of the most complete and verified information space.

4. Большое разнообразие видов результатов подлежащей учету деятельности, форматов и источников данных, которые их характеризуют, а также интенсивность их ввода.4. A wide variety of types of results of activities to be recorded, formats and data sources that characterize them, as well as the intensity of their input.

5. Полнота (презентативность) данных, необходимая для состоятельности результатов их анализа, обеспечивается регулярным стимулированием (различные конкурсные процедуры, премии и т.п.), которое, в свою очередь, требует их надёжной верификации.5. The completeness (representativeness) of the data necessary for the validity of the results of their analysis is ensured by regular incentives (various competitive procedures, awards, etc.), which, in turn, require their reliable verification.

Схема формирования верифицированного информационного пространства.Scheme for the formation of a verified information space.

Для того, чтобы данные можно было использовать для решения административно-управленческих вопросов, они должны быть: верифицированы на этапе их ввода и аккумулирования в базе данных Системы; актуальны во времени, легко восстанавливаемы на всех нижележащих административных уровнях (вплоть до персонального), на которых они формируются; полны.In order for the data to be used for solving administrative and managerial issues, they must be: verified at the stage of their entry and accumulation in the System database; relevant in time, easily restored at all lower administrative levels (up to the personal level), at which they are formed; are full.

Обеспечение полноты и актуальности данных требует наличия постоянных стимулирующих ввод данных факторов (конкурсные процедуры, поощрительные надбавки, и другие). В основе существующих стимулирующих процедур лежат механизмы рейтинговых оценок. Для того, чтобы такие оценки были объективны и корректны, используемые для их расчёта данные должны быть верифицированы и актуальны. Следует отметить, что рейтинговые оценки носят предварительный характер и не заменяют проведение экспертизы. Окончательно рейтинговые оценки эффективности (результативности) должны формироваться на основе предварительных рейтинговых оценок с учетом результатов их обсуждения коллегией опытных экспертов.Ensuring the completeness and relevance of data requires the presence of constant factors stimulating data entry (competitive procedures, incentive bonuses, and others). The existing incentive procedures are based on the mechanisms of rating assessments. In order for such estimates to be objective and correct, the data used to calculate them must be verified and up-to-date. It should be noted that the ratings are preliminary and do not replace the examination. The final ratings of efficiency (performance) should be formed on the basis of preliminary ratings, taking into account the results of their discussion by a panel of experienced experts.

В качестве базовых принципов использования наукометрии для оценки научно-технической, опытно-конструкторской, инновационно-технологической и деятельности по подготовке кадров специалистов, целесообразно руководствоваться положениями Лейденского манифеста, принятого международным научным сообществом в области наукометрии в 2014 г.As the basic principles for the use of scientometrics for the evaluation of scientific and technical, experimental design, innovation and technological and training activities, it is advisable to be guided by the provisions of the Leiden Manifesto, adopted by the international scientific community in the field of scientometrics in 2014.

1. Количественная оценка деятельности отдельного работника является лишь отправной для последующей её оценки коллегией экспертов.1. The quantitative assessment of the activity of an individual employee is only the starting point for its subsequent assessment by a panel of experts.

2. Подлежащая оценке научная и образовательная деятельность и соответствующие индикаторы должны выбираться с учётом целевых установок и особенностей её организации в тех или иных областях знания.2. The scientific and educational activity to be assessed and the corresponding indicators should be selected taking into account the goals and peculiarities of its organization in certain fields of knowledge.

3. Методы оценки деятельности должны учитывать национальные и региональные особенности, в первую очередь — целевые установки её организации.3. Methods for evaluating activities should take into account national and regional characteristics, primarily the goals of its organization.

4. Процессы сбора данных и их анализа должны быть открытыми, прозрачными и простыми для понимания и возможности их воспроизведения.4. Data collection and analysis processes should be open, transparent and easy to understand and replicate.

5. В Системе должны присутствовать механизмы, предоставляющие возможности работникам, деятельность которых оценивается, проверять и анализировать данные, которые положены в основу оценки.5. The System should have mechanisms that enable employees whose performance is being assessed to verify and analyze the data that form the basis of the assessment.

6. Методы оценки должны учитывать тот факт, что научные дисциплины отличаются друг от друга по практике публикаций и цитирования.6. Evaluation methods should take into account the fact that scientific disciplines differ from each other in publication and citation practices.

7. Количественная оценка отдельных работников должна учитывать их индивидуальные особенности, включая возраст, стаж работы, особенности области знания и другие.7. The quantitative assessment of individual employees should take into account their individual characteristics, including age, length of service, specifics of the field of knowledge, and others.

8. Методы оценки должны быть избавлены от индикаторов, незначительно влияющих на целевые установки и конечный результат.8. Evaluation methods should be free from indicators that have little effect on targets and the final result.

9. Стимулирующее воздействие оценки должно соответствовать целевым установкам, сложившимся на настоящее время.9. The enabling impact of the evaluation should be in line with the current goals.

10. Проверка индикаторов на их соответствие целям и задачам Системы должна быть перманентной.10. Checking indicators for their compliance with the goals and objectives of the System should be permanent.

С целью унификации и приближения способов ввода и верификации Системы к международным стандартам и требованиям, они должны быть ориентированы на реализацию перечисленных принципов.In order to unify and bring the methods of entering and verifying the System closer to international standards and requirements, they should be focused on the implementation of the listed principles.

1. При сборе и верификации данных в больших наукометрических коллекциях предпочтение следует отдавать восходящим потокам их поступления, основанным на персональном или коллективном интересе источника данных.1. When collecting and verifying data in large scientometric collections, preference should be given to ascending flows of their receipt, based on the personal or collective interest of the data source.

2. Процессы сбора и верификации данных должны рационально сочетать не только приоритетные восходящие «снизу-вверх», но и нисходящие «сверху вниз» (из агрегированных данных к составляющим их индивидуальным) потоки.2. The processes of collecting and verifying data should rationally combine not only priority ascending “bottom-up”, but also descending “top-down” (from aggregated data to individual constituents) flows.

3. Процессы сбора и верификации должны основываться на рациональном (сбалансированном) сочетании для отдельных работников и для коллективов стимулов как принудительного (приказного, обязывающего) характера, так и стимулов, основанных на персональном и/или коллективном интересе.3. The processes of collection and verification should be based on a rational (balanced) combination for individual employees and for teams of incentives, both of a coercive (mandatory, binding) nature, and incentives based on personal and / or collective interest.

4. Методы и, соответственно, индикаторы и метрики оценки эффективности результатов деятельности научного работника, должны в сбалансированном режиме включать и составляющие, характеризующие результаты его деятельности в подготовке кадров специалистов в соответствующей области науки и, наоборот, для педагогов — результаты их научной деятельности.4. Methods and, accordingly, indicators and metrics for evaluating the effectiveness of the results of a researcher’s activities should include, in a balanced mode, the components that characterize the results of his activities in the training of specialists in the relevant field of science and, conversely, for teachers, the results of their scientific activities.

5. Методы оценки эффективности результатов субъектов научной деятельности (и персональной, и коллективов) должны должным образом учитывать её инновационную составляющую.5. Methods for assessing the effectiveness of the results of the subjects of scientific activity (both personal and collective) should properly take into account its innovative component.

6. При соблюдении принципов прозрачности (транспарентности) данных общего характера для «широкого» научно-образовательного сообщества в соответствии с положениями нормативно-законодательной базы РФ, механизмы Системы должны гарантировать:6. Subject to the principles of transparency (transparency) of general data for the "broad" scientific and educational community in accordance with the provisions of the regulatory and legislative framework of the Russian Federation, the mechanisms of the System must guarantee:

• каждому ученому и педагогу конфиденциальный статус (конфиденциальность) данных персонального характера, а также информации, которая составляет оценку его личной профессиональной деятельности;• to each scientist and teacher the confidential status (confidentiality) of personal data, as well as information that constitutes an assessment of his personal professional activity;

• каждой организации и органу государственного управления конфиденциальность агрегированных данных, которые не подлежат разглашению, в том числе — положениями документов локального и ведомственного уровня.• confidentiality of aggregated data that is not subject to disclosure to each organization and government body, including the provisions of documents at the local and departmental levels.

7. Механизмы и данные в Системе в первоочередном порядке должны быть ориентированы на учёт национальных особенностей, интересов и стратегических целевых установок на развитие научного и образовательного потенциала России, а также вытекающих отсюда задач каждой отдельной организации.7. The mechanisms and data in the System, as a matter of priority, should be focused on taking into account national characteristics, interests and strategic targets for the development of the scientific and educational potential of Russia, as well as the tasks of each individual organization that follow from this.

8. В основе методологии создания, становления, сопровождения (эксплуатации) и развития Системы должен лежать принцип, позволяющий одновременно:8. The methodology for creating, establishing, maintaining (operating) and developing the System should be based on the principle that simultaneously allows:

• создавать математическое, алгоритмическое и программное обеспечение отдельных функционально замкнутых, новых компонентов и блоков Системы;• create mathematical, algorithmic and software for individual functionally closed, new components and blocks of the System;

• обеспечивать доведение вновь вводимых компонентов и блоков Системы до состояния их функциональной самодостаточности и востребованности на практике;• ensure bringing newly introduced components and blocks of the System to the state of their functional self-sufficiency and demand in practice;

• сопровождать Систему в процессе решения практических задач, на основе анализа результатов эксплуатации обеспечивать ее модернизацию (рефакторинг, реинжиниринг) без потери уже присутствующих функциональных возможностей.• to accompany the System in the process of solving practical problems, to ensure its modernization (refactoring, reengineering) based on the analysis of the results of operation without losing the functionality already present.

С учётом изложенных выше принципов в качестве базовых требований к способам, которые должны использоваться в механизмах ввода и верификации, рассматриваются следующие далее.With the above principles in mind, the following are considered as basic requirements for methods to be used in entry and verification mechanisms.

• Авторы вводимых в Систему результатов деятельности могут и должны участвовать в процессах ввода и верификации данных (ввод «снизу-вверх»).• The authors of the results of activities entered into the System can and should participate in the processes of data entry and verification (bottom-up entry).

• Во избежание появления дополнительных сложностей верификации (ошибки при вводе, дубликаты и т.п.) данные о каждом отдельном результате деятельности достаточно ввести один раз («однократный ввод»).• In order to avoid additional verification difficulties (entry errors, duplicates, etc.), it is sufficient to enter data on each individual activity result once (“single entry”).

• В процессах верификации должны активно использоваться данные, полученные «сверху вниз» из заслуживающих доверия хранилищ данных (каталогов, баз данных и т.п.).• Verification processes should actively use top-down data from trusted data repositories (catalogs, databases, etc.).

• Подсистема должна позволять вводить результаты как научно-технической, опытно-конструкторской, инновационно-технологической, так и деятельности по подготовке высококвалифицированных кадров для соответствующей области знания.• The subsystem should allow entering the results of both scientific and technical, experimental design, innovation and technological, as well as activities for the training of highly qualified personnel for the relevant field of knowledge.

Требования к процессам взаимодействия пользователя с Системой, к моделям и программному интерфейсу на этапе ввода и верификации данныхRequirements for the processes of user interaction with the System, for models and software interface at the stage of data entry and verification

• Модель и реализующий её интерес интерфейс должен позволять в визуально понятной пользователю форме вводить информацию о результате.• The model and the interface realizing its interest should allow entering information about the result in a visually understandable form for the user.

• Связанные с результатом пользователи (соавторы) должны иметь возможность автоматически получить, проверить и скорректировать введённую информацию.• Users associated with the result (co-authors) should be able to automatically receive, check and correct the entered information.

• Ответственные за сопровождение информации в Системе по месту работы автора или соавторов при проверке правильности введённых данных и перед подтверждением этих данных с их стороны должны иметь возможность скорректировать информацию о результате самостоятельно или попросить сделать это автора.• Those responsible for maintaining information in the System at the place of work of the author or co-authors, when checking the correctness of the entered data and before confirming these data on their part, should be able to correct the information about the result on their own or ask the author to do this.

• При добавлении результата деятельности в Систему должна проводиться проверка на его отсутствие в Системе.• When adding a result of an activity to the System, it should be checked for its absence in the System.

• Если структура информации о результате деятельности предусматривает связь с другими объектами Системы, то интерфейсные механизмы должны предоставить возможность определить, существуют ли в Системе такие объекты.• If the structure of information about the result of activity provides for a connection with other objects of the System, then interface mechanisms should provide an opportunity to determine whether such objects exist in the System.

• При наличии технической возможности интерфейс должен позволять загрузить данные для формы из внешних систем по заданному идентификатору результата в этих системах. Это, однако, не отменяет необходимости проверки на дубликаты и сопоставления авторов.• If technically possible, the interface should allow loading data for the form from external systems by a given result identifier in these systems. This, however, does not eliminate the need for duplicate checking and author matching.

• Программный интерфейс должен быть непротиворечив с позиции тезауруса (основных определений), принятого в Системе на этапе её проектирования.• The programming interface must be consistent with the position of the thesaurus (basic definitions) adopted in the System at the stage of its design.

• Программные механизмы, реализующие процессы ввода и верификации данных, должны препятствовать деструктивным и нерегламентированным воздействиям на данные со стороны лиц, не имеющих на это полномочий.• Software mechanisms that implement data entry and verification processes should prevent destructive and unregulated influences on data by unauthorized persons.

Модели проблемной области.Problem domain models.

Модель результата научно-технической, опытно-конструкторской, инновационно-технологической и педагогической деятельности.Model of the result of scientific and technical, experimental design, innovation-technological and pedagogical activities.

Модель информации о результате научно-технической, опытно-конструкторской, инновационно-технологической и педагогической деятельности в общем виде может быть представлена следующим образом:The model of information about the result of scientific, technical, experimental design, innovation, technological and pedagogical activities in general can be represented as follows:

• сведения об авторах результата (ФИО, контактные данные, аффилиации);• information about the authors of the result (name, contact details, affiliations);

• связи результата с другими сущностями (гранты, диссертации, использование оборудования и т.п.);• connection of the result with other entities (grants, dissertations, use of equipment, etc.);

• выходные данные результата;• the output of the result;

• содержательное описание результата (название, аннотации, ключевые слова, полный текст и др.);• meaningful description of the result (title, annotations, keywords, full text, etc.);

• вторичные аналитические данные о результате, которые появились после того, как результат был зарегистрирован (показатели цитируемости, доля некорректных заимствований, иные аналитические данные).• secondary analytical data about the result that appeared after the result was registered (quotation rates, the proportion of incorrect borrowings, other analytical data).

Источники информации об атрибутах, характеризующих различные виды результатов деятельностиSources of information about attributes that characterize various types of performance results

Для каждого вида результатов деятельности можно выделить несколько основных источников информации об атрибутах, которые их сопровождают (характеризуют). For each type of performance results, several main sources of information about the attributes that accompany (characterize) them can be distinguished.

Результаты, как правило, регистрируются в изданиях (публикации), базах данных (патенты, авторские свидетельства) или официальных документах (чтение учебных курсов отражается в учебном плане). В таких источниках фиксируются основные сведения о результате (обычно в текстовом виде), а также ему может быть присвоен регистрационный номер. Такого типа источники могут использоваться при проверке корректности сведений, в первую очередь, о выходных данных.The results are usually recorded in publications (publications), databases (patents, copyright certificates) or official documents (reading of training courses is reflected in the curriculum). In such sources, basic information about the result is recorded (usually in text form), and a registration number can also be assigned to it. Sources of this type can be used to check the correctness of information, primarily about the output data.

Для некоторых видов результатов могут существовать дополнительные источники данных, которые могут быть получены путём обработки первичных данных о результате. Примером такого источника может являться библиометрическая индексирующая система, которая получает данные непосредственно от издательств, индексирует их и производит новую информацию – импакт-факторы журналов, данные о цитированиях публикаций и другие. В качестве другого примера источника данных пост-обработки результатов можно выделить систему поиска некорректных заимствований «Антиплагиат» и её аналоги.For some types of outcomes, there may be additional data sources that can be obtained by processing the primary outcome data. An example of such a source can be a bibliometric indexing system that receives data directly from publishers, indexes them and produces new information - journal impact factors, publication citation data, and others. As another example of a data source for post-processing of results, we can single out the Anti-Plagiarism search engine for incorrect borrowings and its analogues.

Для описанных выше типов источников могут быть доступны программные механизмы для поиска и проверки данных. Если есть подобный API и имеется доступ к этому интерфейсу, то возможна автоматическая проверка данных. Если такого интерфейса нет, то возможна ручная проверка (проверка по документам, проверка по официальному сайту источника).For the types of sources described above, software mechanisms for searching and validating data may be available. If there is a similar API and there is access to this interface, then automatic data validation is possible. If there is no such interface, then manual verification is possible (checking according to documents, checking on the official website of the source).

Второй тип источника сведений о результате – его авторы, которые непосредственно принимали участие в получении результата и осуществлять проверку связей этого результата с профилями его соавторов. В большинстве случаев авторы также принимают участие в процессе верификации во время ввода, которая отмечалась выше.The second type of source of information about the result is its authors, who were directly involved in obtaining the result and check the links of this result with the profiles of its co-authors. In most cases, authors also take part in the verification process at the time of entry, which was noted above.

Третьим типом источника может служить сама организация или структурное подразделение этой организации в лице уполномоченного представителя, являющегося пользователем системы, который сможет проверить, насколько полученный результат соотносится с исследованиями подразделения или проверить наличие в статье указанной аффилиации автора с организацией. Кроме того, таким уполномоченным пользователям могут быть доступны сведения о данных всей организации или подразделения, и они могут проводить дополнительные проверки и корректировку данных с представлением об общей картине деятельности. К этому типу источника также могут относиться внутренние информационные системы и базы данных организации, например, система учёта кадров.The third type of source can be the organization itself or a structural subdivision of this organization represented by an authorized representative who is a user of the system, who can check how the result relates to the research of the subdivision or check whether the article contains the specified affiliation of the author with the organization. In addition, these authorized users may have access to data across the entire organization or department, and they may perform additional checks and corrections on the data with a view of the big picture of activity. This type of source can also include internal information systems and databases of the organization, for example, a personnel accounting system.

Каждый из обозначенных выше типов источников обладает уникальной информацией о результате, которой нет у остальных, или они не являются её первоисточником. Each of the above types of sources has unique information about the result, which the others do not have, or they are not its primary source.

Ввод информации о результате и первичная верификация.Entering information about the result and primary verification.

Ввод информации о результате предполагает использование данных из источников и может быть реализован с разной степенью автоматизации, в зависимости от возможностей конкретных источников.Entering information about the result involves the use of data from sources and can be implemented with varying degrees of automation, depending on the capabilities of specific sources.

1. Ввод/выгрузка первичных данных.1. Input / upload of primary data.

Этот этап предполагает ввод информации без создания связей с другими объектами системы (Фиг. 1, поз.1.1-1.4). Первичные данные подвергаются автоматическому разбору цепочкой парсеров, которые запускаются последовательно до тех пор, пока один из них не получит разобранные данные или ни один из парсеров не сможет завершить разбор. Основные поддерживаемые парсерами форматы: DOI, JSON, XML, HTML, BibTeX, библиографические ссылки.This stage involves entering information without creating links with other objects of the system (Fig. 1, pos.1.1-1.4). Primary data is automatically parsed by a chain of parsers that run sequentially until one of them receives the parsed data or none of the parsers can complete the parsing. The main formats supported by parsers are: DOI, JSON, XML, HTML, BibTeX, bibliographic references.

1. Если задан идентификатор DOI, то производится запрос к API официального регистратора DOI Crossref. Результатом запроса являются мета-данные результата в формате JSON, которые содержат информацию, полученную от регистрирующего источника, например, издательства.1. If a DOI identifier is specified, then a request is made to the API of the official DOI Crossref registrar. The result of the request is result meta data in JSON format, which contains information received from the registering source, such as a publisher.

2. Библиометрические и библиографические информационные системы, как правило, позволяют экспортировать данные в различных форматах. Стандартным форматом библиографических данных является BibTeX и MODS XML, для работы с которыми существует набор утилити bibutils. Эти утилиты позволяют переводить библиографические данные между этими и другими форматами библиометрических данных (RIS, EndNote, Pubmed XML, ISI, Word и др). С помощью bibutils данные переводятся в формат MODS XML, а затем разбираются парсером.2. Bibliometric and bibliographic information systems, as a rule, allow exporting data in various formats. The standard format for bibliographic data is BibTeX and MODS XML, for which there is a set of bibutils utilities. These utilities allow you to translate bibliographic data between these and other bibliometric data formats (RIS, EndNote, Pubmed XML, ISI, Word, etc.). With the help of bibutils, the data is converted into the MODS XML format, and then parsed by the parser.

3. Если первичные данные передаются в виде библиографической ссылки, то они автоматически разбираются с использованием сервиса FreeCite. Этот сервис позволяет проводить дообучение алгоритма разбора по результатам пользовательской оценки.3. If the primary data is transmitted as a bibliographic reference, then it is automatically parsed using the FreeCite service. This service allows you to further train the parsing algorithm based on the results of user evaluation.

Описанный подход является модульным и позволяет разрабатывать и подключать дополнительные модули загрузки и обработки первичных данных о результатах. Предусмотрен также программный интерфейс для автоматизации процедуры ручного заполнения автором формы с первичными данными. The described approach is modular and allows you to develop and connect additional modules for loading and processing primary data on the results. A programming interface is also provided for automating the procedure for manually filling out the form with primary data by the author.

2. Проверка существования дубликатов.2. Checking for the existence of duplicates.

По заданным первичным данным производится автоматический нечёткий поиск дубликатов (Фиг. 1, поз. 1.5-1.6). Нечеткий поиск — это поиск информации, при котором выполняется сопоставление информации заданному образцу поиска или близкому к этому образцу значению. В случае нахождения дубликатов добавления результата в Систему не производится. В зависимости от типа результата могут использоваться различные алгоритмы поиска дубликатов. За основу может быть использован следующий алгоритм. Если среди атрибутов результата есть его уникальные идентификаторы (DOI или идентификатор во внешней системе), то в первую очередь производится проверка на существование дубликатов с этими же идентификаторами. Дальнейший поиск дубликатов реализуется с помощью нечёткого поиска по таким атрибутам, как название результата, название источника, имена авторов и т.д.According to the given primary data, an automatic fuzzy search for duplicates is performed (Fig. 1, pos. 1.5-1.6). Fuzzy search is a search for information in which information is compared to a given search pattern or a value close to this pattern. If duplicates are found, the result is not added to the System. Depending on the type of result, different algorithms for finding duplicates can be used. The following algorithm can be used as a basis. If among the result attributes there are its unique identifiers (DOI or an identifier in an external system), then, first of all, a check is made for the existence of duplicates with the same identifiers. Further search for duplicates is implemented using a fuzzy search for attributes such as the name of the result, the name of the source, the names of authors, etc.

3. Автоматическое сопоставление авторов с пользователями.3. Automatic comparison of authors with users.

На данном этапе информация об авторах предоставляется в текстовом виде и необходимо произвести сопоставление авторов результата с существующими авторами в Системе, часть из которых может являться пользователями. В силу того, что первичная информация может содержать различные вариации имён, инициалов, а также в силу наличия однофамильцев, необходимо учитывать предыдущие совместные упоминания авторов. Информация об авторах передаётся для разбора сервису, основанному на разработанном авторами алгоритме разрешения неоднозначностей в сопоставлении авторов по графу соавторств. Алгоритм заключается в том, что каждому автору нового результата можно сопоставить некоторый набор существующих авторов в Системе на основе текстовой близости между их именами и именами авторов добавляемого результата. Функция текстовой близости может учитывать варианты транслитерации, опечатки, сокращенные или опущенные части имени, а также другие модификации. Оптимальным решением является такой набор авторов, на котором достигается максимальное значение функции качества. Результатом работы алгоритма являются наборы сопоставлений имён авторов и идентификаторов существующих авторов в Системе (Фиг. 1, поз. 1.7).At this stage, information about the authors is provided in text form, and it is necessary to compare the authors of the result with the existing authors in the System, some of whom may be users. Due to the fact that the primary information may contain various variations of names, initials, and also due to the presence of namesakes, it is necessary to take into account the previous joint mentions of the authors. Information about the authors is transmitted for parsing to a service based on the author-developed algorithm for resolving ambiguities in matching authors according to the graph of co-authorships. The algorithm lies in the fact that each author of a new result can be associated with a certain set of existing authors in the System based on the text proximity between their names and the names of the authors of the added result. The text proximity function can take into account transliteration variations, typos, abbreviated or omitted parts of the name, and other modifications. The optimal solution is such a set of authors, which achieves the maximum value of the quality function. The result of the algorithm is a set of comparisons of the names of authors and identifiers of existing authors in the System (Fig. 1, pos. 1.7).

4. Аффилиации результата с другими объектами в Системе.4. Affiliations of the result with other objects in the System.

Под данным признаком понимается установление связей между объектами. Кроме авторов результат может быть связан с другими объектами Системы, например, журналами, сборниками статей или конференциями. По представленной в первичных данных текстовой информации нужно найти подходящие объекты соответствующего типа (Фиг. 1, поз. 1.8). Если объект найден в Системе, то производится сопоставление, если объект не найден, то создаётся новый объект. В некоторых случаях автоматическое создание нового объекта нежелательно, тогда вместо создания объекта будет открываться заявка на добавление такого объекта в Систему. Подобные заявки могут рассматриваться администраторами Системы. Например, существует объект типа «журнал», при вводе статьи производится поиск журналов по выходным данным, если объект типа «журнал» с такими же выходными данными (ISSN, название) найден, то устанавливается связь с ним. Если не найден, то открывается заявка на добавление журнала с такими выходными данными, которую рассматривают администраторы Системы.This sign refers to the establishment of links between objects. In addition to authors, the result can be associated with other objects of the System, for example, journals, collections of articles or conferences. According to the textual information presented in the primary data, it is necessary to find suitable objects of the corresponding type (Fig. 1, pos. 1.8). If the object is found in the System, then a comparison is made, if the object is not found, then a new object is created. In some cases, the automatic creation of a new object is undesirable, then instead of creating an object, an application will be opened to add such an object to the System. Such applications may be considered by the System administrators. For example, there is an object of type "journal", when entering an article, journals are searched for by output data, if an object of type "journal" with the same output data (ISSN, title) is found, then a connection is established with it. If not found, then a request for adding a journal with such output data is opened, which is considered by the System administrators.

5. Сохранение результата и оповещение пользователей.5. Saving the result and notifying users.

Создаётся новый объект в Системе, соответствующий добавляемому результату (Фиг. 1, поз. 1.9). Авторам результата, которые зарегистрированы в Системе, а также ответственным за сопровождение информации в системе по месту работы всех авторов, отправляется уведомление о том, что добавлен новый результат (Фиг. 1, поз. 1.10). При возникновении некорректных привязок или иных ошибок авторы и их ответственные могут вносить исправления или заявлять об отказе от авторства.A new object is created in the System corresponding to the added result (Fig. 1, pos. 1.9). The authors of the result who are registered in the System, as well as those responsible for maintaining information in the system at the place of work of all authors, are sent a notification that a new result has been added (Fig. 1, pos. 1.10). In the event of incorrect bindings or other errors, the authors and their responsible persons can make corrections or declare a disclaimer of authorship.

Последующие этапы многоуровневой верификации.Subsequent stages of multilevel verification.

Верификация соавторами.Verification by co-authors.

Все соавторы, а также ответственные за сопровождение данных пользователи по подразделениям, в которых работают авторы, имеют возможность корректировать данные о результате (Фиг. 2, поз. 2.4), а также указывать дополнительные данные о публикации, такие как аффилиации авторов с организациями, аффилиации публикации с другими результатами (проектами, диссертациями и другими). Если привязка результата к автору была произведена ошибочно, то соответствующий этому автору пользователь может отказаться от авторства, и публикация не будет отображаться в его профиле.All co-authors, as well as users responsible for data maintenance by departments in which the authors work, have the opportunity to correct the result data (Fig. 2, pos. 2.4), as well as indicate additional data on the publication, such as affiliations of authors with organizations, affiliations publications with other results (projects, dissertations and others). If the result was linked to the author by mistake, then the user corresponding to this author can refuse authorship, and the publication will not be displayed in his profile.

Верификация во внешних источниках.Verification in external sources.

Верификацию данных может производиться автоматически с использованием внешних информационных ресурсов. Принимая во внимание то обстоятельство, что в библиометрических системах результаты могут быть проиндексированы с некоторой задержкой после их публикации, целесообразно периодически проводить проверку на индексирование этих результатов (Фиг. 2, поз. 2.5).Data verification can be performed automatically using external information resources. Taking into account the fact that in bibliometric systems the results may be indexed with some delay after their publication, it is advisable to periodically check for indexing these results (Fig. 2, pos. 2.5).

Для результатов такого типа, как публикация, поисковые механизмы этих систем позволяют формировать запросы в виде различных наборов выходных данных: название публикации; имена авторов; номера страниц; год выхода публикации; DOI; название журнала; ISSN журнала; номер выпуска и т.п. Поскольку в сведениях могут быть ошибки или различия в написании спецсимволов (публикации по математике или химии), то представляется целесообразным осуществлять поиск не только по полному набору имеющихся данных о публикации, но также и по подмножествам этого набора. Точность поиска при уменьшении подмножества снижается, поэтому запросы упорядочены по степени "надёжности" такого подмножества. Подмножества, по которым невозможно однозначно определить публикацию, например, год и номера страниц, не используются. Если поисковому механизму удалось найти статью во внешней системе, то осуществляется её "привязка": сохраняется идентификатор этой статьи в той системе, где она была найдена. Следует отметить, что подобный принцип поиска является универсальным и может применяться к другим типам результатов в случае наличия соответствующих поисковых механизмов и доступа к ним.For results of this type, such as a publication, the search engines of these systems allow you to generate queries in the form of various sets of output data: title of the publication; names of authors; page numbers; publication year; DOI; name of the journal; ISSN of the journal; issue number etc. . Since there may be errors in the information or differences in the spelling of special characters (publications in mathematics or chemistry), it seems appropriate to search not only in the full set of available publication data, but also in subsets of this set. The accuracy of the search decreases as the subset decreases, so the queries are ordered by the degree of "reliability" of such a subset. Subsets from which the publication cannot be uniquely identified, such as year and page numbers, are not used. If the search engine managed to find an article in an external system, then it is "linked": the identifier of this article is stored in the system where it was found. It should be noted that such a search principle is universal and can be applied to other types of results if appropriate search mechanisms are available and accessed.

Для тех публикаций, которым удалось создать «привязки», периодически производится обновление числа цитирований по тем показателям, которые рассчитываются библиометрическими системами. Если статья проиндексирована и в Web of Science, и в Scopus, то у неё появляется два показателя: число цитирований по данным Web of Science; число цитирований по данным Scopus.For those publications that managed to create "bindings", the number of citations is periodically updated according to those indicators that are calculated by bibliometric systems. If an article is indexed in both Web of Science and Scopus, then it has two indicators: the number of citations according to Web of Science data; the number of citations according to Scopus.

В зависимости от функциональных возможностей API внешних систем и ограничений подписки организаций к этим системам, возможна реализация дополнительных верификационных механизмов. Примером такого механизма может служить загрузка аффилиаций авторов с организациями. Для корректного учёта опубликованных организацией статей важно, чтобы в каждой статье были корректно указаны аффилиации авторов с этой организацией, поскольку эти публикации выполнены в рамках работы автора в этой организации. Эта информация предоставляется самими авторами во время подготовки публикации, а затем передаётся в издательство.Depending on the functionality of the API of external systems and the restrictions on the subscription of organizations to these systems, it is possible to implement additional verification mechanisms. An example of such a mechanism is the loading of authors' affiliations with organizations. For the correct accounting of articles published by the organization, it is important that each article correctly indicates the authors' affiliations with this organization, since these publications are made as part of the work of the author in this organization. This information is provided by the authors themselves during the preparation of the publication, and then transferred to the publisher.

Модель и программные механизмы верификации ответственными.Model and software verification mechanisms responsible.

Важной частью верификации результатов деятельности является механизм их верификации Системы на разных административно-организационных уровнях. Такая верификация является многоуровневой и предполагает, что результаты сначала проверяются ответственными по подразделениям нижнего уровня (кафедры, лаборатории; см. Фиг. 2, поз. 2.6), а затем проверяются ответственными по подразделениям верхнего уровня (факультеты, институты, центры; см. Фиг. 2, поз. 2.7) или по организации в целом. Ответственные на нижнем уровне имеют представление о том, какая деятельность ведётся в их подразделениях и могут подтвердить данные о результате, направить результат на исправление информации авторам, или отклонить результат с пометкой, что он не относится к деятельности подразделения.An important part of the verification of performance results is the mechanism for their verification of the System at different administrative and organizational levels. Such verification is multi-level and assumes that the results are first checked by those responsible for the lower level units (departments, laboratories; see Fig. 2, pos. 2.6), and then are checked by those responsible for the upper level units (faculties, institutes, centers; see Fig. 2, item 2.7) or for the organization as a whole. Responsible at the lower level have an idea of what activities are carried out in their departments and can confirm the data on the result, send the result to the authors for correction of information, or reject the result with a note that it does not relate to the activities of the department.

Ответственные на верхнем уровне получают данные о результатах работников со всех подразделений нижнего уровня, поэтому они должны иметь возможность проверять, подтверждён ли результат ответственным или отклонён.Top-level owners receive data on the results of workers from all lower-level departments, so they must be able to check whether the result is approved by the owner or rejected.

Для подсчёта рейтинговых оценок могут использоваться различные варианты учёта подтверждённых результатов. В зависимости от конкретных задач оценки в расчёт могут попасть те результаты, которые не были отклонены ответственными («чёрный список»), или же только те результаты, которые были подтверждены ответственными («белый список»).To calculate the rating scores, various options for accounting for confirmed results can be used. Depending on the specific tasks of the evaluation, the results that were not rejected by the responsible (“black list”), or only those results that were confirmed by the responsible (“white list”) may be included in the calculation.

Если авторы результата работают в нескольких структурных подразделениях, то такая проверка производится по всем этим подразделениям.If the authors of the result work in several structural subdivisions, then such a check is performed for all these subdivisions.

На Фиг. 1 представлена блок-схема, реализующая бизнес-процессы ввода и верификации сведений о результатах научно-технической, опытно-конструкторской, инновационно-технологической и сопутствующих им форм деятельности, представляется в виде следующих далее блок-схем на примере научно-технической публикации, как результата деятельности.On FIG. 1 shows a flowchart that implements business processes for entering and verifying information about the results of scientific and technical, experimental design, innovation and technological and related forms of activity, is presented in the form of the following flowcharts using the example of a scientific and technical publication, as a result activities.

Пользователю предлагается выбор варианта: получить (импортировать) данные о результате деятельности через файл выгрузки или через программный интерфейс внешней информационной системы (1.1). Далее осуществляется автоматическая загрузка информации о результатах научно-технической, опытно-конструкторской и инновационно-технологической деятельности, через интерфейс внешнего источника (1.2). Автоматически заполняется форма ввода информации с использованием полученных данных путём их разбора (парсинга) (1.3). Осуществляется процесс заполнения пользователем формы ввода (1.4). Далее осуществляется автоматический поиск дубликатов вводимых в интерактивную информационно-аналитическую систему результатов научно-технической, опытно-конструкторской и инновационно-технологической деятельности (1.5). Далее осуществляется проверка, есть ли дубликаты у вводимых в интерактивную информационно-аналитическую систему результатов научно-технической, опытно-конструкторской и инновационно-технологической деятельности (1.6). После чего осуществляется автоматическое определение сопоставлений авторов (1.7). Далее происходит автоматическое установление связей (аффилиаций) с другими информационными объектами в системе (1.8). На следующем этапе осуществляется добавление результатов научно-технической, опытно-конструкторской и инновационно-технологической деятельности в информационно-аналитическую систему (1.9). После чего, осуществляется запуск процесса оповещения соавторов введенных данных и ответственных за сопровождение информации в информационно-аналитической системе по месту работы всех авторов о том, что добавлены новые результаты научно-технической, опытно-конструкторской и инновационно-технологической деятельности (1.10).The user is offered a choice of options: to receive (import) data on the result of activities through the upload file or through the program interface of an external information system (1.1). Further, automatic loading of information on the results of scientific and technical, experimental design and innovation and technological activities is carried out through the interface of an external source (1.2). The form for entering information is automatically filled in using the received data by parsing (parsing) (1.3). The process of filling in the input form by the user (1.4) is carried out. Next, an automatic search for duplicates of the results of scientific and technical, experimental design and innovation and technological activities entered into the interactive information-analytical system (1.5) is carried out. Next, it is checked whether there are duplicates of the results of scientific and technical, experimental design and innovation and technological activities entered into the interactive information-analytical system (1.6). After that, the authors' comparisons (1.7) are automatically determined. Then there is an automatic establishment of links (affiliations) with other information objects in the system (1.8). At the next stage, the results of scientific and technical, experimental design and innovation and technological activities are added to the information and analytical system (1.9). After that, the process of notifying the co-authors of the entered data and those responsible for maintaining information in the information and analytical system at the place of work of all authors is launched that new results of scientific, technical, experimental design and innovation and technological activities have been added (1.10).

На Фиг. 2 представлена блок-схема, представляющая модель многоуровневой верификации данных о результатах научно-технической, опытно-конструкторской инновационно-технологической и деятельности по подготовке кадров специалистов.On FIG. 2 shows a block diagram representing a model of multi-level verification of data on the results of scientific and technical, experimental design, innovation and technological and training activities for specialists.

На первом этапе осуществляется автоматический поиск сопоставлений авторов результатов научно-технической, опытно-конструкторской и инновационно-технологической деятельности. Далее осуществляется проверка корректности результатов сопоставлений (2.1). После чего, осуществляется автоматический поиск дубликатов вводимых результатов научно-технической, опытно-конструкторской и инновационно-технологической деятельности в информационно-аналитическую систему (2.2). Устанавливаются связи (аффилиации) вводимых результатов научно-технической, опытно-конструкторской и инновационно-технологической деятельности с другими информационными объектами в информационно-аналитической системе (2.3). Далее осуществляется оповещение соавторов и ответственных за сопровождение информации в информационно-аналитической системе о том, что добавлены новые результаты научно-технической, опытно-конструкторской и инновационно-технологической деятельности (2.4). На следующем этапе осуществляется автоматический поиск результатов научно-технической, опытно-конструкторской и инновационно-технологической деятельности во внешних информационных системах и базах данных (2.5). После чего, осуществляется подтверждение результатов научно-технической, опытно-конструкторской и инновационно-технологической деятельности ответственными за сопровождение информации в информационно-аналитической системе, начиная с уровня структурных подразделений, заканчивая уровнем организации (2.6, 2.7).At the first stage, an automatic search for comparisons of the authors of the results of scientific and technical, experimental design and innovation and technological activities is carried out. Next, the correctness of the results of comparisons (2.1) is checked. After that, an automatic search for duplicates of the input results of scientific and technical, experimental design and innovation and technological activities in the information and analytical system (2.2) is carried out. Connections (affiliations) of the input results of scientific and technical, experimental design and innovation and technological activities with other information objects in the information and analytical system (2.3) are established. Next, the co-authors and those responsible for maintaining information in the information and analytical system are notified that new results of scientific, technical, experimental design and innovation and technological activities have been added (2.4). At the next stage, an automatic search for the results of scientific and technical, experimental design and innovation and technological activities in external information systems and databases (2.5) is carried out. After that, the results of scientific and technical, experimental design and innovation and technological activities are confirmed by those responsible for maintaining information in the information and analytical system, starting from the level of structural units, ending with the level of organization (2.6, 2.7).

На Фиг. 3 далее будет представлена общая схема вычислительного устройства (300), обеспечивающего обработку данных, необходимую для реализации заявленного решения. On FIG. 3 will now present a general diagram of a computing device (300) that provides the data processing necessary to implement the claimed solution.

В общем случае устройство (300) содержит такие компоненты, как: один или более процессоров (301), по меньшей мере одну память (302), средство хранения данных (303), интерфейсы ввода/вывода (304), средство В/В (305), средства сетевого взаимодействия (306).In general, the device (300) contains such components as: one or more processors (301), at least one memory (302), data storage medium (303), input/output interfaces (304), I/O means ( 305), networking tools (306).

Процессор (301) устройства выполняет основные вычислительные операции, необходимые для функционирования устройства (300) или функциональности одного или более его компонентов. Процессор (301) исполняет необходимые машиночитаемые команды, содержащиеся в оперативной памяти (302).The processor (301) of the device performs the basic computing operations necessary for the operation of the device (300) or the functionality of one or more of its components. The processor (301) executes the necessary machine-readable instructions contained in the main memory (302).

Память (302), как правило, выполнена в виде ОЗУ и содержит необходимую программную логику, обеспечивающую требуемый функционал. The memory (302) is typically in the form of RAM and contains the necessary software logic to provide the required functionality.

Средство хранения данных (303) может выполняться в виде HDD, SSD дисков, рейд массива, сетевого хранилища, флэш-памяти, оптических накопителей информации (CD, DVD, MD, Blu-Ray дисков) и т.п. Средство (303) позволяет выполнять долгосрочное хранение различного вида информации, например, вышеупомянутых файлов с наборами данных пользователей, базы данных, содержащих записи измеренных для каждого пользователя временных интервалов, идентификаторов пользователей и т.п.The data storage means (303) can be in the form of HDD, SSD disks, raid array, network storage, flash memory, optical storage media (CD, DVD, MD, Blu-Ray disks), etc. The means (303) allows long-term storage of various types of information, for example, the above-mentioned files with user data sets, a database containing records of time intervals measured for each user, user identifiers, etc.

Интерфейсы (304) представляют собой стандартные средства для подключения и работы с серверной частью, например, USB, RS232, RJ45, LPT, COM, HDMI, PS/2, Lightning, FireWire и т.п.Interfaces (304) are standard means for connecting and working with the server part, for example, USB, RS232, RJ45, LPT, COM, HDMI, PS/2, Lightning, FireWire, etc.

Выбор интерфейсов (304) зависит от конкретного исполнения устройства (300), которое может представлять собой персональный компьютер, мейнфрейм, серверный кластер, тонкий клиент, смартфон, ноутбук и т.п.The choice of interfaces (304) depends on the specific implementation of the device (300), which can be a personal computer, mainframe, server cluster, thin client, smartphone, laptop, and the like.

В качестве средств В/В данных (305) в любом воплощении системы, реализующей описываемый способ, должна использоваться клавиатура. Аппаратное исполнение клавиатуры может быть любым известным: это может быть, как встроенная клавиатура, используемая на ноутбуке или нетбуке, так и обособленное устройство, подключенное к настольному компьютеру, серверу или иному компьютерному устройству. Подключение при этом может быть, как проводным, при котором соединительный кабель клавиатуры подключен к порту PS/2 или USB, расположенному на системном блоке настольного компьютера, так и беспроводным, при котором клавиатура осуществляет обмен данными по каналу беспроводной связи, например, радиоканалу, с базовой станцией, которая, в свою очередь, непосредственно подключена к системному блоку, например, к одному из USB-портов. Помимо клавиатуры, в составе средств В/В данных также может использоваться: джойстик, дисплей (сенсорный дисплей), проектор, тачпад, манипулятор мышь, трекбол, световое перо, динамики, микрофон и т.п.As means of I/O data (305) in any embodiment of the system that implements the described method, the keyboard must be used. The keyboard hardware can be any known: it can be either a built-in keyboard used on a laptop or netbook, or a separate device connected to a desktop computer, server, or other computer device. In this case, the connection can be either wired, in which the keyboard connection cable is connected to the PS / 2 or USB port located on the system unit of the desktop computer, or wireless, in which the keyboard exchanges data via a wireless communication channel, for example, a radio channel, with base station, which, in turn, is directly connected to the system unit, for example, to one of the USB ports. In addition to the keyboard, I/O devices can also use: joystick, display (touchscreen), projector, touchpad, mouse, trackball, light pen, speakers, microphone, etc.

Средства сетевого взаимодействия (306) выбираются из устройства, обеспечивающий сетевой прием и передачу данных, например, Ethernet карту, WLAN/Wi-Fi модуль, Bluetooth модуль, BLE модуль, NFC модуль, IrDa, RFID модуль, GSM модем и т.п. С помощью средств (305) обеспечивается организация обмена данными по проводному или беспроводному каналу передачи данных, например, WAN, PAN, ЛВС (LAN), Интранет, Интернет, WLAN, WMAN или GSM.Means of networking (306) are selected from a device that provides network data reception and transmission, for example, an Ethernet card, WLAN/Wi-Fi module, Bluetooth module, BLE module, NFC module, IrDa, RFID module, GSM modem, etc. With the help of tools (305) the organization of data exchange over a wired or wireless data transmission channel, for example, WAN, PAN, LAN (LAN), Intranet, Internet, WLAN, WMAN or GSM, is provided.

Компоненты устройства (300) сопряжены посредством общей шины передачи данных (310).The components of the device (300) are coupled via a common data bus (310).

В настоящих материалах заявки было представлено предпочтительное раскрытие осуществление заявленного технического решения, которое не должно использоваться как ограничивающее иные, частные воплощения его реализации, которые не выходят за рамки испрашиваемого объема правовой охраны и являются очевидными для специалистов в соответствующей области техники. In these application materials, a preferred disclosure of the implementation of the claimed technical solution was presented, which should not be used as limiting other, private embodiments of its implementation, which do not go beyond the scope of the requested legal protection and are obvious to specialists in the relevant field of technology.

Claims (9)

1. Компьютерно-реализуемый способ ввода и многоуровневой верификации больших наукометрических данных в интерактивную информационно-аналитическую систему, содержащий этапы, на которых:1. A computer-implemented method for input and multi-level verification of large scientometric data into an interactive information and analytical system, containing the steps at which: выгружают первичные данные о результатах научно-технической, опытно-конструкторской и инновационно-технологической деятельности в интерактивную информационно-аналитическую систему посредством файла выгрузки с автоматическим определением формата загружаемых данных и/или посредством интерфейса внешней информационной системы;unload primary data on the results of scientific and technical, experimental design and innovation and technological activities into an interactive information and analytical system through an upload file with automatic detection of the format of the downloaded data and/or through the interface of an external information system; осуществляют автоматический нечёткий поиск дубликатов вводимых в интерактивную информационно-аналитическую систему результатов научно-технической, опытно-конструкторской и инновационно-технологической деятельности, с использованием заранее заданных первичных данных и данных о результатах в интерактивной информационно-аналитической системе, при этом, в случае нахождения дубликатов, добавление указанных результатов в интерактивную информационно-аналитическую систему не производится;carry out an automatic fuzzy search for duplicates of the results of scientific and technical, experimental design and innovation and technological activities entered into the interactive information and analytical system, using predefined primary data and data on the results in the interactive information and analytical system, while, in case of finding duplicates , the specified results are not added to the interactive information and analytical system; осуществляют автоматизированное сопоставление авторов вводимых результатов научно-технической, опытно-конструкторской и инновационно-технологической деятельности с уже существующими авторами в интерактивной информационно-аналитической системе на основе результатов анализа существующих данных о совместных публикациях авторов вводимого результата;carry out an automated comparison of the authors of the input results of scientific and technical, experimental design and innovation and technological activities with existing authors in an interactive information and analytical system based on the results of the analysis of existing data on joint publications of the authors of the input result; осуществляют аффилиацию и сохранение первичных данных о вводимых в интерактивную информационно-аналитическую систему результатов научно-технической, опытно-конструкторской и инновационно-технологической деятельности с существующими объектами в интерактивной информационно-аналитической системе, при этом под объектами в интерактивной информационно-аналитической системе понимаются данные о журналах, сборниках статей или конференций;carry out affiliation and preservation of primary data on the results of scientific and technical, experimental design and innovation and technological activities entered into the interactive information and analytical system with existing objects in the interactive information and analytical system, while objects in the interactive information and analytical system are understood as data on journals, collections of articles or conferences; сохраняют первичные данные и создают новый объект в интерактивной информационно-аналитической системе;save the primary data and create a new object in the interactive information and analytical system; в автоматическом режиме верифицируют информацию о результате научно-технической, опытно-конструкторской и инновационно-технологической деятельности путем автоматизированного поиска во внешних информационных ресурсах с сохранением идентификаторов найденных результатов и дальнейшего периодического обновления данных о результате, включая связанные с ним библиометрические показатели.information on the result of scientific and technical, experimental design and innovation and technological activities is automatically verified by automated search in external information resources with the preservation of identifiers of the results found and further periodic updating of data on the result, including related bibliometric indicators. 2. Способ по п.1, в котором в автоматизированном режиме загружают библиометрическую и иную справочную информацию посредством файла выгрузки и/или посредством интерфейса внешней информационной системы.2. The method according to claim 1, in which bibliometric and other reference information is loaded in an automated mode via an upload file and/or via an interface of an external information system. 3. Способ по п.1, в котором в автоматическом режиме отправляют уведомления о добавлении нового результата научно-технической, опытно-конструкторской и инновационно-технологической деятельности пользователей интерактивной информационно-аналитической системы, являющихся авторами этого результата.3. The method according to claim 1, in which notifications are automatically sent about the addition of a new result of scientific, technical, experimental design and innovation and technological activities of users of an interactive information and analytical system who are the authors of this result.
RU2020140158A 2020-12-07 2020-12-07 Method for entering and multilevel verification of intensively supplied data in large scientometric information and analytical systems RU2763458C1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU2020140158A RU2763458C1 (en) 2020-12-07 2020-12-07 Method for entering and multilevel verification of intensively supplied data in large scientometric information and analytical systems

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2020140158A RU2763458C1 (en) 2020-12-07 2020-12-07 Method for entering and multilevel verification of intensively supplied data in large scientometric information and analytical systems

Publications (1)

Publication Number Publication Date
RU2763458C1 true RU2763458C1 (en) 2021-12-29

Family

ID=80039856

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2020140158A RU2763458C1 (en) 2020-12-07 2020-12-07 Method for entering and multilevel verification of intensively supplied data in large scientometric information and analytical systems

Country Status (1)

Country Link
RU (1) RU2763458C1 (en)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040172393A1 (en) * 2003-02-27 2004-09-02 Kazi Zunaid H. System and method for matching and assembling records
US20130080266A1 (en) * 2011-09-23 2013-03-28 Sam David Molyneux System and method for establishing a dynamic meta-knowledge network
RU133637U1 (en) * 2013-04-12 2013-10-20 Федеральное государственное казенное учреждение "27 Центральный научно-исследовательский институт Министерства обороны Российской Федерации" AUTOMATED SYSTEM OF IDENTIFICATION OF FINANCIAL AND ECONOMIC INDICATORS IN THE PERFORMANCE OF SCIENTIFIC RESEARCH OR EXPERIENCE-DESIGN WORKS IN CONCLUSION OF PUBLIC CONTRACTS
RU2569363C1 (en) * 2014-08-06 2015-11-20 Антон Александрович Синицын Automated information system for analysis of publication activity of employees of scientific-educational organisation
US20160357711A1 (en) * 2015-06-07 2016-12-08 Apple Inc. Article Authoring, Distribution & Rendering Architecture

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040172393A1 (en) * 2003-02-27 2004-09-02 Kazi Zunaid H. System and method for matching and assembling records
US20130080266A1 (en) * 2011-09-23 2013-03-28 Sam David Molyneux System and method for establishing a dynamic meta-knowledge network
RU133637U1 (en) * 2013-04-12 2013-10-20 Федеральное государственное казенное учреждение "27 Центральный научно-исследовательский институт Министерства обороны Российской Федерации" AUTOMATED SYSTEM OF IDENTIFICATION OF FINANCIAL AND ECONOMIC INDICATORS IN THE PERFORMANCE OF SCIENTIFIC RESEARCH OR EXPERIENCE-DESIGN WORKS IN CONCLUSION OF PUBLIC CONTRACTS
RU2569363C1 (en) * 2014-08-06 2015-11-20 Антон Александрович Синицын Automated information system for analysis of publication activity of employees of scientific-educational organisation
US20160357711A1 (en) * 2015-06-07 2016-12-08 Apple Inc. Article Authoring, Distribution & Rendering Architecture

Similar Documents

Publication Publication Date Title
Kitchenham Procedures for performing systematic reviews
Peer et al. Committing to data quality review
Amreen et al. ALFAA: Active Learning Fingerprint based Anti-Aliasing for correcting developer identity errors in version control systems
US8805768B2 (en) Techniques for data generation
Magarian et al. Characterizing engineering work in a changing world: Synthesis of a typology for engineering students' occupational outcomes
Fleming et al. Open access in special education: A review of journal and publisher policies
Musenze et al. Development and validation of a total quality management model for Uganda’s local governments
KR101404113B1 (en) A quality evaluation tool and its development method for detailed clinical models and the evaluation method thereof
Barati et al. A study of the models for adoption of e-tax returns from the perspective of taxpayers
Lawson et al. Detecting dirty data using SQL: Rigorous house insurance case
Latan et al. Crossing the red line? Empirical evidence and useful recommendations on questionable research practices among business scholars
Boyle et al. A systematic mechanism for the collection and interpretation of display format pathology test results from Australian primary care records
Maassen et al. The dire disregard of measurement invariance testing in psychological science.
Liu et al. Identifying unreported links between ClinicalTrials. gov trial registrations and their published results
Bernardi et al. Data quality in health research: integrative literature review
RU2763458C1 (en) Method for entering and multilevel verification of intensively supplied data in large scientometric information and analytical systems
Rios et al. A topical and methodological systematic review of meta‐analyses published in the educational measurement literature
Woods et al. Collaborative data familiarisation and quality assessment: reflections from use of a national dataset to investigate palliative care for Indigenous Australians
Beattie et al. Rural longitudinal integrated clerkships and medical workforce outcomes: a scoping review protocol
Curado et al. Control variable use and reporting in operations management: a systematic literature review and revisit
Christen et al. When data science goes wrong: How misconceptions about data capture and processing causes wrong conclusions
Pedrosa Computer-assisted audit tools and techniques use: determinants for individual acceptance
Bahauddin et al. Development of a blockchain-based website application for storing certificate (Case study at Universitas Sultan Ageng Tirtayasa)
Patterson The Effects of Big Data and Blockchain on the Audit Profession
Melendez-Torres et al. Review methods