METHOD OF DEVELOPING ARTIFICIAL PATTERNS TO ANALYZING SEMANTIC SIMILARITY OF DOCUMENTS

Авторы

  • Tuliev Ulugbek Автор
  • Abdurakhmonova Nilufar Автор

Ключевые слова:

семантической близости документов, латентный признак.

Аннотация

Рассматривается методика создания искусственных паттернов по данным из текстовых документов. Существует потребность в паттернах для снижения размерности признакового пространства и анализа семантической близости тематических документов. Состав паттернов формируется по правилам иерархической агломеративной группировки. Процесс формирования основывается на выборе латентного признакового пространства по технологии вычисления обобщённых оценок объектов.

Библиографические ссылки

Ignatyev N. A. Structure Choice for Relations between Objects in Metric Classification Algorithms // Pattern Recognition and Image Analysis. 2018. V. 28. № 4. P. 590–597.

N. A. Ignatev, U. Y. Tuliyev, “Semantic structuring of text documents based on patterns of natural language entities”, Computer Research and Modeling, 14:5 (2022), 1185–1197 http://doi.org/10.20537/2076-7633-2022-14-5-1185-1197

N. Abdurakhmonova, U. Tuliyev and A. Gatiatullin, "Linguistic functionality of Uzbek Electron Corpus: uzbekcorpus.uz," 2021 International Conference on Information Science and Communications Technologies (ICISCT), Tashkent, Uzbekistan, 2021, pp. 1-4, http://doi.org/10.1109/ICISCT52966.2021.9670043

Tuliyev U. (2021). Space formation for the description of thematic documents. AIP Conference Proceedings. 2365. 070007. http://doi.org/10.1063/5.0056963

Тулиев У. Ю. Кластерный анализ текстовых документов по отношению их связности // Проблемы вычислительной и прикладной математики. — 2019, No 6(24). — С. 102–109.

N.A. Ignatyev, Sh.F.Madrakhimov, D.Y.Saidov. Stability of object classes and selection of the latent features // International journal of engineering technology and sciences, 2017, Malaysia, Vol. 7, pp. 1-10.

Игнатьев Н.А., Саидов Д.Ю. Анализ данных и принятие решений с помощью логических закономерностей в форме полуплоскостей // Известия СамНЦ, 2017, Том 19, № 4(2), С. 294-300.

Опубликован

2024-06-24

Выпуск

Раздел

SECTION 3. Language and speech analysis in NLP (morphological, syntactic and semantic analysis; speech analysis and synthesis).

Как цитировать

METHOD OF DEVELOPING ARTIFICIAL PATTERNS TO ANALYZING SEMANTIC SIMILARITY OF DOCUMENTS. (2024). «СОВРЕМЕННЫЕ ТЕХНОЛОГИИ КОМПЬЮТЕРНОЙ ЛИНГВИСТИКИ», 2(22.04), 362-365. https://myscience.uz/index.php/linguistics/article/view/79

Наиболее читаемые статьи этого автора (авторов)