СОЗДАНИЕ ВЕРОЯТНОСТНО-СТАТИСТИЧЕСКОЙ МОДЕЛИ КАЗАХСКОГО ТЕКСТА

Авторы

  • Тоқмырзаев Дархан Автор
  • Жұбанова Еңлік Автор
  • Пірманова Айнұра Автор

Ключевые слова:

лингвистическая статистика, математическое распределение, тексты на казахском языке, части речи, распределение Пуассона, Нормальное распределение, моделирование языка.

Аннотация

В настоящее время лингвистическая статистика переходит от первоначального этапа описания языковых явлений к разработке теорий, способных количественно предсказывать языковые закономерности. Основная задача исследования заключается в анализе математического распределения языковых единиц в текстах, что является ключевым для моделирования языковых феноменов. В рамках данной работы было исследовано статистическое распределение основных частей речи в текстах на казахском языке, включая тысячи словоупотреблений из романа М. Ауэзова «Путь Абая» и газетных текстов. Используя методы математической статистики, такие как нормальное распределение, распределение Пуассона и распределение Шарлье, были проверены и подтверждены теоретические закономерности распределения данных частей речи.
Эксперименты показали значительные особенности в распределении языковых элементов, что способствует дальнейшему пониманию структуры языка и его функционирования в различных контекстах.

Библиографические ссылки

Джубанов А.Х. Квантитативная структура казахского текста (опыт лингвистического анализа на ЭВМ). Алма-Ата, 1987. С. 147.

Романовский В.И. Математическая статистика. Ташкент, 1961. Кн. 1. 637 с.; 1963. Кн. 2. 794 с.

Смирнов Н.В., Дунин-Барковский И.В. Курс теории вероятностной и математической статистики. М., 1969. 511с.

Фрумкина Р.М. О законах распределения слов и классов слов // Структурно- типологические исследования. М., 1962. С. 124-133.

Хальд Л. Математическая статистика с техническим приложением. М., 1956. 644 с.

Опубликован

2024-06-24

Выпуск

Раздел

SECTION 1. Current issues of corpus linguistics.

Как цитировать

СОЗДАНИЕ ВЕРОЯТНОСТНО-СТАТИСТИЧЕСКОЙ МОДЕЛИ КАЗАХСКОГО ТЕКСТА. (2024). «СОВРЕМЕННЫЕ ТЕХНОЛОГИИ КОМПЬЮТЕРНОЙ ЛИНГВИСТИКИ», 2(22.04), 26-32. https://myscience.uz/index.php/linguistics/article/view/10