СОЗДАНИЕ ВЕРОЯТНОСТНО-СТАТИСТИЧЕСКОЙ МОДЕЛИ КАЗАХСКОГО ТЕКСТА
Ключевые слова:
лингвистическая статистика, математическое распределение, тексты на казахском языке, части речи, распределение Пуассона, Нормальное распределение, моделирование языка.Аннотация
В настоящее время лингвистическая статистика переходит от первоначального этапа описания языковых явлений к разработке теорий, способных количественно предсказывать языковые закономерности. Основная задача исследования заключается в анализе математического распределения языковых единиц в текстах, что является ключевым для моделирования языковых феноменов. В рамках данной работы было исследовано статистическое распределение основных частей речи в текстах на казахском языке, включая тысячи словоупотреблений из романа М. Ауэзова «Путь Абая» и газетных текстов. Используя методы математической статистики, такие как нормальное распределение, распределение Пуассона и распределение Шарлье, были проверены и подтверждены теоретические закономерности распределения данных частей речи.
Эксперименты показали значительные особенности в распределении языковых элементов, что способствует дальнейшему пониманию структуры языка и его функционирования в различных контекстах.
Библиографические ссылки
Джубанов А.Х. Квантитативная структура казахского текста (опыт лингвистического анализа на ЭВМ). Алма-Ата, 1987. С. 147.
Романовский В.И. Математическая статистика. Ташкент, 1961. Кн. 1. 637 с.; 1963. Кн. 2. 794 с.
Смирнов Н.В., Дунин-Барковский И.В. Курс теории вероятностной и математической статистики. М., 1969. 511с.
Фрумкина Р.М. О законах распределения слов и классов слов // Структурно- типологические исследования. М., 1962. С. 124-133.
Хальд Л. Математическая статистика с техническим приложением. М., 1956. 644 с.
Загрузки
Опубликован
Выпуск
Раздел
Лицензия

Это произведение доступно по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.