Цель дистрибутивно-статистического анализа состоит в открытии структуры языка на основе большого корпуса текстов. В настоящей трехтомной монографии этот формальный метод в полной мере прилагается к текстам русской прозы 1850-1870 гг. (около 15 млн словоупотреблений); а частично (в виде иллюстраций) к текстам на других языках.
1-й том включает три части:Очерк развития метода; Открытие регулярной морфологии в рамках графического слова; Частотный словарь языка русской прозы 1850-1870 гг.: Первые две части адресованы лингвистам, особенно тем, кто интересуется лингвостатистикой. Частотный словарь будет интересен филологам-русистам.
2-й том включает две части. В части 4 дистрибутивно-статистический анализ (ДСА) проводится на материале 15 миллионов слов, непосредственно примыкающих друг к другу в текстах русской прозы 1850-1870-х гг. Тот же формальный метод прилагается к английскому корпусу (4 миллиона слов романов Диккенса). И в том, и в другом случае ДСА приводит к открытию дистрибутивных классов и некоторых грамматических конструкций. Часть 5 представляет собой частотный словарь русского корпуса, показывающий распределение слов по основным жанрам, по микрожанрам и по текстам 25 писателей.
3-й том посвящен анализу среднего интервала текста. Исследуемый корпус прозы автоматически членится на фрагменты по 40 слов. Если совместная встречаемость двух слов во фрагментах существенно превышает величину, подсчитанную на основе нулевой гипотезы, делается вывод о наличии связи между этими словами. В результате возникает огромная сеть текстуальных связей слов. Показан способ выявления кластеров в этой сети.
Дополнительно: ГРАЖДАНЕ ПОКУПАТЕЛИ! ПРЕЖДЕ, ЧЕМ ОФОРМЛЯТЬ ЗАКАЗ, ПРОЧТИТЕ УСЛОВИЯ!
Если вы особо чувствительны к состоянию книг, то прежде чем, оформлять заказ, выйдите на связь с продавцом, воспользовавшись функцией "СПРОСИТЬ" (только для зарегистрированных пользователей), поскольку ваше понимание "хорошего" и "отличного" может не совпадать с таковым пониманием продавца.
Встреча по договоренности происходит б... [подробнее]