egovoru: (Default)
[personal profile] egovoru

Применение количественных методов к анализу литературных текстов – уже далеко не новость. Но развитие интернета позволило подступиться «с циркулем и линейкой» и к более тонким материям: читательскому восприятию литературы. Статья Дмитрия Манина, на которую обратил мое внимание уважаемый [livejournal.com profile] tijd, как раз об этом.


Манин отобрал 34 текста разной степени художественности, надергал из них 3439 коротких фрагментов и предложил участникам сетевого эксперимента такие задания. Первое: самостоятельно угадать пропущенное авторское слово во фрагменте текста. Отрицательный логарифм вероятности успеха – мера «непредсказуемости» заданного слова. «Непредсказуемость» формально похожа на шенноновское количество информации, но не тождественна ему; в статье Манин объясняет, почему. А второе задание – выбрать пропущенное слово из двух предложенных (одно из которых – авторское, а другое почерпнуто из неправильных ответов на первый вопрос). Доля правильных ответов служит мерой «связанности» текста.

Оказалось, большинство рифмованных стихов обладают примерно такой же «непредсказуемостью», как проза (образцы которой были, однако, выбраны всего из трех произведений: «Войны и мира», «Доктора Живаго» и некоего публицистического эссе). А вот «связанность» стихов существенно выше, чем прозы – за исключением творений поэтов-авангардистов (Хармс, Введенский и Хлебников), которые зато обходят прозу по своей «непредсказуемости».

А как же иначе, скажете вы – ведь слова в стихотворении подчиняются закономерностям метра и рифмы, а значит, подобрать подходящее для них слово заведомо легче, чем для прозаического высказывания! Но влияние метра можно оценить отдельно, измеряя вероятность угадывания не самого слова, а только числа его слогов («метрическая непредсказуемость»). То же касается и «метрической связанности», определяемой вероятностью выбора из предложенных вариантов правильного числа слогов в пропущенном слове. Интересно, что «неметрическая непредсказуемость» растет по мере увеличения «метрической связанности»: иначе говоря, формальные ограничения повышают информативность текста и расширяют пределы языка.


График из обсуждаемой статьи Дм. Манина, отражающий связь «метрической связанности» и «неметрической непредсказуемости»

К сожалению, автор не объясняет, а почему вообще задачи на угадывание и выбор пропущенного слова дают разный результат? Он просто считает, что «непредсказуемость» характеризует нарушение опережающего читательского ожидания, а «связанность» – удовлетворение апостериорного ожидания, но мне такая интерпретация не очевидна.

Как бы то ни было, эта разница результатов ясно показывает, что «multiple choice questions», которые так любят составители ЕГЭ и подобных новомодных тестов, проверяют вовсе не то же самое, что старые добрые экзаменационные вопросы с открытым ответом :)

А вот обсуждение статьи Дм. Манина в журнале уважаемого [livejournal.com profile] a_shen.

Page 1 of 3 << [1] [2] [3] >>

Date: 2020-01-02 04:01 pm (UTC)
From: [identity profile] lj-frank-bot.livejournal.com
Hello!
LiveJournal categorization system detected that your entry belongs to the following categories: Криминал (https://www.livejournal.com/category/kriminal), Литература (https://www.livejournal.com/category/literatura), Музыка (https://www.livejournal.com/category/muzyka).
If you think that this choice was wrong please reply this comment. Your feedback will help us improve system.
Frank,
LJ Team

Date: 2020-01-02 04:59 pm (UTC)
mns2012: (Default)
From: [personal profile] mns2012
==Формальные ограничения повышают информативность текста и расширяют пределы языка.==

На мой взгляд, это похоже на следующую мысль Стравинского.

"Чем больше ограничений налагается на художественные средства выражения, тем более художник освобождается от цепей, стесняющих дух, [...] а произвольность ограничений помогает в достижении исполнительской точности." (перевод мой)

The more constraints one imposes, the more one frees oneself from the chains that shackle the spirit . . . and the arbitrariness of the constraint serves only to obtain precision of execution.

Stravinski, Igor (1970). Poetics of Music in the Form of Six Lessons. (The Charles Eliot Norton lectures). Harvard University Press Bilingual Edition (June 1, 1970).

Date: 2020-01-02 07:15 pm (UTC)
From: [identity profile] poiupredatel.livejournal.com
А там написано по какому принципу отбиралось это самое слово, для исключения и угадывания? А то от этого зависит вообще всё.

Date: 2020-01-02 11:37 pm (UTC)
From: [identity profile] egovoru.livejournal.com
Только "Литература", никакой "Музыки" и уж тем более "Криминала" тут нет!

Date: 2020-01-02 11:39 pm (UTC)
From: [identity profile] lj-frank-bot.livejournal.com
Жаль, что так вышло

Date: 2020-01-02 11:43 pm (UTC)
From: [identity profile] egovoru.livejournal.com
"это похоже на следующую мысль Стравинского"

Да, действительно похоже. Другое дело, что Манин нашел способ количественного выявления этой закономерности.

А понимаете ли Вы, почему тексты вообще различаются по этим двум параметрам? Казалось бы, не все ли равно, сам ли испытуемый подбирает пропущенное слово или выбирает из двух предложенных экспериментатором?

К сожалению, Манин, видимо, уже свернул свою лавочку, потому что сайт этого теста, указанный в статье, http://ygrec.msk.ru, уже не существует :(

Date: 2020-01-02 11:57 pm (UTC)
From: [identity profile] egovoru.livejournal.com
"по какому принципу отбиралось это самое слово"

Вот что пишет автор об этом: "для типа 1 случайно (равновероятно) выбирается фрагмент и в нем слово. Словом считается любая последовательность из не менее 5 русских букв, заключенная между не-буквами"

А каким образом, по-Вашему, выбор конкретного слова для пропускания может повлиять на результат?

На мой взгяд, более важный фактор - длина фрагмента текста. Вот что пишет об этом автор:

"При всем этом, однако, разбиение текста на короткие фрагменты неизбежно обрубает некоторые связи для всех читателей. В наименьшей степени при этом страдают короткодействующие связи (синтаксис, аллитерация, ритмика и т.п.) и самые дальнодействующие, такие, как отсылки к общекультурному контексту. В наибольшей степени затронутыми оказываются связи, действующие на масштабе одного конкретного текста, в первую очередь семантические. Попросту говоря, не зная, о чем речь, правильное слово во многих случаях найти невозможно.

Это обстоятельство можно считать недостатком экспериментальной методики, однако оно же в принципе позволяет оценить роль таких внутритекстовых семантических (и стилистических, в той мере в какой они существуют) связей «среднего радиуса действия». Дело в том, что поскольку фрагменты предъявляются игрокам в случайном порядке, внимательный игрок постепенно собирает в уме образ текста из мозаики разрозненных фрагментов. Чем больше фрагментов текста было прочтено, тем лучше угадываются слова из оставшихся фрагментов — это экспериментальный факт. Разница между первым и последним фрагментами текста и дает некоторую меру силы указанных связей."

Он довольно обстоятельно разбирает и другие возможные артефакты.
Edited Date: 2020-01-02 11:58 pm (UTC)

Date: 2020-01-03 12:35 am (UTC)
From: [identity profile] sedov-05.livejournal.com
Image (https://radikal.ru)

Date: 2020-01-03 01:51 am (UTC)
From: [identity profile] egovoru.livejournal.com
Спасибо за поздравление! Вас тоже с наступившим!

Date: 2020-01-03 06:08 am (UTC)
From: [identity profile] poiupredatel.livejournal.com
Пример важности конкретного слова:

«От чего луна(1) так светит тускло
На сады и стены Хороссана(2)?
Словно я хожу равниной русской
Под шуршащим пологом тумана» —

Так спросил я, дорогая Лала(3),
У молчащих ночью кипарисов,
Но их рать ни слова(4) не сказала,
К небу гордо головы(5) завысив.

«Отчего луна так светит грустно(6)?» —
У цветов(7) спросил я в тихой чаще,
И цветы сказали: «Ты почувствуй
По печали розы шелестящей».

Угадать слова 2-3 невозможно в принципе (наименование и личное имя, не привязанные к контексту и не упоминавшиеся ранее).
С другой стороны угадать слова 1,4,5 сравнительно легко, по минимальному контексту. Тускло светит понятно что (если на сады и стены то явно не фонарь), "гордо завысить к небу" можно ограниченное количество вещей а по ритму подходят только головы.
Так же показательны слово 6 - эпитет, который в самом тексте различается и зависит только от автора, и слово 7 - в следующей строчке идёт повтор.

Так что выбор слова очень важен. Если он происходит случайно то ещё нормально. Хотя для того чтобы случайный выбор заработал, нужно много повторов и много людей.

Date: 2020-01-03 09:40 am (UTC)
From: [identity profile] steblya-kam.livejournal.com
Для чистоты эксперимента методику следует проверить на текстах, сгенерированных ботами.

Date: 2020-01-03 01:50 pm (UTC)
From: [identity profile] egovoru.livejournal.com
Да, разумеется, одни слова угадать легче, другие - труднее. Тут надежда на то, что они выбираются наугад, случайно, а большое число участников как раз и обеспечивает интернет.

Автор, как я поняла, пока что попытался только отдельно оценить влияние стихотворного размера, но, наверное, можно было бы придумать, и как отдельно оценить влияние рифмы - насколько легче угадать в стихах рифмованное слово, чем нерифмованное слово в середине строки?

Date: 2020-01-03 01:52 pm (UTC)
From: [identity profile] egovoru.livejournal.com
Автор использовал в этом качестве не боты, но творчество авторов с сайта Стихи.ру, что, по-видимому, близко :)

Date: 2020-01-05 09:52 am (UTC)
From: [identity profile] steblya-kam.livejournal.com
ахаха :-) но это всё-таки люди :-) для чистоты эксперимента надо было с ботами попробовать.

Date: 2020-01-05 12:26 pm (UTC)
From: [identity profile] egovoru.livejournal.com
Не очень понятно, на какой вопрос мог бы ответить такой эксперимент? Автора интересовало главным образом, отличаются ли стихи от прозы по введенным им критериям, а ведь стихи, сочиненные ботами, заведомо являются стихами по формальным признакам? Максимум, чего можно было бы ожидать, это что стихи ботов не дали бы этого увеличения неметрической непредсказуемости (проще говоря, расширения словарного запаса), какое дают стихи людей - но и это, вероятно, зависело бы от словарного запаса ботов!

Кстати сказать, стихи с сайта Стихи.ру (номер 10) все-таки показывают это самое расширение; а самые близкие к прозе - не они, а стихотворные тосты и поздравления к 8 марта с сайта etost.ru (номер 19) и песенные тексты разных лет М. Щербакова (номер 26).

А понимаете ли Вы, почему тексты вообще различаются по этим двум параметрам, т.е., почему задания на самостоятельное придумывание слова и выбор из двух предложенных дают разные результаты? Мне это кажется загадкой, а автор совершенно этого не обсуждает. Может быть, это что-то само собой разумеющееся для филологов?

Date: 2020-01-09 10:18 am (UTC)
From: [identity profile] steblya-kam.livejournal.com
Именно поэтому. В нашей культуре существует презумпция (восходящая ещё к античности), что стихи фундаментально отличаются от прозы. Поэтому когда стихи писаны людьми, то эксперимент не чист: человек может сознательно или бессознательно следовать этой презумпции. А у бота этой презумпции нет. Эксперимент ответил бы на вопрос, является ли эта особенность свойством стихов в принципе или её привносят авторы.
Можно вывернуть вопрос наизнанку и посмотреть с другой стороны: "настоящие" ли стихи пишет бот или их умеют писать только люди.
А понимаете ли Вы, почему тексты вообще различаются по этим двум параметрам, т.е., почему задания на самостоятельное придумывание слова и выбор из двух предложенных дают разные результаты? - Нет, не понимаю. Это вопрос к автору.

Date: 2020-01-09 11:49 am (UTC)
From: [identity profile] egovoru.livejournal.com
"В нашей культуре существует презумпция (восходящая ещё к античности), что стихи фундаментально отличаются от прозы"

Стихи отличаются от прозы в первую очередь тем, что состоят из отдельных "стихов", то есть, стихи - это текст, разделенный на отдельные строчки. Такого чисто формального определения придерживается и автор. Его интересует, а есть ли в текстах, формально организованных таким образом, еще какие-то отличия от прозы? Его анализ показывает, что есть.

"настоящие" ли стихи пишет бот"

Мне кажется, тут мы вступаем на скользкую почву, потому что сначала ведь надо определить, что такое "настоящие" стихи? Автор благоразумно воздерживается от этого :)

В этой работе он анализирует только обычные, т.е., метрические и рифмованные стихи, но у него есть и другая, посвященная исследованию верлибра. И там у него получилось, что верлибр и ритмическая проза показывают небольшую отрицательную ритмическую связанность - то есть, предыдущая строчка настраивает читателя на некий ритм, а следующая - не оправдывает этот настрой :)

Обычные стихи при этом имеют высокую положительную ритмическую связанность, и даже обычная проза показывает ее небольшое положительное значение. Если верить этим результатам (но у них очень большая статистическая погрешность, что признает и сам автор), то все-таки верлибр - это не просто нарубленная на отрезки проза, а некий особый жанр.

Date: 2020-01-11 05:56 am (UTC)
From: [identity profile] steblya-kam.livejournal.com
Стихи отличаются от прозы в первую очередь тем, что состоят из отдельных "стихов", то есть, стихи - это текст, разделенный на отдельные строчки. - фейспалм. Запись стихов с разделением на строчки появилась только в эпоху Возрождения. В античности и в раннем средневековье их записывали сплошным текстом.
Если же аффтар имеет в виду разделение на ритмические отрезки, то это называется метром, и у верлибра его таки нет.

Date: 2020-01-11 12:21 pm (UTC)
From: [identity profile] egovoru.livejournal.com
"В античности и в раннем средневековье их записывали сплошным текстом"

Важно, по-видимому, не как записывали, а как произносили? В те времена стихи наверняка были только метрически организованные (ведь метр помогает запоминанию, что было особенно важно до изобретения письменности), так что сомнений, где кончается одна строчка и начинается другая, не возникало. Неметрические эксперименты начались уже позже - и, как я понимаю, до сих пор вызывают неоднозначное отношение. В любом случае автор статьи вообще не пытается дать определение стихам; он просто берет образцы, заведомо числящиеся по части стихов или прозы.

"имеет в виду разделение на ритмические отрезки, то это называется метром, и у верлибра его таки нет"

Да, автор различает "метрические белые стихи", "свободные стихи" и "ритмическую прозу". Образцы первых он берет, в частности, из "Бориса Годунова", вторых - из "Александрийских песен" Кузмина и "Мамы и нейтронной бомбы" Евтушенко, и третьей - из "Петербурга" Белого.

А с верлибром мы тут и сами недавно проводили эксперимент по типу манинского (https://egovoru.livejournal.com/114695.html), только не с подбором пропущенных слов, а с разбиением на строчки :)

Жаль, что манинский сайт уже не существует - было бы интересно познакомиться на практике, как он работает!

Date: 2020-01-12 09:12 am (UTC)
From: [identity profile] steblya-kam.livejournal.com
 Неметрические эксперименты начались уже позже - и, как я понимаю, до сих пор вызывают неоднозначное отношение. - в России. В англофонном и франкофонном мире, наоборот, верлибр давно стал нормой, а метрическим стихом пишется только эстрадная песня и юмористическая поэзия.
Строго говоря, нельзя сказать, что французский верлибр - неметрический, так как во французском фиксированное ударение. На русский слух он звучит как нерифмованный тонический стих.
Кстати, именно по этой причине я негативно отношусь к русскому верлибру. 250 лет назад из русской литературы с улюлюканьем изгнали силлабический стих, разъяснив, что он является механическим подражанием польской поэзии, а у поляков ударение фиксированное и потому для русского языка силлабика не подходит. Зачем же теперь механически подражать французскому? Ведь исходно французский верлибр именно и есть продукт расшатывания силлабики, возникший в языке с фиксированным ударением.

Date: 2020-01-12 01:33 pm (UTC)
From: [identity profile] egovoru.livejournal.com
"В англофонном и франкофонном мире, наоборот, верлибр давно стал нормой"

Но все-таки это "давно" относится к уже письменным временам, разве нет? Впрочем, Вики утверждает, ссылаясь на какие-то недоступные статьи, что истоки верлибра кроются в "дописьменном поэтическом творчестве". Мне это трудновато представить: все-таки в отсутствие письменности на первое место выступает необходимость запоминать текст, а метрическая организация сильно облегчает это.

Ну и, конечно, наличие фиксированного ударения в языке сильно влияет на характер стихосложения.

"нельзя сказать, что французский верлибр - неметрический"

Мне кажется, и в русском верлибре все же сохраняются остатки метрики, только метр меняется от строчки к строчке: строчка "Она пришла с мороза" - это правильный ямб, "И внимательно смотрит в окно" - это правильный анапест, и т.д.

Date: 2020-01-13 09:49 am (UTC)
From: [identity profile] steblya-kam.livejournal.com
Но все-таки это "давно" относится к уже письменным временам, разве нет? - нууу, куда загнули! Письменность существует 5000 лет, и даже на Руси 1000 лет, а мы обсуждаем последние 100-200 лет.
Мне кажется, и в русском верлибре все же сохраняются остатки метрики, только метр меняется от строчки к строчке: строчка "Она пришла с мороза" - это правильный ямб, "И внимательно смотрит в окно" - это правильный анапест, и т.д. - это Вы сейчас пример из Блока дали, который в учебниках по теории стиха приводят. Но только Блок жил 100 лет назад и писал преимущественно метрическим стихом, так что понятно, почему он находился под влиянием метрики. Современный русский верлибр выглядит совсем иначе.

Date: 2020-01-13 01:13 pm (UTC)
From: [identity profile] egovoru.livejournal.com
"Современный русский верлибр выглядит совсем иначе"

Вот полный список того, что Манин использовал в качестве верлибра (к сожалению, он не везде указывает названия произведений, только имена авторов):

"Blok; Borges; Brodsky; Daniil Kharms, excerpt from ‘‘Komedija goroda
Peterburga’’ [A comedy of the city of Petersburg](1927); Kibirov; Kruzhkov; Kuzmin; Pushkin, excerpt from ‘‘Boris Godunov’’(1831);W illiam Shakespeare, excerpt from Hamlet in Russian translation by Pasternak (1940)".

Date: 2020-01-14 09:47 am (UTC)
From: [identity profile] steblya-kam.livejournal.com
В качестве верлибра Пушкин и Шекспир? Ой... А Вы точно цитируете то, что он к верлибру относит?
Вообще какая-то поразительная незамутнённость у этого автора - современных русских верлибров можно за 5 минут нарыть целую библиотеку по сетевым литературным журналам. Лично я знаю двух авторов, пишущих верлибрами, один совсем пожилой, за 80 лет, второй мой ровесник, сорокалетний.

Date: 2020-01-14 12:55 pm (UTC)
From: [identity profile] egovoru.livejournal.com
"А Вы точно цитируете то, что он к верлибру относит?"

Да, я скопировала текст статьи дословно :) Автор, конечно - в первую очередь физик и программист, но так же и переводчик стихов (http://www.vekperevoda.com/1950//manin_d.htm) - думаю, он все же знает, о чем говорит :)
Page 1 of 3 << [1] [2] [3] >>

Profile

egovoru: (Default)
egovoru

January 2026

S M T W T F S
    123
456 78910
11121314151617
18192021222324
25262728293031

Style Credit

Expand Cut Tags

No cut tags
Page generated Jan. 14th, 2026 01:43 pm
Powered by Dreamwidth Studios