Авторство "Тихого Дона": опять 25
От: fplab Россия http://fplab.h10.ru http://fplab.blogspot.com/
Дата: 10.10.11 07:58
Оценка:
Даже не знаю, сюда ли замылил, но все же...
Старая проблема: кто автор "Тихого Дона" и "Поднятой Целины"? Относительно "Поднятой Целины" авторство М.А.Шолохова, кажется, не вызывает сомнений. Учитывая близость (по времени) в написании этих двух произведений, следовало бы ожидать, что частота встречаемости одних и тех же букв должна быть если и не совпадающей, то очень близкой.
Дело было вечером, делать было нечего: написал простейшую программку и "стравил" ей тексты "Тихого Дона" и "Поднятой Целины" (тексты брались с http://www.lib.ru/PROZA/SHOLOHOW/). Результаты и сама программа — во вложении. Не очень-то совпадающие частоты по ряду букв. В частности, из гласных только "А" имеет одну и ту же частоту.
Не знаю, случайность или все-таки правы те, кто утверждают, что у "Тихого Дона" есть и другой автор.
Приходиться заниматься гадостью — зарабатывать на жизнь честным трудом (Б.Шоу)
Re: Авторство "Тихого Дона": опять 25
От: fplab Россия http://fplab.h10.ru http://fplab.blogspot.com/
Дата: 10.10.11 08:09
Оценка:
F>Результаты и сама программа — во вложении

Странно, но не получилось залить на форум результаты и программу. Выложил на http://zalil.ru/31840191
Приходиться заниматься гадостью — зарабатывать на жизнь честным трудом (Б.Шоу)
Re: Авторство "Тихого Дона": опять 25
От: zorba  
Дата: 10.10.11 08:11
Оценка:
Попробуйте эту теорию на других авторах.
Re: Авторство "Тихого Дона": опять 25
От: LaptevVV Россия  
Дата: 10.10.11 08:17
Оценка:
Здравствуйте, fplab, Вы писали:

F>Даже не знаю, сюда ли замылил, но все же...

F>Старая проблема: кто автор "Тихого Дона" и "Поднятой Целины"? Относительно "Поднятой Целины" авторство М.А.Шолохова, кажется, не вызывает сомнений. Учитывая близость (по времени) в написании этих двух произведений, следовало бы ожидать, что частота встречаемости одних и тех же букв должна быть если и не совпадающей, то очень близкой.
F>Дело было вечером, делать было нечего: написал простейшую программку и "стравил" ей тексты "Тихого Дона" и "Поднятой Целины" (тексты брались с http://www.lib.ru/PROZA/SHOLOHOW/). Результаты и сама программа — во вложении. Не очень-то совпадающие частоты по ряду букв. В частности, из гласных только "А" имеет одну и ту же частоту.
F>Не знаю, случайность или все-таки правы те, кто утверждают, что у "Тихого Дона" есть и другой автор.
Буквы — это только один слой. Тут надо считать и слова, и словосочетания.
Тогда для автора выявляются типовые, характерные только для него.
Хочешь быть счастливым — будь им!
Без булдырабыз!!!
Re[2]: Авторство "Тихого Дона": опять 25
От: fplab Россия http://fplab.h10.ru http://fplab.blogspot.com/
Дата: 10.10.11 08:20
Оценка:
Здравствуйте, zorba, Вы писали:

Z>Попробуйте эту теорию на других авторах.

Громко сказано "теория"
Само собой пробовал. У Пушкина (проза) — хорошая совпадаемость. Аналогично у Достоевского. У Толстого не все так гламурно, но учитывая, что там велико влияние супруги-переписчицы, можно принять, что "Анну Каренину", "Войну и Мир" и "Воскресение" написал таки Л.Н.Толстой. Но как-то ни у кого и никогда сомнений в авторстве этих писателей не возникало. "Идиота" мог написать только ФМД
Приходиться заниматься гадостью — зарабатывать на жизнь честным трудом (Б.Шоу)
Re[2]: Авторство "Тихого Дона": опять 25
От: Аноним  
Дата: 10.10.11 08:29
Оценка:
Здравствуйте, LaptevVV, Вы писали:

LVV>Здравствуйте, fplab, Вы писали:


F>>Даже не знаю, сюда ли замылил, но все же...

F>>Старая проблема: кто автор "Тихого Дона" и "Поднятой Целины"? Относительно "Поднятой Целины" авторство М.А.Шолохова, кажется, не вызывает сомнений. Учитывая близость (по времени) в написании этих двух произведений, следовало бы ожидать, что частота встречаемости одних и тех же букв должна быть если и не совпадающей, то очень близкой.
F>>Дело было вечером, делать было нечего: написал простейшую программку и "стравил" ей тексты "Тихого Дона" и "Поднятой Целины" (тексты брались с http://www.lib.ru/PROZA/SHOLOHOW/). Результаты и сама программа — во вложении. Не очень-то совпадающие частоты по ряду букв. В частности, из гласных только "А" имеет одну и ту же частоту.
F>>Не знаю, случайность или все-таки правы те, кто утверждают, что у "Тихого Дона" есть и другой автор.
LVV>Буквы — это только один слой. Тут надо считать и слова, и словосочетания.
LVV>Тогда для автора выявляются типовые, характерные только для него.

Согласен. Если посмотреть это видео, то доктор филологических наук, профессор Литературного института им. М. Горького расказывает, как при анализе произведений Булгакова использовала словосочетания.
http://www.tvkultura.ru/issue.html?id=113518
Re: Авторство "Тихого Дона": опять 25
От: eugals Россия  
Дата: 10.10.11 11:52
Оценка:
Здравствуйте, fplab, Вы писали:

F>Не знаю, случайность или все-таки правы те, кто утверждают, что у "Тихого Дона" есть и другой автор.


Попробуйте разделить "Тихий Дон" на тома. Насколько я помню, среди опровергателей авторства наиболее популярна версия, что он "украл" не роман целиком, а только первые две книги и часть третьей. Концовку писал/правил уже сам.
Re: Авторство "Тихого Дона": опять 25
От: Vzhyk  
Дата: 10.10.11 11:53
Оценка:
10.10.2011 10:58, fplab пишет:

> Не знаю, случайность или все-таки правы те, кто утверждают, что у

> "Тихого Дона" есть и другой автор.
Случайность. Приведи EER своего классификатора и на какой базе он получен.
Posted via RSDN NNTP Server 2.1 beta
Re[2]: Авторство "Тихого Дона": опять 25
От: fplab Россия http://fplab.h10.ru http://fplab.blogspot.com/
Дата: 10.10.11 12:11
Оценка:
Здравствуйте, Vzhyk, Вы писали:

V>10.10.2011 10:58, fplab пишет:


>> Не знаю, случайность или все-таки правы те, кто утверждают, что у

>> "Тихого Дона" есть и другой автор.
V>Случайность. Приведи EER своего классификатора и на какой базе он получен.

Виноват, не в теме: что есть ERR? Откуда взяты тексты — я писал.
Приходиться заниматься гадостью — зарабатывать на жизнь честным трудом (Б.Шоу)
Re: Авторство "Тихого Дона": опять 25
От: Аноним  
Дата: 10.10.11 13:32
Оценка: +2
F>Даже не знаю, сюда ли замылил, но все же...
F>Старая проблема: кто автор "Тихого Дона" и "Поднятой Целины"? Относительно "Поднятой Целины" авторство М.А.Шолохова, кажется, не вызывает сомнений. Учитывая близость (по времени) в написании этих двух произведений, следовало бы ожидать, что частота встречаемости одних и тех же букв должна быть если и не совпадающей, то очень близкой.
F>Дело было вечером, делать было нечего: написал простейшую программку и "стравил" ей тексты "Тихого Дона" и "Поднятой Целины" (тексты брались с http://www.lib.ru/PROZA/SHOLOHOW/). Результаты и сама программа — во вложении. Не очень-то совпадающие частоты по ряду букв. В частности, из гласных только "А" имеет одну и ту же частоту.
F>Не знаю, случайность или все-таки правы те, кто утверждают, что у "Тихого Дона" есть и другой автор.

Вероятность того, что символы в двух разных произведениях имеют одинаковую частоту равна строго нулю (ну в дискретном случае около нуля).
Близко-неблизко это полная ерунда. Введи оценку частоты через предположение о распределении этих значений по произведениям/авторам, матожидание и дисперсию. Проверь на большом количестве авторов при каких-то достоверных допущениях. (ну что независимы нормальное распределение или коррелируют и т.д). Получи численные значения параметров распределения.
Затем на основе исследований двух этих произведений получи доверительный интервал для своей статистической гипотезы куда попадает твой результат.после чего можно будет хоть что-то обсуждать.

F>Не знаю, случайность

Пока да.
Re[3]: Авторство "Тихого Дона": опять 25
От: Vzhyk  
Дата: 10.10.11 13:47
Оценка:
10.10.2011 15:11, fplab пишет:

> V>Случайность. Приведи EER своего классификатора и на какой базе он получен.

>
> Виноват, не в теме: что есть ERR? Откуда взяты тексты — я писал.
Вот сначала окунись в тему, почитай. Всяко полезнее будет, чем последние
остатки форумов кывта троллингом добивать.
Posted via RSDN NNTP Server 2.1 beta
Re[2]: Авторство "Тихого Дона": опять 25
От: Аноним  
Дата: 10.10.11 17:02
Оценка: 6 (1)
F>>Старая проблема: кто автор "Тихого Дона" и "Поднятой Целины"? Относительно "Поднятой Целины" авторство М.А.Шолохова, кажется, не вызывает сомнений. Учитывая близость (по времени) в написании этих двух произведений, следовало бы ожидать, что частота встречаемости одних и тех же букв должна быть если и не совпадающей, то очень близкой.

Я думаю настоящее статистическое исследование текста должно быть очень сложным. Но я с предметной областью не знаком. На основе конкретно твоей идеи предлагаю следующее:

Выбери букву (я думаю корреляция между буквами велика поэтому лучше сначала по одной).
Посчитай её частоту в каждом произведении автора.
Для каждого автора по большому количеству произведений посчитай http://ru.wikipedia.org/wiki/Выборочное_среднее и http://ru.wikipedia.org/wiki/Выборочная_дисперсия по выборке.М и S^2. Будем считать, что автор характеризуется по букве этими двумя числами.
Если частота буквы в спорном произведении выходит за M+-3*s для конкретного автора, то твоя гипотеза уже будет чем-то подкреплена.
(по крайне мере верна в том, что книга статистически отличается от остальных произведений автора. Принятие решения об авторстве это уже не область статистики).
Ну а иначе вообще можно будет посмотреть на пары M,S для разных букв и авторов и понять есть вообще смысл в этом или нет. Может всё будет одинаково, хотя тебе показалось что есть разница.
Re[3]: Авторство "Тихого Дона": опять 25
От: EM Великобритания  
Дата: 10.10.11 17:42
Оценка:
Здравствуйте, Аноним, Вы писали:

F>>>Старая проблема: кто автор "Тихого Дона" и "Поднятой Целины"? Относительно "Поднятой Целины" авторство М.А.Шолохова, кажется, не вызывает сомнений. Учитывая близость (по времени) в написании этих двух произведений, следовало бы ожидать, что частота встречаемости одних и тех же букв должна быть если и не совпадающей, то очень близкой.


А>Я думаю настоящее статистическое исследование текста должно быть очень сложным. Но я с предметной областью не знаком. На основе конкретно твоей идеи предлагаю следующее:


А>Выбери букву (я думаю корреляция между буквами велика поэтому лучше сначала по одной).

А>Посчитай её частоту в каждом произведении автора.
А>Для каждого автора по большому количеству произведений посчитай http://ru.wikipedia.org/wiki/Выборочное_среднее и http://ru.wikipedia.org/wiki/Выборочная_дисперсия по выборке.М и S^2. Будем считать, что автор характеризуется по букве этими двумя числами.
А>Если частота буквы в спорном произведении выходит за M+-3*s для конкретного автора, то твоя гипотеза уже будет чем-то подкреплена.
А>(по крайне мере верна в том, что книга статистически отличается от остальных произведений автора. Принятие решения об авторстве это уже не область статистики).
А>Ну а иначе вообще можно будет посмотреть на пары M,S для разных букв и авторов и понять есть вообще смысл в этом или нет. Может всё будет одинаково, хотя тебе показалось что есть разница.




Не успел сам это предложить
Опыт — это такая вещь, которая появляется сразу после того, как была нужна...
Re: Авторство "Тихого Дона": опять 25
От: notacat  
Дата: 10.10.11 21:42
Оценка:
Люди уже над этим работали:
"Исследователи В. П. Фоменко и Т. Г. Фоменко, указав на неприемлемые методические ошибки предшественников (Хьетсо и др.), построили собственную формальную методику проверки авторства на обширном материале творчества 27 русских писателей[38]. На основе применения этой математической методики был сделан вывод, что «части 1, 2, 3, 4, 5 и, в значительной мере, часть 6 романа написаны не М. А. Шолоховым». На основе этой же методики было проведено сопоставление «Тихого Дона» с текстами Фёдора Крюкова. Результаты анализа не позволили достоверно подтвердить авторство последнего, как не позволили и исключить его. Те же авторы указали на ещё одно любопытное совпадение: «подозрительная» часть романа была написана существенно быстрее, чем все последующие произведения Шолохова"

http://feb-web.ru/feb/sholokh/critics/h89/h89-008-.htm
http://feb-web.ru/feb/sholokh/critics/h89/h89-0162.htm
Re: Авторство "Тихого Дона": опять 25
От: bastrakov Россия http://bastrakof.livejournal.com/
Дата: 11.10.11 02:54
Оценка: 2 (2) +2 :))) :))
Здравствуйте, fplab, Вы писали:

F>Учитывая близость (по времени) в написании этих двух произведений, следовало бы ожидать, что частота встречаемости одних и тех же букв должна быть если и не совпадающей, то очень близкой.


по этой логике, красный квадрат малевича, и черный квадрат малевича, не могли быть написаны одним и тем же человеком.
ну и цикл "времена года" чайковского — вообще целый коллектив авторов писал. во
Re[2]: Авторство "Тихого Дона": опять 25
От: kero Россия  
Дата: 11.10.11 03:08
Оценка: +1
Здравствуйте, notacat, Вы писали:

N>На основе этой же методики было проведено сопоставление «Тихого Дона» с текстами Фёдора Крюкова. Результаты анализа не позволили достоверно подтвердить авторство последнего, как не позволили и исключить его.




N>Те же авторы указали на ещё одно любопытное совпадение: «подозрительная» часть романа была написана существенно быстрее, чем все последующие произведения Шолохова"


Ага, во всем, что касается времени, В.П.Фоменко особенно авторитетен.
По всему, пашиным хозяевам позарез нужна война в Европе
(уверены — к ним не залетит, в предыдущих двух не залетало жеж)
Автор: kero
Дата: 21.07.14
Re[2]: Авторство "Тихого Дона": опять 25
От: Аноним  
Дата: 11.10.11 08:01
Оценка:
Здравствуйте, notacat, Вы писали:

N>Люди уже над этим работали:

N>"Исследователи В. П. Фоменко и Т. Г. Фоменко, указав на неприемлемые методические ошибки предшественников (Хьетсо и др.), построили собственную формальную методику проверки авторства на обширном материале творчества 27 русских писателей[38]. На основе применения этой математической методики был сделан вывод, что «части 1, 2, 3, 4, 5 и, в значительной мере, часть 6 романа написаны не М. А. Шолоховым». На основе этой же методики было проведено сопоставление «Тихого Дона» с текстами Фёдора Крюкова. Результаты анализа не позволили достоверно подтвердить авторство последнего, как не позволили и исключить его. Те же авторы указали на ещё одно любопытное совпадение: «подозрительная» часть романа была написана существенно быстрее, чем все последующие произведения Шолохова"

N>http://feb-web.ru/feb/sholokh/critics/h89/h89-008-.htm

N>http://feb-web.ru/feb/sholokh/critics/h89/h89-0162.htm

Тот самый Фоменко математик-историк, который затролил историков?
Re[3]: Авторство "Тихого Дона": опять 25
От: netch80 Украина http://netch80.dreamwidth.org/
Дата: 11.10.11 10:36
Оценка:
Здравствуйте, Аноним, Вы писали:

N>>Люди уже над этим работали:

N>>"Исследователи В. П. Фоменко и Т. Г. Фоменко, указав на неприемлемые методические ошибки предшественников (Хьетсо и др.), построили собственную формальную методику проверки авторства на обширном материале творчества 27 русских писателей[38]. На основе применения этой математической методики был сделан вывод, что «части 1, 2, 3, 4, 5 и, в значительной мере, часть 6 романа написаны не М. А. Шолоховым». На основе этой же методики было проведено сопоставление «Тихого Дона» с текстами Фёдора Крюкова. Результаты анализа не позволили достоверно подтвердить авторство последнего, как не позволили и исключить его. Те же авторы указали на ещё одно любопытное совпадение: «подозрительная» часть романа была написана существенно быстрее, чем все последующие произведения Шолохова"

N>>http://feb-web.ru/feb/sholokh/critics/h89/h89-008-.htm

N>>http://feb-web.ru/feb/sholokh/critics/h89/h89-0162.htm

А>Тот самый Фоменко математик-историк, который затролил историков?


Нет, это его родители. Как видим, есть целая династия.
The God is real, unless declared integer.
Re[3]: Авторство "Тихого Дона": опять 25
От: notacat  
Дата: 11.10.11 12:11
Оценка:
А>Тот самый Фоменко математик-историк, который затролил историков?
понятия не имею. Просто если автору темы интересен математический подход, то имеет смысл посмотреть, что с этим предшественники делали. А то может уже кто-то все буквы посчитал сто лет назад
Re[3]: Авторство "Тихого Дона": опять 25
От: notacat  
Дата: 11.10.11 12:18
Оценка:
N>>http://feb-web.ru/feb/sholokh/critics/h89/h89-008-.htm
N>>http://feb-web.ru/feb/sholokh/critics/h89/h89-0162.htm

А>Тот самый Фоменко математик-историк, который затролил историков?

никто видимо по ссылкам не ходил — а там подробное исследование других авторов, не Фоменко. С табличками и цифрами
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.