Все
на той же БДАвтор: Wolverrum
Дата: 24.04.17
, но за ~7 лет "несколько" подросшей (~7M страниц), запулил очередное небольшое исследование
Как у нас обстоят дела друг у друга с расчеловечиванием?
Числа в таблице — относительные доли, домноженные на константу, чтобы не утонуть в нулях; формула такая:
10000*Вхождений/ВсегоСтатей
| Паттерны, по которым производился поиск |
| Колонка 1: хохол, хохл*, могилиз*, хинзир*, змагар*, чуб*, нацик*, нацист*, бандер*
Колонка 2: козломорд*, москал*, мацкал*, кацап*, чмоб*, чмон*, ябатьк*, рашист*, русак*, свинорус*, свинособ*, орки/орка |
| |
Результат вышел примерно такой:
Таблица иллюстрирует несколько моментов:
1. Демонстрация, насколько СМИ оскотинились в плане лексики;
2. Неожиданно для себя —
одиннародёпта друг друга, увы, стоим, хотя, конечно, у "укропов" чуть затейливее.
3. Да, мне пока тоже неясна аномалия 8,1