Дно журналистики, или расчеловечивание в числах
От: Wolverrum Ниоткуда  
Дата: 26.06.24 22:07
Оценка: 2 (1) -1
Все на той же БД
Автор: Wolverrum
Дата: 24.04.17
, но за ~7 лет "несколько" подросшей (~7M страниц), запулил очередное небольшое исследование

Как у нас обстоят дела друг у друга с расчеловечиванием?
Числа в таблице — относительные доли, домноженные на константу, чтобы не утонуть в нулях; формула такая: 10000*Вхождений/ВсегоСтатей

  Паттерны, по которым производился поиск
Колонка 1: хохол, хохл*, могилиз*, хинзир*, змагар*, чуб*, нацик*, нацист*, бандер*
Колонка 2: козломорд*, москал*, мацкал*, кацап*, чмоб*, чмон*, ябатьк*, рашист*, русак*, свинорус*, свинособ*, орки/орка


Результат вышел примерно такой:
Регион СМИ рашисты,кацапы,ябатьки,etc хохлы,бандеровцы,змагары,etc
BY 1,1 4,3
RU 1,5 18,6
UA 12,0 8,1
Таблица иллюстрирует несколько моментов:
1. Демонстрация, насколько СМИ оскотинились в плане лексики;
2. Неожиданно для себя — одиннародёпта друг друга, увы, стоим, хотя, конечно, у "укропов" чуть затейливее.
3. Да, мне пока тоже неясна аномалия 8,1
Отредактировано 26.06.2024 22:08 Wolverrum . Предыдущая версия .
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.