Словарный запас русского рэппера

Как-то раз я сидел в раздумиях о женщинах и русском рэпе. Обычно я это делаю на pornhub.com и porno-rap.com, но в этот раз все размышления были внутри. «Как можно называть здоровой культуру, где каждый с завидным постоянством ебёт чужих мам/девушек?» — промелькнуло в голове. Я решил узнать точно, в числах, как много у нас ебут чужих мам. С этого началась рэп-аналитика в числах, о которой мы сегодня вам расскажем.

Картинку определенно стоит поразглядывать в полном формате

Примерно в то же время в интернете всплыли два крутых доклада об анализе западных исполнителей. Первый вы скорее всего уже видели, есть ещё второй, более технический, но не менее интересный:

На западе есть rapgenius, у нас есть текстовая база rap-text.ru, на материалах которой основан весь анализ ниже.

Словарный запас

По данным Википедии, А. С. Пушкин имел словарный запас 20 тыс. слов, Ленин — 37 тыс. слов. Сколько же имеют в запасе русские рэпперы? Для ответа на этот вопрос прежде всего важно понимать, что количество композиций (объём написанных текстов) коррелирует с количеством уникальных слов. Можно построить двумерное распределение количества уникальных слов против общего количества слов, на котором отчётливо видна корреляция:

Очевидно, говорить что-то про область слева снизу трудно из-за малых объёмов текстов, да и в общем там находится какой-то шлак, на который всем похуй. Осталось определить где кончается эта «область шлака». Можно сделать какой-нибудь хитрый фит(fit, а не feat.) или натренировать классификатор, но поступим проще и просто возьмём всех рэперов с количеством уникальных слов больше 4000. Теперь рассчитаем для каждого значение (уникальные слова/все слова), и отсортируем кандидатов по нему.

Вот TOP-20 со значениями искомой переменной (предварительно список прошел фильтр расового отбора):

Жёлтая ветка 0.472
Проект Увечье 0.460
Крип-А-Крип 0.445
Дядя Женя 0.414
Oxxxymiron 0.404
Дымовая завеса 0.404
Brick Bazuka 0.400
Соль Земли 0.391
RE-pac 0.391
5 Плюх 0.385
Типси Тип 0.384
ГРОТ 0.379
ОУ74 0.378
9 грамм 0.375
Ноггано 0.368
Миша Маваши 0.363
Babangida 0.347
АК-47 0.343
25/17 0.340
Триагрутрика 0.339
Полный список вы можете найти здесь.

Мамоёбство

Всегда любуюсь на этот список после прослушивания баттл-рэпа. Мам у нас ценят, ну а если поёбывают, то только чуть чуть, для свободомыслия. Число рядом с песней — количество упоминания «мам»:

Дуня — Бездельник 21
Shot — Моя вторая мама 20
Восточный Округ feat. Slim — Мама 16
ST feat. Джи Вилкс — Моя улица 16
T1One feat. Анастасия К. — Мама 16
Michgunz — Владик 15
Птаха — Первое слово 15
Серега — Говорила мама 14
Kav-Kaz — Двадцать девятое ноября 13
Ай-Q — Жизнь растамана 12
Миша Крупин — Мама Лиза 12
Мистер Малой — Руки прочь от Майкла Джексона 12
GuntanoMo — Мама говорила 11
D1MASS — Мама 11
ГИГА feat. Sokolovsky — Мама 11
Oxxxymiron — Судьба моралиста 10

(BONUS) Наглухо заебавший Босх

По мотивам наглухо заебавшего Кусто ловите треков с наглухо заебавшим Босхом:

Krec — Весна
Big Black Boots — В чем фишка?
4пыль — Стопки
Just (TERRA INCOGNITA) — Жребий брошен
Oxxxymiron — Лондон против всех
palach — Байки у костра
Дядя Женя — Мой хип-хоп
Дядя Женя — Очевидное — невероятно
Смоки Мо feat. Арнольд — Отрывки из стихов
Соль Земли — В отрыв
Проект Увечье — Строго
Типси Тип — Органы

P.S. Ребята, список основан на базе данных реальных текстов и математических вычислениях, науке абсолютно похуй на наши и ваши личные пристрастия. Любой старшеклассник может проверить эти расчеты.

8 18 314
0
0

Ерлан Тюльбеков
Ерлан Тюльбеков3 лет 8 месяцев назад

Странно то что Schokk не попал в список мамоебов

imperialstormtroopers
imperialstormtroopers3 лет 8 месяцев назад

Желтая Ветка — топовая москоу андер группа) Обожаю их творчество

George Goloskov
George Goloskov3 лет 8 месяцев назад

Поясните мне что значат цифра слева, внизу и справа на графике. А также что значат цифры в топе?

THEozvOfromKERCH .
THEozvOfromKERCH .3 лет 8 месяцев назад

вертикальная ось — количество уникальных слов в текстах исполнителя, горизонтальная — количество вообще всех слов в текстах. Соответственно при вычислении коэффициента определяется, чем он больше тем богаче словарный запас, как я понял.

George Goloskov
George Goloskov3 лет 8 месяцев назад

Спасибо!

FlowRGB
FlowRGB3 лет 8 месяцев назад

У меня словарный запас 49к слов. Может начать стихи писать?

Syoma Tetelman
Syoma Tetelman1 год 1 месяц назад

Мне кажется, топ по уникальным словам — штука более показательная, чем уникальные/тотал.
И еще непонятно, по какому принципу проходил «расовый отбор» — за что злого духа вырезали?)

trackback

[…] По словарному запасу, группа Соль Земли занимает 8ое место. Теперь ближе к Самому […]

Авторизация
Войти на сайт 
Регистрация
*
*
*
Войти на сайт 
Генерация пароля