Даня Порнорэп Даня Порнорэп
21 марта 2015
8 527
0
0

Словарный запас русского рэппера

Как-то раз я сидел в раздумиях о женщинах и русском рэпе. Обычно я это делаю на pornhub.com и porno-rap.com, но в этот раз все размышления были внутри. «Как можно называть здоровой культуру, где каждый с завидным постоянством ебёт чужих мам/девушек?» — промелькнуло в голове. Я решил узнать точно, в числах, как много у нас ебут чужих мам. С этого началась рэп-аналитика в числах, о которой мы сегодня вам расскажем.

Картинку определенно стоит поразглядывать в полном формате

Примерно в то же время в интернете всплыли два крутых доклада об анализе западных исполнителей. Первый вы скорее всего уже видели, есть ещё второй, более технический, но не менее интересный:

На западе есть rapgenius, у нас есть текстовая база rap-text.ru, на материалах которой основан весь анализ ниже.

Словарный запас

По данным Википедии, А. С. Пушкин имел словарный запас 20 тыс. слов, Ленин — 37 тыс. слов. Сколько же имеют в запасе русские рэпперы? Для ответа на этот вопрос прежде всего важно понимать, что количество композиций (объём написанных текстов) коррелирует с количеством уникальных слов. Можно построить двумерное распределение количества уникальных слов против общего количества слов, на котором отчётливо видна корреляция:

Очевидно, говорить что-то про область слева снизу трудно из-за малых объёмов текстов, да и в общем там находится какой-то шлак, на который всем похуй. Осталось определить где кончается эта «область шлака». Можно сделать какой-нибудь хитрый фит(fit, а не feat.) или натренировать классификатор, но поступим проще и просто возьмём всех рэперов с количеством уникальных слов больше 4000. Теперь рассчитаем для каждого значение (уникальные слова/все слова), и отсортируем кандидатов по нему.

Вот TOP-20 со значениями искомой переменной (предварительно список прошел фильтр расового отбора):

Жёлтая ветка 0.472
Проект Увечье 0.460
Крип-А-Крип 0.445
Дядя Женя 0.414
Oxxxymiron 0.404
Дымовая завеса 0.404
Brick Bazuka 0.400
Соль Земли 0.391
RE-pac 0.391
5 Плюх 0.385
Типси Тип 0.384
ГРОТ 0.379
ОУ74 0.378
9 грамм 0.375
Ноггано 0.368
Миша Маваши 0.363
Babangida 0.347
АК-47 0.343
25/17 0.340
Триагрутрика 0.339
Полный список вы можете найти здесь.

Мамоёбство

Всегда любуюсь на этот список после прослушивания баттл-рэпа. Мам у нас ценят, ну а если поёбывают, то только чуть чуть, для свободомыслия. Число рядом с песней — количество упоминания «мам»:

Дуня – Бездельник 21
Shot – Моя вторая мама 20
Восточный Округ feat. Slim – Мама 16
ST feat. Джи Вилкс – Моя улица 16
T1One feat. Анастасия К. – Мама 16
Michgunz – Владик 15
Птаха – Первое слово 15
Серега – Говорила мама 14
Kav-Kaz – Двадцать девятое ноября 13
Ай-Q – Жизнь растамана 12
Миша Крупин – Мама Лиза 12
Мистер Малой – Руки прочь от Майкла Джексона 12
GuntanoMo – Мама говорила 11
D1MASS – Мама 11
ГИГА feat. Sokolovsky – Мама 11
Oxxxymiron – Судьба моралиста 10

(BONUS) Наглухо заебавший Босх

По мотивам наглухо заебавшего Кусто ловите треков с наглухо заебавшим Босхом:

Krec – Весна
Big Black Boots – В чем фишка?
4пыль – Стопки
Just (TERRA INCOGNITA) – Жребий брошен
Oxxxymiron – Лондон против всех
palach – Байки у костра
Дядя Женя – Мой хип-хоп
Дядя Женя – Очевидное – невероятно
Смоки Мо feat. Арнольд – Отрывки из стихов
Соль Земли – В отрыв
Проект Увечье – Строго
Типси Тип – Органы

P.S. Ребята, список основан на базе данных реальных текстов и математических вычислениях, науке абсолютно похуй на наши и ваши личные пристрастия. Любой старшеклассник может проверить эти расчеты.

8 527
0
0
Пожалуйста, авторизуйтесь чтобы добавить комментарий.
Ерлан Тюльбеков
Ерлан Тюльбеков

Странно то что Schokk не попал в список мамоебов

imperialstormtroopers
imperialstormtroopers

Желтая Ветка – топовая москоу андер группа) Обожаю их творчество

George Goloskov
George Goloskov

Поясните мне что значат цифра слева, внизу и справа на графике. А также что значат цифры в топе?

THEozvOfromKERCH .
THEozvOfromKERCH .

вертикальная ось – количество уникальных слов в текстах исполнителя, горизонтальная – количество вообще всех слов в текстах. Соответственно при вычислении коэффициента определяется, чем он больше тем богаче словарный запас, как я понял.

George Goloskov
George Goloskov

Спасибо!

FlowRGB

У меня словарный запас 49к слов. Может начать стихи писать?

Syoma Tetelman
Syoma Tetelman

Мне кажется, топ по уникальным словам – штука более показательная, чем уникальные/тотал.
И еще непонятно, по какому принципу проходил “расовый отбор” – за что злого духа вырезали?)

Авторизация
Войти на сайт 
Регистрация
*
*
*
Войти на сайт 
Генерация пароля