Data Science пример задачи кредитного скоринга / Урок построения модели ML на python HD

Data Science пример задачи кредитного скоринга / Урок построения модели ML на python
00:24:27
Обнаружено блокирование рекламы на сайте

Для существования нашего сайта необходим показ рекламы. Просим отнестись с пониманием и добавить сайт в список исключений вашей программы для блокировки рекламы (AdBlock и другие).

12n.ru 18136 роликов

Data Science пример задачи кредитного скоринга / Урок построения модели ML на python.

Разбираем задачу по Data Science кредитный скоринг с использованием модели логистической регрессии. Учимся грамотно подходить к разведочному анализу данных EDA, а также обучать модель ML и интерпретировать результаты для бизнеса.

Авторский курс по Data Science для начинающих pymagic.ru

Датасет https://www.kaggle.com/c/sf-dst-scoring

https://github.com/miracl1e6/credit-scoring

Таймкоды:
00:00 Задача кредитного скоринга
00:25 Что необходимо сделать перед построением модели
00:44 Загрузка данных и предварительный анализ
04:07 Главная фишка EDA анализа!!! Как делать EDA?
05:29 Рассматриваем гипотезы
06:13 Анализируем целевую переменную (таргет) / Дисбаланс классов
07:11 Первая гипотеза. Распределение возраста в разрезе таргета (seaborn), нормализуем данные
08:11 Вторая гипотеза. Распределение возраста в разрезе образования / boxplot
10:10 Корреляция признаков
10:30 Третья гипотеза. Анализ зарплат в разрезе таргета / образования
12:33 Feature engineering (генерация фичей), как его делать, какие могут быть новые признаки, что делать с признаком типа дата-время, логарифмирование
15:07 Построение модели машинного обучения. 1 этап — бейзлайн (Logistic Regression)
16:46 Как интерпретировать и использовать метрики precision, recall, roc-auc
17:41 Строим roc-auc curve
18:03 Подбор параметров модели с использованием GridSearch
18:40 Сравниваем результаты на графике roc-auc / анализируем метрики
19:32 Анализ важных признаков после обучения модели
20:02 Используем для анализа важных признаков библиотеку shap / Интерпретирует результаты
22:30 Коэффициенты логистической регрессии
23:27 Сравнение важных признаков в разных классов (визуализация различий)

Instagram www.instagram.com/miracl6_
Facebook https://www.facebook.com/miracl1e6

Группы:
Telegram t.me/pymagic
Facebook https://www.facebook.com/pymagic.ru/

#DataScience #python #ityoutubersru

RSS
Linker Nick
20:12
+3
Я так понимаю, модель это Настя, но почему кредитного скоринга? wink
Nikita Yakovlev
22:19
+2
В разделе про описательные статистики говорится про проверку гипотез. На деле она осуществляется на глазок, без использования строгих процедур, вроде, например, критерия Вилкоксона и ему подобным. Вопрос — в таких задачах строгие критерии просто не нужны или так сделано исключительно в рамках этого ролика?
Виктория Хмелева
17:01
+1
а такие проекты можно использовать в резюме?)
kanye manye
19:14
+1
Миракл сменил пол и деятельность?
Данил Булкин
05:35
Настя ты такая классная!1!!!
Rais Zakirdzhanov
09:34
Кто может дать ссылку на датасет из kaggle? не получается скачать так как выдает «Это соревнование с ограниченным участием. Участвовать могут только приглашенные пользователи.
Рэм Кудусов
10:33
А вы этому в универе научились или сами?
Ahmednt
13:04
Use English language explain for foreign
Хорунжий Александр
14:34
Несите кольцо!!1 Я знал что девушки могут быть умными, но это какой-то космический уровень.
Комментарий удален