воскресенье, 20 октября 2024 г.

Соревнование на Kaggle : классификация с "Человеческим обучением" по Глебу Михайлову

     Решил совместить две задачи : прослушать курс на Stepik DS Глеба Михайлова и принять участие в соревновании по классификации на Kaggle. Задача соревнования : кредитный скоринг, по нескольким параметрам оценить платежеспособность клиента и выдать рекомендацию дать или не дать ему кредит. Соревнование называется Loan Approval Prediction (Прогноз одобрения кредита).

суббота, 2 декабря 2023 г.

Машинное обучение в розничной торговле : выбросы и заполнение пропущенных значений

Как правило, большинство дневных данных в розничной торговле не содержит пропусков за исключением такого показателя как количество зашедших посетителей. Чаще всего это связано с неисправностью счетчиков. Однако очень важно иметь достоверную информацию о посетителях. При этом важно работать не только с пропусками, но и с выбросами, которые также связаны с неисправностью счетчиков. Поэтому при подготовке данных по посетителям вначале надо отбросить выбросы, пусть они также будут считаться пропусками. Таким образом, под пропусками будем понимать как отсутствие значений, так и недостоверные данные. 

понедельник, 24 апреля 2023 г.

Статистика с Python в розничной торговле : оценки центрального положения

Основные показатели розничной торговли могут иметь множество различимых значений. Первый шаг в их анализе заключается в получении "типичного значения" для каждого из показателей или другими словами оценки того, вокруг какого значения расположено большинство данных, т.е. в нахождении их центральной тенденции. В этой статье будут рассмотрены следующие показатели и их расчет с помощью Python : среднее арифметическое, геометрическое и гармоническое, среднее взвешенное, среднее усеченное, медиана, медиана нижняя, медиана верхняя и медиана взвешенная.

вторник, 24 января 2023 г.

Машинное обучение с библиотеками PyCaret и TROT : классификация, часть третья

В этой статье продолжим  рассмотрение практических примеров автоматизированного машинного обучение в задачах классификации с помощью TPOT, взятых из книги "Radečić Dario. Machine Learning Automation with TPOT: Build, validate, and deploy fully automated machine learning models with Python". Рассмотрим основные темы, такие как загрузка набора данных, очистка и предварительный анализ данных, создадим базовую модель классификации с помощью логистической регрессии и пакета sklean.Затем углубимся в классификацию с помощью ТPОТ. Узнаем, как обучать и оценивать автоматизированные модели классификации. 

суббота, 14 января 2023 г.

Машинное обучение с библиотеками PyCaret и TROT : классификация, часть вторая

 Продолжаем знакомиться с автоматизированным машинным обучением на примере работы с библиотекой PyCaret и рассмотрим с сайта библиотеки учебник по мультиклассовая классификация MCLF101  — уровень для начинающих.

пятница, 6 января 2023 г.

Машинное обучение с библиотеками PyCaret и TROT : классификация, часть первая

Продолжаем осваивать автоматизированное машинное обучение с с библиотеками PyCaret и TROT, переходим к классификации и начнем с примера из книги "Tolios G. Simplifying Machine Learning with PyCaret: A Low-code Approach for Beginners and Experts"

понедельник, 12 декабря 2022 г.

Машинное обучение с библиотеками PyCaret и TROT : регрессия, часть четвертая

В четвертой части знакомства с автоматизированное машинное обучение будем работать с библиотекой TROT по книге "Radečić Dario. Machine Learning Automation with TPOT: Build, validate, and deploy fully automated machine learning models with Python".