Первокурсник HITs ТГУ занял первое место в авторитетном соревновании по анализу данных
Вячеслав справился с этим лучше всех и разделил первое место с магистрантом из Сколково.
Все мы пользуемся веб-сайтами, например, почтой, социальными сетями или онлайн-банкингом, где есть данные и функционал для работы с ними, например, по переводу денег. Однако через уязвимости в сервисе злоумышленники могут получить доступ к этим данным. Один из способов защиты – анализировать поступающие к сервису запросы и отделять «хорошие» от содержащих атаки. И здесь даже очень «хитрые» алгоритмы значительно проигрывают современным методам машинного обучения.
Точность модели машинного обучения, которую разработал Вячеслав Бакулин, по данным организаторов, составила 0,99985, и это очень высокий показатель.
– Задачи из этой области обычно не имеют точного решения, поэтому нужна такая математическая модель, которая с наибольшей точностью сможет классифицировать данные или предсказывать результаты, – поясняет студент. – В качестве модели нередко выступают нейронные сети, деревья решений и другие методы. Я использовал градиентный бустинг, а участник, разделивший со мной первое место, – архитектуру реккурентной нейросети.
Соревнования по анализу данных на платформе kaggle.com являются одними из самых популярных и авторитетных в сфере Data Science. Для людей, собирающихся стать специалистами в машинном обучении, такого рода конкурсы являются must have в портфолио. Компании, которым требуется решить сложную задачу по машинному обучению, предпочитают размещать свои проблемы и данные к ним именно на этой платформе и предлагают участникам солидные денежные призы за решения. На последних соревнованиях награда за 1 место составляла $1000.
Отметим, что Вячеслав уже побеждал в подобном соревновании, организованном компанией СИБУР.
Комментарии
(0) Добавить комментарий