Применение технологий искусственного интеллекта и машинного обучения для поиска угроз информационной безопасности
Автоматизация аналитической деятельности для поиска фактов несанкционированного доступа
ML
AI
R
Threat Hunt
Cyber Threat Intelligence
2-4 часа в неделю, 8 семестр
Что нам нужно
- Знания об используемых методах для решения типовых задач кластеризации, классификакации и регрессии и их применении для решения практических задач.
- Инфраструктура подготовки и предобработки данных, навыки приготовления данных для их последующего использования при построении моделей машинного обучения, а также самостоятельно – в виде отдельного аналитического продукта.
- Умения правильно использовать алгоритмы машинного обучения и контролировать их результаты.
- Навыки использования созданных моделей машинного обучения для решения практических задач поиска угроз информационной безопасности.
Комплексное практическое задание
Темы
Тема 1. Общее понятие машинного обучения. Типовые подходы. Актуальные проблемы информационной безопасности, решаемые с помощью машинного обучения.
Дополнительные материалы к занятиям
Data Science
Обработка больших данных
Данные можно считать большими (BigData) когда они не помещаются в оперативную память Вашего компьютера.
В зависимости от характеристик Вашего компьютера, Вы можете достаточно скоро встретиться с ситуацией, когда память (ОЗУ, она же RAM) исчерпана.
Для решения этой проблемы можно рассмотреть следующие направления:
- Использование СУБД, например, Clickhouse от Yandex.
- Использование подхода lazy-loading для данных:
- Аренда виртуальной машины – например Yandex.Cloud. Учитывая продолжительность данного курса, аренда высокопроизводительной машины на время выполнения задания потребует от Вас затрат сравнимых со стоимостью чашки кофе (и не из Starbucks!). При этом, Вы получите хороший опыт и удовольствие от мощной высокопроизводительной техники. Главное – не забывайте выключать виртуальную машину, когда не занимаетесь решением задач.