Принц
Администратор
- Регистрация
- 16 Дек 2016
- Сообщения
- 161.581
- Реакции
- 465.775
Складчина: Современное компьютерное зрение [stepik] [AI Education] [Елена Кантонистова,Марк Блуменау]
Курс посвящен основам глубинного обучения в области Computer Vision (CV). В курсе мы начнем с азов компьютерного зрения, а затем затронем актуальные задачи CV и посмотрим на устройство популярных решений.
Программа курса
О курсе
Классические методы Computer Vision
Основы обработки изображений: фильтры и сверткиДемо-доступ
Операторы градиента: Лаплас, Собель, КанниДемо-доступ
Бинаризация и трешхолдинг (Otsu, адаптивный порог)Демо-доступ
Методы выделения признаков: SIFT и другие
HOG: гистограммы направленных градиентов
Поиск и сопоставление ключевых точек
Преобразование Хафа и обнаружение геометрических фигур
Пространственные преобразования: аффинные и перспективные
CNN и первые архитектуры
Основы сверточных нейронных сетей: ядра, фильтры, пуллинги
Архитектура LeNet: первые шаги в CV с использованием CNN
AlexNet: особенности и влияние на развитие глубокого обучения
VGG: глубокие сети с фиксированными свертками
ResNet: идея резидуальных связей для решения проблемы исчезающих
Домашнее задание
Современные архитектуры CV
ViT (Vision Transformer): альтернатива CNN
MobileNet: легковесные модели для мобильных устройств
EfficientNet и EfficientNetV2: масштабируемость и оптимизация
Практика: аугментации и MBConv
Домашнее задание
Детекция
Основы задачи детекции и Non-Maximum Suppression
RCNN: архитектура и эволюция (Fast RCNN, Faster RCNN)
YOLOv1
Современные подходы к детекции: YOLO11 и более новые версии
Детекция на практике
Домашнее задание
Сегментация
Задача сегментации
U-Net: идея и применение в медицинских изображениях
Deeplab и его разновидности: адаптация к различным уровням разре
Mask R-CNN: объединение детекции и сегментации
Segment Anything Model (SAM): универсальная модель сегментации
Практика по сегментации
Домашнее задание (тестирование)
Трекинг и работа с видеопотоками
Задача трекинга и оценивание качества трекинга
Алгоритм трекинга
Работа с видеопотоками. FFMpeg: чтение, запись, сжатие видео
Gstreamer: организация сложных видео- и аудиопайплайнов
Практика: захват видео с камер в реальном времени
Тест по последнему занятию
Итоговый проект курса
Итоговый проект курса
Дополнительно: библиотека OpenCV
Установка библиотеки. Загрузка и вывод изображений
Дополнительно: фреймворк FastAPI
Аннотации типов в Python
Практика с FastAPI
Библиотека Pydantic
СКАЧАТЬ
Курс посвящен основам глубинного обучения в области Computer Vision (CV). В курсе мы начнем с азов компьютерного зрения, а затем затронем актуальные задачи CV и посмотрим на устройство популярных решений.
Программа курса
О курсе
Классические методы Computer Vision
Основы обработки изображений: фильтры и сверткиДемо-доступ
Операторы градиента: Лаплас, Собель, КанниДемо-доступ
Бинаризация и трешхолдинг (Otsu, адаптивный порог)Демо-доступ
Методы выделения признаков: SIFT и другие
HOG: гистограммы направленных градиентов
Поиск и сопоставление ключевых точек
Преобразование Хафа и обнаружение геометрических фигур
Пространственные преобразования: аффинные и перспективные
CNN и первые архитектуры
Основы сверточных нейронных сетей: ядра, фильтры, пуллинги
Архитектура LeNet: первые шаги в CV с использованием CNN
AlexNet: особенности и влияние на развитие глубокого обучения
VGG: глубокие сети с фиксированными свертками
ResNet: идея резидуальных связей для решения проблемы исчезающих
Домашнее задание
Современные архитектуры CV
ViT (Vision Transformer): альтернатива CNN
MobileNet: легковесные модели для мобильных устройств
EfficientNet и EfficientNetV2: масштабируемость и оптимизация
Практика: аугментации и MBConv
Домашнее задание
Детекция
Основы задачи детекции и Non-Maximum Suppression
RCNN: архитектура и эволюция (Fast RCNN, Faster RCNN)
YOLOv1
Современные подходы к детекции: YOLO11 и более новые версии
Детекция на практике
Домашнее задание
Сегментация
Задача сегментации
U-Net: идея и применение в медицинских изображениях
Deeplab и его разновидности: адаптация к различным уровням разре
Mask R-CNN: объединение детекции и сегментации
Segment Anything Model (SAM): универсальная модель сегментации
Практика по сегментации
Домашнее задание (тестирование)
Трекинг и работа с видеопотоками
Задача трекинга и оценивание качества трекинга
Алгоритм трекинга
Работа с видеопотоками. FFMpeg: чтение, запись, сжатие видео
Gstreamer: организация сложных видео- и аудиопайплайнов
Практика: захват видео с камер в реальном времени
Тест по последнему занятию
Итоговый проект курса
Итоговый проект курса
Дополнительно: библиотека OpenCV
Установка библиотеки. Загрузка и вывод изображений
Дополнительно: фреймворк FastAPI
Аннотации типов в Python
Практика с FastAPI
Библиотека Pydantic
СКАЧАТЬ
Для просмотра скрытого содержимого вы должны зарегистрироваться
Возможно, Вас ещё заинтересует:
- Недвижимость, энергия наслаждения и исток творения [Все мастерские] [Дарья Еремина]
- Подписка на материалы AiQ Club (август 2025) [Игорь Бабко]
- [Аудиокнига + книга] Сказки про маленькую Нарциссочку [Юлия Пирумова]
- Схемы Жуковой [nutriciolog_zhukova] [Валентина Жукова]
- NLP на каждый день [Дмитрий Гурин]
- Бывшие vs. Закон: неожиданные решения Верховного суда [Статут] [Яна Воробьёва]