Industrial Big Data Analytics

Распознавание N-го количества людей и объектов на изображениях и в видеозаписях с применением технологий видеоаналитики.

Решение задачи: программы/скрипты, решающие задачи по следующим критериям:

  1. Решение базовой задачи: с помощью данных для проверки оценивается параметр точности: скорость вычисления на индивидуальных фотографиях и на всех фотографиях с точностью распознавания людей 90% и более (12б).

  2. Решение первой дополнительной задачи (A или B):

    1. Использование готовой нейронной сети с настройкой конфигурационных параметров (6б):

      1. Время распознавания для индивидуальных фотографий или для всех фотографий в целом (на CPU: 6,12): не более 1 секунды: 2 балла, не более 2 секунд: 1 балл

      2. Пороговая точность распознавания для каждой фотографии: 95%+: 2 балла, 90%+: 1 балл

      3. Оригинальность программного кода: использование готового фреймворка с собственными функциями (возможно, измененными исходными): 2 балла, несколько функций (2-3) взяты с источников из сети Интернет: 1 балл, полностью скопированные функции из какой-либо статьи/сайта: 0 баллов

    2. Обучение собственной нейронной сети на основе приведенных или собственных датасетов (6б)

  3. Решение второй дополнительной задачи:

    1. Распознавание людей и событий в видеоданных (3б):

      1. Распознавание нескольких людей в видео с выводом изображения на экран (1б)

      2. Распознавание событий в видео:

        1. Определение координат человека и их интерпретация на примере исходного видео (1б)

        2. Определение активности людей на основе анализа их координат (1б)

  4. Решение третьей дополнительной задачи (A или B):

    1. Полная или частичная интеграция вычислений на GPU (3б)

    2. Полная или частичная интеграция вычислений с/на маломощное устройство (3б)

Итого: 24 балла.

 

Исходные данные: 

 

  1. Пример датасета фотографий с людьми (для обучения и проверки используется следующая: https://www.kaggle.com/smeschke/pedestrian-dataset). Пример тестовых изображений и видеозаписей: https://drive.google.com/file/d/1QuhUrbgTE7ekM4qZ5R-3plLTV6sExnMe/view?usp=sharing, пароль: HackathonVideo10

Датасеты для обучения.

Pedestrian dataset:

https://www.kaggle.com/karthika95/pedestrian-detection

Coco dataset:

https://cocodataset.org/#download

Пример установки всех необходимых библиотек доступен по ссылке:

https://github.com/nikitawow1337/tensorflow-guide

 


Модератор: Баженов Никита Александрович, младший научный сотрудник

Задание #6