или
Заказать новую работу(фрагменты работы)
Учебное заведение: | Учебные заведения Санкт-Петербурга(Питера) > Санкт-Петербургский государственный электротехнический университет (ЛЭТИ) > Факультет компьютерных технологий и информатики (ФКТИ) |
Тип работы: | Дипломные работы |
Категория: | Информационные технологии |
Год сдачи: | 2024 |
Количество страниц: | 68 |
Оценка: | 5 |
Дата публикации: | 16.06.2024 |
Количество просмотров: | 53 |
Рейтинг работы: |
Работа посвящена реализации алгоритма и программного модуля для идентификации дорожных знаков! Код самописный, использовалась YOLOv8, производилось обучение. Программный модуль тоже написан сам! Код внутри присутствует
(фрагменты работы)
2 Подготовка данных и модели к программной реализации
Прежде чем переходить к непосредственно кодовой реализации нашей задачи, необходимо провести предварительную обработку данных и углубленно проанализировать выбранную архитектуру YOLOv8.
2.1 Предварительная обработка собранных данных
Собранный набор данных включает в себя 15 различных классов изображений дорожных указателей. Всего в наборе данных представлено 4969 изображений. Часть из этих изображений была собрана мной, а часть из них была взята из уже готовых датасетов. Ниже перечислим классы дорожных указателей, из которых и состоит датасет:
• зеленый свет светофора;
• красный свет светофора;
• знак «Стоп»;
• знак «Ограничение максимальной скорости 10 км/ч»;
• знак «Ограничение максимальной скорости 100 км/ч»;
• знак «Ограничение максимальной скорости 110 км/ч»;
• знак «Ограничение максимальной скорости 120 км/ч»;
• знак «Ограничение максимальной скорости 20 км/ч»;
• знак «Ограничение максимальной скорости 30 км/ч»;
• знак «Ограничение максимальной скорости 40 км/ч»;
• знак «Ограничение максимальной скорости 50 км/ч»;
• знак «Ограничение максимальной скорости 60 км/ч»;
• знак «Ограничение максимальной скорости 70 км/ч»;
• знак «Ограничение максимальной скорости 80 км/ч»;
• знак «Ограничение максимальной скорости 90 км/ч».
Далее необходимо разметить наши данные. Разметка данных нужна для помощи в выявлении логических закономерностей, структурированию данных. Чем лучше будет произведена разметка данных, тем лучше пройдет обучение НС. Данный метод называется обучением с учителем, так как мы уже задаем правильные ответы, тем самым представляем нашей модели некий ориентир, по которому она может выявлять признаки и тем самым «обучаться».
Для разметки данных мною был выбран сайт Roboflow [8], который является одним из ведущих сайтов по предоставлению наборов данных для задач компьютерного зрения.
Для начала были созданы 15 классов, которыми потом мы будем давать метки нашим изображениям. Процесс создания метки класса представлен на рисунке 5.
После создания классов мы непосредственно переходим к разметке набора данных. Процесс разметки запечатлен на рисунке 6. С помощью боковой панели инструментов справа и присвоения класса в графе слева происходит формирование ограничительной области и выдача ей соответствующей метки класса.
Также все изображения стоит привести к единому размеру. Оптимальным размером было выбрано разрешение 416x416.
После разметки всех изображений мы можем экспортировать наш датасет. Большой плюс используемого сайта Roboflow заключается в предоставлении различных форматов экспорта данных. В современном мире два наиболее используемых формата хранения данных: COCO [9] и YOLO [10]. Процесс экспортирования датасета представлен на рисунке 7.
После эскпортирования данных в виде ZIP-архива и последующей его распаковки на компьютер мы получаем древовидную структуру каталога с датасетом. Полученная структура после распаковки архива запечатлена на рисунке 8.
С сайта нам идет три папки для трех типов данных: тренировочных, валидационных и тестовых. Train, valid и test папки соответственно. Помимо папок в ZIP-архиве лежит файл data.yaml. В этом файле указываются пути до тренировочного, валидационного и тестового наборов данных, а также количество меток и их классы. Его структура представлена на рисунке 9.
Похожие работы