BashGU
Electronic Library

Details

	Card	Table	RUSMARC

Галицков, Богдан Валерьевич. Разработка системы для оптимизации создания моделей нейронных сетей: выпускная квалификационная работа по программе бакалавриата. Направление подготовки (специальность) 02.03.03 Математическое обеспечение и администрирование информационных систем. Направленность (профиль): Системное и интернет-программирование / Б.В. Галицков; Уфимский университет науки и технологий, Институт информатики, математики и робототехники, Кафедра программирования и экономической информатики ; научный руководитель К. В. Трунов. — Уфа, 2024. — 48 с. — <URL:https://elib.bashedu.ru/dl/diplom/2024/Galitskov_BV_02.03.03_MOAIS_SIP_06.2024.pdf>. — Текст: электронный

Record create date: 12/18/2024

Subject: ВКР; бакалавриат; проектная ВКР; искусственный интеллект; нейронные сети; графический интерфейс; модели машинного обучения

Collections: Квалификационные работы бакалавров и специалистов; Общая коллекция

Allowed Actions: –

*^% Action 'Read' will be available if you login and work on the computer in the reading rooms of the Library

Group: Anonymous

Network: Internet

Document access rights

	Network		User group		Action
	Library BashGU Local Network		Authenticated users
	Library BashGU Local Network		All
	Internet		Authenticated users
	Internet		All

ВВЕДЕНИЕ
ГЛАВА 1. АНАЛИТИЧЕСКИЙ ОБЗОР ПРЕДМЕТНОЙ ОБЛАСТИ
- 1.1 Машинное обучение
- Система оптимизации создания моделей машинного обучения будет решать задачи в следующих областях: табличная классификация, табличная регрессия, детекция фотографий.
- Машинное обучение — это подраздел искусственного интеллекта, наука, изучающая алгоритмы, автоматически улучшающиеся благодаря опыту.
- Решение всех задач машинного обучения можно записать как функцию, которая отображает объекты(samples) в предсказания(target).Эта функция называется моделью машинного обучения, а имеющийся набор примеров для этой функции – обучающая выборка или датасет...
-  Объектов (например, скачанные фотографии из интернета или данные об активности пользователя)
-  Ответов (подписи к объектам на фотографиях)
- 1.1.1 Постановка задачи
- Описанные выше задачи являются примерами задач обучения с учителем (supervised learning), так как правильные ответы для каждого объекта обучающей выборки заранее известны. Задачи обучения с учителем делятся на следующие виды в зависимости от того, как...
- всех возможных ответов (таргетов):
- - регрессия. Регрессия является типом задачи машинного обучения, которая предсказывается числовые значения на основе данных. Примерами задач регрессии является предсказание цен на недвижимость, спрос на конкретный товар в конкретный день или погода в ...
- - бинарная классификация. Тип в задачи в которой мы предсказываем к какому классу из двух относится объект. Например, мы можем предсказывать, кликнет ли пользователь по рекламному объявлению, вернёт ли клиент кредит в установленный срок, сдаст ли сту...
- - многоклассовая классификация.Так же как и бинарная, но с н-ным количеством классов. Например, определение предметной области для научной статьи (математика, биология, психология и т. д.).
- 1.1.2 Критерии качества
- По обучающей выборке мы хотим построить модель, предсказания которой достаточно хороши. Чтобы проверить качество модели использую метрики качества .У каждой задачи имеются свои метрики, по этому мы рассмотрим некоторые из них:
- Задачи классификаций:
- Перед переходом к самим метрикам необходимо ввести важную концепцию для описания этих метрик в терминах ошибок классификации — confusion matrix (матрица ошибок).
- Допустим, что у нас есть два класса и алгоритм, предсказывающий принадлежность каждого объекта одному из классов, тогда матрица ошибок классификации будет выглядеть следующим образом:
- Таким образом, ошибки классификации бывают двух видов: False Negative (FN) и False Positive (FP).Возьмём, к примеру задачу выявления подозрения на определенное заболевание. Если у пациента оно есть, то это будет положительным классом. Если нет – отриц...
- Эта метрика бесполезна в задачах с неравными классами, и это легко показать на примере.
- Precision, recall и F-мера
- Для оценки качества работы алгоритма на каждом из классов по отдельности введем метрики precision (точность) и recall (полнота).
- Precision можно интерпретировать как долю объектов, названных классификатором положительными и при этом действительно являющимися положительными, а recall показывает, какую долю объектов положительного класса из всех объектов положительного класса наш...
- Именно введение precision не позволяет нам записывать все объекты в один класс, так как в этом случае мы получаем рост уровня False Positive. Recall демонстрирует способность алгоритма обнаруживать данный класс вообще, а precision — способность отлича...
- Intersection over Union
- В задачах классификации с локализацией и детекции объектов для определения достоверности местоположения ограничивающей рамки в качестве метрики чаще всего используется отношение площадей ограничивающих рамок
- где A и B — предсказанная ограничивающая рамка и настоящиая ограничивающая рамка соответственно. IoU равно нулю в случае непересекающихся ограничивающих рамок и равно единице в случае идеального наложения.
- 1.2 Модели машинного обучения
- 1.2.1 Линейные модели
- Пусть у нас есть множество объектов X, и для каждого объекта мы хотим сопоставить какое-то числовое значение. Задачи классификации и регрессии можно сформулировать как поиск отображения из множества объектво X в множество возможных таргетов (предсказа...
- Линейные функции имеют вид ,
- Где y- целевая переменная(таргет), (x1…..xD) -вектор, соответствующий объекту выборки(вектором признаков), а w1…wD – веса модели.
- Более компактно линейную модель можно записать в виде
- 1.2.2 Линейная классификация
- Пусть наш таргет y кодируют принадлежность к положительному или отрицательному классу, то есть принадлежность множеству (-1,1), а x – векторы из .Задача линейной классификации обучить модель так, чтобы плоскость, которую задаёт модель, как можно лучш...
- Итоговое предсказание можно будет вычислить по формуле .
- 1.2.3 Логистическая регрессия
- Этод метод появился когда захотели посмотреть на классификацию как на задачу предсказания вероятностей ( регрессию). Проблема метода в том, что вероятность от 0 до 1, а простого способа соблюдать это ограничения, нет. Для этого используют log odds – л...
- 1.2.4 решающие деревья и Random Forest
- Решающее дерево предсказывает значение целевой переменной с помощью применения последовательности простых решающих правил (которые называются предикатами).

Usage statistics

Access count: 0
Last 30 days: 0
Detailed usage statistics

BashGU Electronic Library

Details

Document access rights

Table of Contents

Usage statistics

BashGU
Electronic Library