Card | Table | RUSMARC | |
Галицков, Богдан Валерьевич. Разработка системы для оптимизации создания моделей нейронных сетей: выпускная квалификационная работа по программе бакалавриата. Направление подготовки (специальность) 02.03.03 Математическое обеспечение и администрирование информационных систем. Направленность (профиль): Системное и интернет-программирование / Б.В. Галицков; Уфимский университет науки и технологий, Институт информатики, математики и робототехники, Кафедра программирования и экономической информатики ; научный руководитель К. В. Трунов. — Уфа, 2024. — 48 с. — <URL:https://elib.bashedu.ru/dl/diplom/2024/Galitskov_BV_02.03.03_MOAIS_SIP_06.2024.pdf>. — Текст: электронныйRecord create date: 12/18/2024 Subject: ВКР; бакалавриат; проектная ВКР; искусственный интеллект; нейронные сети; графический интерфейс; модели машинного обучения Collections: Квалификационные работы бакалавров и специалистов; Общая коллекция Allowed Actions: –
*^% Action 'Read' will be available if you login and work on the computer in the reading rooms of the Library
Group: Anonymous Network: Internet |
Document access rights
Network | User group | Action | ||||
---|---|---|---|---|---|---|
Library BashGU Local Network | Authenticated users | |||||
Library BashGU Local Network | All | |||||
Internet | Authenticated users | |||||
Internet | All |
Table of Contents
- ВВЕДЕНИЕ
- ГЛАВА 1. АНАЛИТИЧЕСКИЙ ОБЗОР ПРЕДМЕТНОЙ ОБЛАСТИ
- 1.1 Машинное обучение
- Система оптимизации создания моделей машинного обучения будет решать задачи в следующих областях: табличная классификация, табличная регрессия, детекция фотографий.
- Машинное обучение — это подраздел искусственного интеллекта, наука, изучающая алгоритмы, автоматически улучшающиеся благодаря опыту.
- Решение всех задач машинного обучения можно записать как функцию, которая отображает объекты(samples) в предсказания(target).Эта функция называется моделью машинного обучения, а имеющийся набор примеров для этой функции – обучающая выборка или датасет...
- Объектов (например, скачанные фотографии из интернета или данные об активности пользователя)
- Ответов (подписи к объектам на фотографиях)
- 1.1.1 Постановка задачи
- Описанные выше задачи являются примерами задач обучения с учителем (supervised learning), так как правильные ответы для каждого объекта обучающей выборки заранее известны. Задачи обучения с учителем делятся на следующие виды в зависимости от того, как...
- всех возможных ответов (таргетов):
- - регрессия. Регрессия является типом задачи машинного обучения, которая предсказывается числовые значения на основе данных. Примерами задач регрессии является предсказание цен на недвижимость, спрос на конкретный товар в конкретный день или погода в ...
- - бинарная классификация. Тип в задачи в которой мы предсказываем к какому классу из двух относится объект. Например, мы можем предсказывать, кликнет ли пользователь по рекламному объявлению, вернёт ли клиент кредит в установленный срок, сдаст ли сту...
- - многоклассовая классификация.Так же как и бинарная, но с н-ным количеством классов. Например, определение предметной области для научной статьи (математика, биология, психология и т. д.).
- 1.1.2 Критерии качества
- По обучающей выборке мы хотим построить модель, предсказания которой достаточно хороши. Чтобы проверить качество модели использую метрики качества .У каждой задачи имеются свои метрики, по этому мы рассмотрим некоторые из них:
- Задачи классификаций:
- Перед переходом к самим метрикам необходимо ввести важную концепцию для описания этих метрик в терминах ошибок классификации — confusion matrix (матрица ошибок).
- Допустим, что у нас есть два класса и алгоритм, предсказывающий принадлежность каждого объекта одному из классов, тогда матрица ошибок классификации будет выглядеть следующим образом:
- Таким образом, ошибки классификации бывают двух видов: False Negative (FN) и False Positive (FP).Возьмём, к примеру задачу выявления подозрения на определенное заболевание. Если у пациента оно есть, то это будет положительным классом. Если нет – отриц...
- Эта метрика бесполезна в задачах с неравными классами, и это легко показать на примере.
- Precision, recall и F-мера
- Для оценки качества работы алгоритма на каждом из классов по отдельности введем метрики precision (точность) и recall (полнота).
- Precision можно интерпретировать как долю объектов, названных классификатором положительными и при этом действительно являющимися положительными, а recall показывает, какую долю объектов положительного класса из всех объектов положительного класса наш...
- Именно введение precision не позволяет нам записывать все объекты в один класс, так как в этом случае мы получаем рост уровня False Positive. Recall демонстрирует способность алгоритма обнаруживать данный класс вообще, а precision — способность отлича...
- Intersection over Union
- В задачах классификации с локализацией и детекции объектов для определения достоверности местоположения ограничивающей рамки в качестве метрики чаще всего используется отношение площадей ограничивающих рамок
- где A и B — предсказанная ограничивающая рамка и настоящиая ограничивающая рамка соответственно. IoU равно нулю в случае непересекающихся ограничивающих рамок и равно единице в случае идеального наложения.
- 1.2 Модели машинного обучения
- 1.2.1 Линейные модели
- Пусть у нас есть множество объектов X, и для каждого объекта мы хотим сопоставить какое-то числовое значение. Задачи классификации и регрессии можно сформулировать как поиск отображения из множества объектво X в множество возможных таргетов (предсказа...
- Линейные функции имеют вид ,
- Где y- целевая переменная(таргет), (x1…..xD) -вектор, соответствующий объекту выборки(вектором признаков), а w1…wD – веса модели.
- Более компактно линейную модель можно записать в виде
- 1.2.2 Линейная классификация
- Пусть наш таргет y кодируют принадлежность к положительному или отрицательному классу, то есть принадлежность множеству (-1,1), а x – векторы из .Задача линейной классификации обучить модель так, чтобы плоскость, которую задаёт модель, как можно лучш...
- Итоговое предсказание можно будет вычислить по формуле .
- 1.2.3 Логистическая регрессия
- Этод метод появился когда захотели посмотреть на классификацию как на задачу предсказания вероятностей ( регрессию). Проблема метода в том, что вероятность от 0 до 1, а простого способа соблюдать это ограничения, нет. Для этого используют log odds – л...
- 1.2.4 решающие деревья и Random Forest
- Решающее дерево предсказывает значение целевой переменной с помощью применения последовательности простых решающих правил (которые называются предикатами).
Usage statistics
Access count: 0
Last 30 days: 0 Detailed usage statistics |