BashGU
Electronic Library

     

Details

Галицков, Богдан Валерьевич. Разработка системы для оптимизации создания моделей нейронных сетей: выпускная квалификационная работа по программе бакалавриата. Направление подготовки (специальность) 02.03.03 Математическое обеспечение и администрирование информационных систем. Направленность (профиль): Системное и интернет-программирование / Б.В. Галицков; Уфимский университет науки и технологий, Институт информатики, математики и робототехники, Кафедра программирования и экономической информатики ; научный руководитель К. В. Трунов. — Уфа, 2024. — 48 с. — <URL:https://elib.bashedu.ru/dl/diplom/2024/Galitskov_BV_02.03.03_MOAIS_SIP_06.2024.pdf>. — Текст: электронный

Record create date: 12/18/2024

Subject: ВКР; бакалавриат; проектная ВКР; искусственный интеллект; нейронные сети; графический интерфейс; модели машинного обучения

Collections: Квалификационные работы бакалавров и специалистов; Общая коллекция

Allowed Actions:

*^% Action 'Read' will be available if you login and work on the computer in the reading rooms of the Library

Group: Anonymous

Network: Internet

Document access rights

Network User group Action
Library BashGU Local Network Authenticated users Read
Library BashGU Local Network All
Internet Authenticated users Read
-> Internet All

Table of Contents

  • ВВЕДЕНИЕ
  • ГЛАВА 1. АНАЛИТИЧЕСКИЙ ОБЗОР ПРЕДМЕТНОЙ ОБЛАСТИ
    • 1.1 Машинное обучение
    • Система оптимизации создания моделей машинного обучения будет решать задачи в следующих областях: табличная классификация, табличная регрессия, детекция фотографий.
    • Машинное обучение — это подраздел искусственного интеллекта, наука, изучающая алгоритмы, автоматически улучшающиеся благодаря опыту.
    • Решение всех задач машинного обучения можно записать как функцию, которая отображает объекты(samples) в предсказания(target).Эта функция называется моделью машинного обучения, а имеющийся набор примеров для этой функции – обучающая выборка или датасет...
    •  Объектов (например, скачанные фотографии из интернета или данные об активности пользователя)
    •  Ответов (подписи к объектам на фотографиях)
    • 1.1.1 Постановка задачи
    • Описанные выше задачи являются примерами задач обучения с учителем (supervised learning), так как правильные ответы для каждого объекта обучающей выборки заранее известны. Задачи обучения с учителем делятся на следующие виды в зависимости от того, как...
    • всех возможных ответов (таргетов):
    • - регрессия. Регрессия является типом задачи машинного обучения, которая предсказывается числовые значения на основе данных. Примерами задач регрессии является предсказание цен на недвижимость, спрос на конкретный товар в конкретный день или погода в ...
    • - бинарная классификация. Тип в задачи в которой мы предсказываем к какому классу из двух относится объект. Например, мы можем предсказывать, кликнет ли пользователь по рекламному объявлению, вернёт ли клиент кредит в установленный срок, сдаст ли сту...
    • - многоклассовая классификация.Так же как и бинарная, но с н-ным количеством классов. Например, определение предметной области для научной статьи (математика, биология, психология и т. д.).
    • 1.1.2 Критерии качества
    • По обучающей выборке мы хотим построить модель, предсказания которой достаточно хороши. Чтобы проверить качество модели использую метрики качества .У каждой задачи имеются свои метрики, по этому мы рассмотрим некоторые из них:
    • Задачи классификаций:
    • Перед переходом к самим метрикам необходимо ввести важную концепцию для описания этих метрик в терминах ошибок классификации — confusion matrix (матрица ошибок).
    • Допустим, что у нас есть два класса и алгоритм, предсказывающий принадлежность каждого объекта одному из классов, тогда матрица ошибок классификации будет выглядеть следующим образом:
    • Таким образом, ошибки классификации бывают двух видов: False Negative (FN) и False Positive (FP).Возьмём, к примеру задачу выявления подозрения на определенное заболевание. Если у пациента оно есть, то это будет положительным классом. Если нет – отриц...
    • Эта метрика бесполезна в задачах с неравными классами, и это легко показать на примере.
    • Precision, recall и F-мера
    • Для оценки качества работы алгоритма на каждом из классов по отдельности введем метрики precision (точность) и recall (полнота).
    • Precision можно интерпретировать как долю объектов, названных классификатором положительными и при этом действительно являющимися положительными, а recall показывает, какую долю объектов положительного класса из всех объектов положительного класса наш...
    • Именно введение precision не позволяет нам записывать все объекты в один класс, так как в этом случае мы получаем рост уровня False Positive. Recall демонстрирует способность алгоритма обнаруживать данный класс вообще, а precision — способность отлича...
    • Intersection over Union
    • В задачах классификации с локализацией и детекции объектов для определения достоверности местоположения ограничивающей рамки в качестве метрики чаще всего используется отношение площадей ограничивающих рамок
    • где A и B — предсказанная ограничивающая рамка и настоящиая ограничивающая рамка соответственно. IoU равно нулю в случае непересекающихся ограничивающих рамок и равно единице в случае идеального наложения.
    • 1.2 Модели машинного обучения
    • 1.2.1 Линейные модели
    • Пусть у нас есть множество объектов X, и для каждого объекта мы хотим сопоставить какое-то числовое значение. Задачи классификации и регрессии можно сформулировать как поиск отображения из множества объектво X в множество возможных таргетов (предсказа...
    • Линейные функции имеют вид ,
    • Где y- целевая переменная(таргет), (x1…..xD) -вектор, соответствующий объекту выборки(вектором признаков), а w1…wD – веса модели.
    • Более компактно линейную модель можно записать в виде
    • 1.2.2 Линейная классификация
    • Пусть наш таргет y кодируют принадлежность к положительному или отрицательному классу, то есть принадлежность множеству (-1,1), а x – векторы из .Задача линейной классификации обучить модель так, чтобы плоскость, которую задаёт модель, как можно лучш...
    • Итоговое предсказание можно будет вычислить по формуле .
    • 1.2.3 Логистическая регрессия
    • Этод метод появился когда захотели посмотреть на классификацию как на задачу предсказания вероятностей ( регрессию). Проблема метода в том, что вероятность от 0 до 1, а простого способа соблюдать это ограничения, нет. Для этого используют log odds – л...
    • 1.2.4 решающие деревья и Random Forest
    • Решающее дерево предсказывает значение целевой переменной с помощью применения последовательности простых решающих правил (которые называются предикатами).

Usage statistics

stat Access count: 0
Last 30 days: 0
Detailed usage statistics