Details
Дудник, Алексей Валерьевич. Программная реализация гибридной системы дообучения больших языковых
моделей с использованием supervised fine-tuning, distillation и retrieval-augmentation [Электронный ресурс]: выпускная квалификационная работа бакалавра по направлению подготовки 01.03.02 Прикладная математика и информатика.
Направленность (профиль): Искусственный интеллект и машинное обучение в создании цифровых двойников / А. В. Дудник, И. А. Калимуллин; Уфимский университет науки и технологий (УУНиТ), Стерлитамакский филиал, Факультет математики и информационных технологий, Кафедра математического моделирования, научный руководитель А. А. Акимов. — Стерлитамак, 2025. — 51 с.: прил. — <URL:https://elib.bashedu.ru/dl/diplom/SF/2025/FMIT/DudnikAV_01.03.02_PMI_bak_2025_VKR.pdf>.
Record create date
7/15/2025
Subject
ВКР; бакалавриат; прикладная информатика; прикладная математика; искусственный интеллект; проектная работа
UDC
004.9
LBC
32.973
Allowed Actions
–
Action 'Read' will be available if you login or access site from another network
| Group | Anonymous |
|---|---|
| Network | Internet |
| Network | User group | Action |
|---|---|---|
| Library BashGU Local Network | Authenticated users |
|
| Library BashGU Local Network | All |
|
| Internet | Authenticated users |
|
| Internet | All |
|
- 283d8bd6cc47f2b37ce77a21957950a0f40780c933571f2b606f8bcd2a4bd28a.pdf
- ВВЕДЕНИЕ
- 1 ТЕОРЕТИЧЕСКИЕ ОСНОВЫ И ОБЗОР МЕТОДОВ АДАПТАЦИИ
- 1.1 Архитектура современных LLM
- 1.2 Разновидности архитектуры LLM
- 1.2.1 Автогенеративные(энкодерные) модели
- 1.2.2 Двунаправленные(декодерные) модели
- 1.2.3 Seq2Seq и энкодер-декодерные архитектуры
- 1.3 Обзор методов дообучения LLM
- 1.3.1 Полное дообучение
- 1.3.2 PEFT: Parameter-Efficient Fine-Tuning
- 1.3.3 Domain Adaptation и Distribution Shift
- 1.3.4 Instruction Tuning
- 1.3.5 RLHF
- 1.3.6 Регуляризация и методы стабилизации обучения
- 1.3.7 Дистилляция знаний
- 1.3.8 Retrieval-Augmented Generation
- 1.4 Сравнительный анализ подходов и их сочетаний
- 1.5 Выводы по главе 1
- 2 ПРОЕКТИРОВАНИЕ ГИБРИДНОЙ СИСТЕМЫ ДООБУЧЕНИЯ
- 2.1 Общая архитектура гибридного пайплайна
- 2.2 Взаимодействие компонентов пайплайна
- 2.3 Выводы по главе 2
- 3 ПРОГРАММНАЯ РЕАЛИЗАЦИЯ ПАЙПЛАЙНА
- 3.1 Инструменты и технологии
- 3.2 Реализация supervised fine-tuning
- 3.2.1 Подготовка данных
- 3.2.2 Выбор модели и загрузка в Unsloth
- 3.3 Реализация Knowledge Distillation
- 3.4 Реализация retrieval-augmentation
- 3.5 Интеграция компонентов в единый пайплайн
- 3.6 Выводы по главе 3
- 4 ЭКСПЕРИМЕНТАЛЬНОЕ ИССЛЕДОВАНИЕ
- 4.1 Цель эксперимента
- 4.2 Описание экспериментальной установки
- 4.3 Проведение экспериментов
- 4.3.1 Тест базовой модели
- 4.3.2 Этап supervised fine-tuning
- 4.3.3 Этап дистилляции
- 4.3.4 Этап retrieval-augmentation
- 4.3.5. Полная конфигурация
- 4.4 Результаты и их анализ
- 4.5 Выводы по главе 4
- ЗАКЛЮЧЕНИЕ
- 930d2be33533783d619b36d22793c000692c49bde37d91d5bdcfc6ff1bd97779.pdf
- 283d8bd6cc47f2b37ce77a21957950a0f40780c933571f2b606f8bcd2a4bd28a.pdf
- СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ
- 19ae3d0c60c967a37f0a32622d07536b58f5d83c23ea181e227fb5f1593beaec.pdf
- 283d8bd6cc47f2b37ce77a21957950a0f40780c933571f2b606f8bcd2a4bd28a.pdf
- ПРИЛОЖЕНИЕ А
- ПРИЛОЖЕНИЕ Б
- ПРИЛОЖЕНИЕ В
- ПРИЛОЖЕНИЕ Г
- ПРИЛОЖЕНИЕ Д