Встраиваемый код из свёрточной нейросети

Обучим нейросеть игрушечной задаче - предсказывать геометрические фигуры, и проверим, можно ли скомпилировать ее в код на Си, а затем и в бинарную библиотеку чтобы использовать в блоках или как часть другого проекта.

Введение

В этом практическом руководстве мы обучим нейросеть распознавать геометрические фигуры на игрушечном датасете, а затем экспортируем обученную модель в код на C, скомпилируем его в разделяемую библиотеку и проверим возможность интеграции в сторонние проекты или блоки кода на Си в вашем проекте.

В ходе конвертации вы заметите небольшую потерю точности. Это может быть вызвано разницей в реализации некоторых операций в Julia и в C (например, батч-нормализация) или простым округлением коэффициентов при переводе в код, но зато открывает путь к развёртыванию на встраиваемых системах.

Подготовка

На этом этапе мы загружаем необходимые библиотеки, фиксируем генератор случайных чисел, создаём синтетический датасет из квадратов, кругов и треугольников, а затем визуализируем примеры изображений каждого класса.

Генерация контролируемого, сбалансированного датасета с известными свойствами (размер 64×64, нормализация в диапазон [-1,1]) позволяет изолированно проверить каждый этап конвейера без влияния внешних факторов.

Установим нужные библиотеки и инициализируем генератор случайных чисел, чтобы наш эксперимент был легко возпроизводимым:

# Установка необходимых пакетов
# Pkg.add(["Flux", "BSON", "ImageTransformations"])

using Random
Random.seed!(5);

Синтезируем набор данных

Создадим игрушечный датасет, состоящий из трех классов. Часть объектов помещается в папку "неизвестно", то есть их класс, хоть он и прописан в названии файлов, системе будет неизвестен. Можно назвать это валидационным датасетом. Остальные - тренировочный и тестовый - разложены по соответствующим папкам.

include("$(@__DIR__)/_scripts/generate_shape_dataset.jl")
generate_shape_dataset(samples_per_class=200, test_samples=30, img_size=64)

Датасет сгенерирован:
  200 изображений каждого класса для обучения
  30 тестовых изображений
  Размер изображений: 64 x 64

На этом этапе мы стараемся сгенерировать достаточно разнообразный датасет (с поворотами треугольников), но при этом не переусложнять код, например мы не стали делать аугментацию в процессе обучения. В целом, этот этап оказался наименее проблемным.

Взгляд на учебный набор данных

Вот образцы объектов из нашего учебного набора данных:

include("$(@__DIR__)/_scripts/show_dataset_samples.jl")
DATA_DIR = "$(@__DIR__)/учебные данные";
gr()
show_dataset_samples(DATA_DIR, samples_per_class=10)

Обучение и анализ модели

Здесь мы запускаем процесс обучения свёрточной нейросети, сохраняем историю метрик, анализируем динамику точности и потерь, а также отображаем мозаику предсказаний на тестовых изображениях.

Мониторинг метрик precision/recall по классам и ранняя остановка по валидационной точности помогают вовремя обнаружить переобучение и выбрать лучшую модель для последующего экспорта.

include("$(@__DIR__)/_scripts/train_model.jl");
DATA_DIR = "$(@__DIR__)/учебные данные";
model, classes = train_model(DATA_DIR; epochs=100, imsize=64, batch_size=32, lr=0.0005, test_split=0.25, patience_limit=8);

Размер батча: 32, Скорость обучения: 0.0005
Доля тестовой выборки: 25.0%
Найдено классов: 3: ["квадрат", "круг", "треугольник"]

=== Распределение классов ===

Всего изображений: 600 (64×64)
  квадрат: 200 изображений (33.3%)
  круг: 200 изображений (33.3%)
  треугольник: 200 изображений (33.3%)

=== Разделение данных ===
  Тренировочных: 450 (75.0%)
  Тестовых: 150 (25.0%)
Параметров модели: 16035

=== Обучение ===
  Эпоха  1/100, Train Loss: 1.2839, Train Acc: 41.3%, Test Acc: 39.3% ★  (precision/recall по классам: квадрат: 31.8%/42.0%, круг: 45.7%/32.0%, треугольник: 49.0%/48.0%)
  Эпоха  2/100, Train Loss: 1.1397, Train Acc: 46.2%, Test Acc: 46.7% ★  (precision/recall по классам: квадрат: 41.9%/52.0%, круг: 41.9%/26.0%, треугольник: 45.6%/52.0%)
  Эпоха  3/100, Train Loss: 1.0425, Train Acc: 63.8%, Test Acc: 58.0% ★  (precision/recall по классам: квадрат: 46.6%/54.0%, круг: 34.0%/36.0%, треугольник: 59.0%/46.0%)
  Эпоха  4/100, Train Loss: 0.9699, Train Acc: 65.8%, Test Acc: 55.3%    (precision/recall по классам: квадрат: 62.3%/66.0%, круг: 45.7%/42.0%, треугольник: 60.8%/62.0%)
  Эпоха  5/100, Train Loss: 0.9363, Train Acc: 71.3%, Test Acc: 72.0% ★  (precision/recall по классам: квадрат: 59.3%/64.0%, круг: 38.6%/34.0%, треугольник: 53.8%/56.0%)
  Эпоха  6/100, Train Loss: 0.862, Train Acc: 73.1%, Test Acc: 67.3%    (precision/recall по классам: квадрат: 65.1%/82.0%, круг: 53.2%/50.0%, треугольник: 55.0%/44.0%)
  Эпоха  7/100, Train Loss: 0.7955, Train Acc: 82.4%, Test Acc: 77.3% ★  (precision/recall по классам: квадрат: 68.7%/92.0%, круг: 52.5%/42.0%, треугольник: 72.1%/62.0%)
  Эпоха  8/100, Train Loss: 0.7538, Train Acc: 78.7%, Test Acc: 78.0% ★  (precision/recall по классам: квадрат: 74.2%/92.0%, круг: 65.7%/46.0%, треугольник: 67.9%/72.0%)
  Эпоха  9/100, Train Loss: 0.6834, Train Acc: 75.8%, Test Acc: 75.3%    (precision/recall по классам: квадрат: 73.0%/92.0%, круг: 46.9%/46.0%, треугольник: 57.9%/44.0%)
  Эпоха 10/100, Train Loss: 0.6379, Train Acc: 86.4%, Test Acc: 82.7% ★  (precision/recall по классам: квадрат: 79.7%/94.0%, круг: 71.1%/54.0%, треугольник: 71.7%/76.0%)
  Эпоха 11/100, Train Loss: 0.609, Train Acc: 84.0%, Test Acc: 83.3% ★  (precision/recall по классам: квадрат: 87.5%/98.0%, круг: 70.7%/58.0%, треугольник: 71.7%/76.0%)
  Эпоха 12/100, Train Loss: 0.5567, Train Acc: 82.0%, Test Acc: 82.7%    (precision/recall по классам: квадрат: 92.6%/100.0%, круг: 63.8%/60.0%, треугольник: 67.3%/66.0%)
  Эпоха 13/100, Train Loss: 0.5446, Train Acc: 65.8%, Test Acc: 63.3%    (precision/recall по классам: квадрат: 92.3%/96.0%, круг: 70.8%/68.0%, треугольник: 76.0%/76.0%)
  Эпоха 14/100, Train Loss: 0.5065, Train Acc: 79.8%, Test Acc: 82.0%    (precision/recall по классам: квадрат: 94.2%/98.0%, круг: 68.5%/74.0%, треугольник: 77.3%/68.0%)
  Эпоха 15/100, Train Loss: 0.4701, Train Acc: 88.9%, Test Acc: 86.0% ★  (precision/recall по классам: квадрат: 90.7%/98.0%, круг: 76.1%/70.0%, треугольник: 80.0%/80.0%)
  Эпоха 16/100, Train Loss: 0.433, Train Acc: 67.8%, Test Acc: 66.0%    (precision/recall по классам: квадрат: 94.1%/96.0%, круг: 73.6%/78.0%, треугольник: 78.3%/72.0%)
  Эпоха 17/100, Train Loss: 0.4185, Train Acc: 90.2%, Test Acc: 88.7% ★  (precision/recall по классам: квадрат: 96.2%/100.0%, круг: 77.1%/74.0%, треугольник: 78.0%/78.0%)
  Эпоха 18/100, Train Loss: 0.3876, Train Acc: 95.3%, Test Acc: 92.7% ★  (precision/recall по классам: квадрат: 98.0%/98.0%, круг: 77.8%/84.0%, треугольник: 82.6%/76.0%)
  Эпоха 19/100, Train Loss: 0.3864, Train Acc: 94.2%, Test Acc: 92.7%    (precision/recall по классам: квадрат: 94.0%/94.0%, круг: 76.4%/84.0%, треугольник: 84.4%/76.0%)
  Эпоха 20/100, Train Loss: 0.3226, Train Acc: 94.9%, Test Acc: 91.3%    (precision/recall по классам: квадрат: 90.6%/96.0%, круг: 77.8%/84.0%, треугольник: 88.4%/76.0%)
  Эпоха 21/100, Train Loss: 0.276, Train Acc: 86.0%, Test Acc: 86.0%    (precision/recall по классам: квадрат: 94.1%/96.0%, круг: 77.1%/74.0%, треугольник: 80.4%/82.0%)
  Эпоха 22/100, Train Loss: 0.2853, Train Acc: 91.8%, Test Acc: 89.3%    (precision/recall по классам: квадрат: 94.3%/100.0%, круг: 84.0%/84.0%, треугольник: 87.2%/82.0%)
  Эпоха 23/100, Train Loss: 0.255, Train Acc: 82.7%, Test Acc: 79.3%    (precision/recall по классам: квадрат: 98.0%/98.0%, круг: 87.2%/82.0%, треугольник: 83.0%/88.0%)
  Эпоха 24/100, Train Loss: 0.2077, Train Acc: 100.0%, Test Acc: 94.7% ★  (precision/recall по классам: квадрат: 92.3%/96.0%, круг: 79.2%/76.0%, треугольник: 84.0%/84.0%)

  ⏹ Ранний останов по достижению 100% точности на учебном датасете

Загружена лучшая модель (Test Acc: 94.7%)

=== Результаты ===
  Лучшая точность на тесте: 94.7%
  Точность train/test: 94.9% / 89.3%
  ✓ Нет переобучения (разрыв 5.6%)
Обучение завершено! 🚀
Модель сохранена в model.bson

Посмотрим на качество проведенного обучения:

include("$(@__DIR__)/_scripts/analyze_training_log.jl")
gr()
df, classes, p = analyze_training_log("training_log.txt")
display(p)

Каждый график интересно интерпретировать по-отдельности. Например, precision рос для всех классов практически одинаково, но показатель recall сразу стал лучше для квадратов, и всегда был позади для треугольников, оставаясь не самым высоким и к концу процесса обучения.

Мы не стали продолжать обучение после достижения качества 100% на тесте, потому что исчез смысл сравнивать реализации между собой. Но нам определенно стоило бы породить больше объектов для датасета, поскольку, в среднем, к концу обучения модель достаточно точно определяла квадраты и круги, но из пяти предложенных треугольников в среднем "не замечала" один из них. Хотя те, которе она отмечала как треугольники действительно ими были (больше ошибок "ложного срабатывания" сеть демонстрировала для класса "круг").

Прогнозы от нейросети на Julia (Flux)

include("$(@__DIR__)/_scripts/simple_mosaic.jl")
UNKNOWN_DIR = "$(@__DIR__)/неизвестно";
gr()
plot(create_simple_mosaic(UNKNOWN_DIR, imsize=64))

Мы видим довольно хорошие предсказания, но это не столько результат успешного обучения, сколько результат долгой работы проектировщика. Самым трудоёмким оказался подбор архитектуры сети (количество слоёв, каналов, использование BatchNorm и Dropout) и гиперпараметров (скорость обучения, размер батча, аугментация), чтобы достичь стабильной сходимости и избежать переобучения на ограниченном наборе данных. В итоге, например, аугментация была перенесена в функцию порождающую датасет, чтобы упростить пример, а также в силу того, что эта процедура нужна только треугольникам.

Экспорт в C и тестирование

Теперь мы конвертируем предварительно обработанные изображения в бинарный формат, генерируем C-код нейросети, компилируем его в исполняемый файл и визуализируем предсказания, полученные от C-реализации. Мы заведомо предполагаем, что код будет работать на платформах, где нет библиотеки PNG. Поэтому переводим изображения в бинарный формат при помощи отдельного скрипта. В этих бинарных файлах лежат матрицы, в качестве элементов которых фигурирует каждый цветовой канал каждого пикселя, представленный одним числом UInt8.

include("$(@__DIR__)/_scripts/convert_png_to_rgb8.jl")
convert_png_to_rgb8("$(@__DIR__)/неизвестно", "$(@__DIR__)/неизвестно_rgb8", 64)

Теперь, когда у нас готов датасет с бинарными изображениями, можно загрузить уже обученную модель и перевести ее в код на Си. Ключевое требование к успешному экспорту — полное согласование форматов данных (RGB8 для изображений, HWC порядок коэффициентов) и порядка обхода весов между Julia и C, что достигается явным контролем индексации и нормализации на всех этапах.

include("$(@__DIR__)/_scripts/generate_cnn_code.jl")

using Flux, BSON
BSON.@load "$(@__DIR__)/model.bson" model classes
model = Flux.testmode!(model)

# Генерируем библиотеку и main программу
generate_shared_lib(model, 64, length(classes))
generate_main_program(64, length(classes))

Generated neural_net.c and neural_net.h
Generated main.c

Саму нейросеть мы скомпилируем в библиотеку. Мы также сгенерировали программу main, которая подаёт в нейросеть изображения из папки "неизвестно_rgb8" и обрабатывает результаты классификации.

;gcc -shared -fPIC neural_net.c -o libneuralnet.so -lm

;gcc main.c -o classify_unknown -ldl -lm

Что любопытно, чтобы запустить эту нейросеть, нам не потребуются никакие библиотеки - ни Julia, ни C. Она выполняется на любой системе, где есть компилятор кода на Си.

;./classify_unknown

File                 Prediction      Confidence
------------------------------------------------
circle_009.rgb       круг        0.983
circle_010.rgb       круг        0.998
circle_011.rgb       круг        0.955
circle_012.rgb       круг        0.993
circle_015.rgb       круг        0.997
circle_016.rgb       круг        0.964
circle_017.rgb       круг        0.966
circle_020.rgb       круг        0.943
circle_024.rgb       круг        0.996
circle_025.rgb       круг        1.000
circle_026.rgb       круг        0.999
square_001.rgb       квадрат  0.701
square_003.rgb       квадрат  0.920
square_004.rgb       квадрат  0.739
square_005.rgb       квадрат  0.815
square_008.rgb       квадрат  0.923
square_013.rgb       квадрат  0.681
square_014.rgb       квадрат  0.743
square_018.rgb       квадрат  0.904
square_019.rgb       квадрат  0.937
square_021.rgb       квадрат  0.739
square_029.rgb       квадрат  0.817
triangle_002.rgb     треугольник 0.664
triangle_006.rgb     треугольник 0.626
triangle_007.rgb     треугольник 0.584
triangle_022.rgb     круг        0.511
triangle_023.rgb     круг        0.754
triangle_027.rgb     треугольник 0.664
triangle_028.rgb     треугольник 0.973
triangle_030.rgb     круг        0.778
circle_014.rgb       круг        0.999
circle_018.rgb       круг        0.929
square_009.rgb       круг        0.529
square_010.rgb       квадрат  0.921
square_015.rgb       квадрат  0.992
square_020.rgb       квадрат  0.926
square_023.rgb       круг        0.567
square_024.rgb       квадрат  0.668
square_028.rgb       квадрат  0.879
square_030.rgb       квадрат  0.927
triangle_001.rgb     треугольник 0.702
triangle_008.rgb     круг        0.564
triangle_011.rgb     круг        0.580
triangle_012.rgb     треугольник 0.666
triangle_013.rgb     треугольник 0.698
triangle_021.rgb     треугольник 0.626
triangle_029.rgb     круг        0.707
circle_001.rgb       круг        0.948
circle_002.rgb       круг        0.990
circle_003.rgb       круг        0.992
circle_004.rgb       круг        1.000
circle_005.rgb       круг        0.793
circle_007.rgb       круг        0.985
circle_021.rgb       круг        0.995
circle_022.rgb       круг        0.912
circle_023.rgb       круг        0.973
circle_028.rgb       круг        0.989
circle_029.rgb       круг        0.948
circle_030.rgb       круг        0.992
square_002.rgb       круг        0.498
square_007.rgb       круг        0.649
square_016.rgb       круг        0.715
square_026.rgb       квадрат  0.729
square_027.rgb       квадрат  0.868
triangle_003.rgb     треугольник 0.665
triangle_004.rgb     треугольник 0.558
triangle_009.rgb     круг        0.810
triangle_010.rgb     треугольник 0.539
triangle_014.rgb     треугольник 0.922
triangle_016.rgb     круг        0.707
triangle_017.rgb     круг        0.564
triangle_020.rgb     круг        0.510
triangle_025.rgb     круг        0.497
triangle_026.rgb     треугольник 0.834

При переносе модели в C пришлось решить несколько нетривиальных задач: ручная реализация свёрток и BatchNorm без сторонних библиотек, приведение всех операций к единому формату HWC, точное воспроизведение порядка обхода весов (особенно критичного для многоканальных слоёв), а также работа с бинарными файлами изображений из-за отсутствия библиотеки PNG в целевой среде — все эти трудности были успешно преодолены.

Прогнозы от нейросети на Си

include("$(@__DIR__)/_scripts/create_mosaic_from_c_predictions.jl")
run(pipeline(`./classify_unknown`, stdout="pred.txt"))
UNKNOWN_DIR = "$(@__DIR__)/неизвестно";
gr()
mosaic_grouped = create_mosaic_from_c_predictions("неизвестно", "pred.txt", max_images=8)

Warning: detected a stack overflow; program state may be corrupted, so further execution might be unreliable.

Несмотря на перечисленные сложности, мы продемонстрировали полный рабочий конвейер, доказывающий, что экспорт нейросетей из Julia в C возможен даже при ограниченных ресурсах целевой платформы.

include("$(@__DIR__)/_scripts/predict_to_csv.jl")
UNKNOWN_DIR = "$(@__DIR__)/неизвестно";
predict_to_csv(UNKNOWN_DIR, confidence_threshold=0.4, output_csv="$(@__DIR__)/predictions.csv")
run(pipeline(`./classify_unknown`, stdout="pred.txt"))
include("$(@__DIR__)/_scripts/compare_c_and_julia.jl")
df = compare_c_and_julia()
sort(df)

Обработано файлов: 74
  квадрат: 24
  круг: 25
  треугольник: 25

=== Сравнение C и Julia ===
Всего файлов: 74
Совпадающих предсказаний: 58
Точность: 78.38%

Статистика разницы в уверенности:
  Средняя разница: 0.1674
  Макс разница: 0.4689
  Мин разница: 0.0056

Заключение

Мы показали, как пройти полный цикл создания программы с нейросетью внутри: от создания датасета и обучения модели на Julia до экспорта в C и проверки работоспособности, что подтверждает принципиальную возможность использования сгенерированного кода далеко за пределами инженерной платформы Engee.

Row	File	C_Prediction	C_Confidence	BaseName	Файл	Julia_Prediction	Julia_Confidence	Вероятность_квадрат	Вероятность_круг	Вероятность_треугольник	Match	Confidence_Diff
	String	String	Float64	String	String31	String31	Float64	Float64	Float64	Float64	Bool	Float64
1	circle_001.rgb	круг	0.948	circle_001	circle_001.png	круг	0.814261	0.0364875	0.814261	0.149251	true	0.133738
2	circle_002.rgb	круг	0.99	circle_002	circle_002.png	круг	0.943021	0.0138141	0.943021	0.0431649	true	0.0469789
3	circle_003.rgb	круг	0.992	circle_003	circle_003.png	круг	0.919059	0.0113165	0.919059	0.0696241	true	0.0729406
4	circle_004.rgb	круг	1.0	circle_004	circle_004.png	круг	0.983557	0.00701332	0.983557	0.00943003	true	0.0164434
5	circle_005.rgb	круг	0.793	circle_005	circle_005.png	круг	0.579309	0.0514736	0.579309	0.369217	true	0.213691
6	circle_007.rgb	круг	0.985	circle_007	circle_007.png	круг	0.911108	0.0521951	0.911108	0.0366972	true	0.0738923
7	circle_009.rgb	круг	0.983	circle_009	circle_009.png	круг	0.82299	0.0369218	0.82299	0.140089	true	0.16001
8	circle_010.rgb	круг	0.998	circle_010	circle_010.png	круг	0.956312	0.00526625	0.956312	0.0384219	true	0.0416882
9	circle_011.rgb	круг	0.955	circle_011	circle_011.png	круг	0.530945	0.00444727	0.530945	0.464608	true	0.424055
10	circle_012.rgb	круг	0.993	circle_012	circle_012.png	круг	0.936452	0.0160009	0.936452	0.047547	true	0.056548
11	circle_014.rgb	круг	0.999	circle_014	circle_014.png	круг	0.961115	0.00656026	0.961115	0.032325	true	0.0378853
12	circle_015.rgb	круг	0.997	circle_015	circle_015.png	круг	0.953765	0.00563846	0.953765	0.040597	true	0.0432354
13	circle_016.rgb	круг	0.964	circle_016	circle_016.png	круг	0.863125	0.0549023	0.863125	0.0819724	true	0.100875
⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋮
63	triangle_016.rgb	круг	0.707	triangle_016	triangle_016.png	треугольник	0.887947	0.00269611	0.109357	0.887947	false	0.180947
64	triangle_017.rgb	круг	0.564	triangle_017	triangle_017.png	треугольник	0.88178	0.0117523	0.106468	0.88178	false	0.31778
65	triangle_020.rgb	круг	0.51	triangle_020	triangle_020.png	треугольник	0.978909	0.000415554	0.020676	0.978909	false	0.468909
66	triangle_021.rgb	треугольник	0.626	triangle_021	triangle_021.png	треугольник	0.998094	1.40282e-5	0.0018915	0.998094	true	0.372094
67	triangle_022.rgb	круг	0.511	triangle_022	triangle_022.png	треугольник	0.942509	0.00172809	0.0557631	0.942509	false	0.431509
68	triangle_023.rgb	круг	0.754	triangle_023	triangle_023.png	треугольник	0.804048	0.021133	0.174819	0.804048	false	0.0500482
69	triangle_025.rgb	круг	0.497	triangle_025	triangle_025.png	треугольник	0.824758	0.025768	0.149474	0.824758	false	0.327758
70	triangle_026.rgb	треугольник	0.834	triangle_026	triangle_026.png	треугольник	0.955393	0.000491825	0.0441154	0.955393	true	0.121393
71	triangle_027.rgb	треугольник	0.664	triangle_027	triangle_027.png	треугольник	0.885634	0.00767521	0.106691	0.885634	true	0.221634
72	triangle_028.rgb	треугольник	0.973	triangle_028	triangle_028.png	треугольник	0.993726	7.13982e-5	0.00620212	0.993726	true	0.0207265
73	triangle_029.rgb	круг	0.707	triangle_029	triangle_029.png	треугольник	0.887947	0.00269611	0.109357	0.887947	false	0.180947
74	triangle_030.rgb	круг	0.778	triangle_030	triangle_030.png	треугольник	0.827115	0.00261272	0.170272	0.827115	false	0.0491154

Генерируем код из свёрточной нейросети

Встраиваемый код из свёрточной нейросети

Введение

Подготовка

Синтезируем набор данных

Взгляд на учебный набор данных

Обучение и анализ модели

Прогнозы от нейросети на Julia (Flux)

Экспорт в C и тестирование

Прогнозы от нейросети на Си

Заключение

Тип

Краткое описание

Связанные материалы

Теги

Категории

Языки

Форматы

Уровень

Статус

Опубликовано

Обновлено

Источник