Сравнительное исследование устойчивости к доменному сдвигу сверточных сетей Колмогорова-Арнольда и классических CNN


Сравнительное исследование устойчивости к доменному сдвигу сверточных сетей Колмогорова-Арнольда и классических CNN

Ларионов А.И. (ННГУ, Нижний Новгород, Россия)
Турлапов В.Е.(ННГУ, Нижний Новгород, Россия)

Аннотация

Выполнено экспериментальное сравнение устойчивости к доменному сдвигу классических сверточных нейронных сетей (CNN), со сверточными сетями Колмогорова-Арнольда (convKAN), имеющими в ядрах свертки обучаемые нелинейности. Исследование выполнено на примере архитектуры ResNet-18 в конфигурации без декодера. Опорным выбран набор данных PlantVillage, как содержащий норму и 26 заболеваний, в том числе 17 грибковых для 14 видов растений (всего 38 классов). Заболевания представлены 4 классами, из которых наиболее представленными являются 2 грибовые и бактериальные. Домены со сдвигом представлены 6 наборами изображений растений, в которых лишь малая часть типов растений и заболеваний пересекается с классами PlantVillage. Исследованы 3 метрики сдвига домена: Maximum Mean Discrepancy (MMD); дивергенция Йенсена-Шеннона; расстояние Вассерштейна. Сравнение моделей проводилось по метрикам: Accuracy, F1 macro, F1 weighted, Recall, FAR. Исследованы эмбеддинги, извлеченные сверточной частью моделей KAN и CNN. Установлено, что сверточные сети KAN, показывают лучшие результаты по устойчивости к доменному сдвигу в среднем на: 10% по Accuracy, 2% по F1-macro, 6% по F1-weighted. Показано, что влияние величин метрик доменного сдвига на результат KAN и CNN носит неоднородный характер, но в итоге эти метрики способны показать какие из доменных сдвигов являются сильными. Выявлена роль анализа ошибок на примере FAR, показавшего экстремальный рост для KAN и CNN в грибковых заболеваниях, с преимуществом сети CNN. Результаты показывают, что сильный доменный сдвиг является причиной существенной деградации качества классификации для обеих моделей, но сети KAN более устойчивы к доменному сдвигу, проигрывая CNN по величине FAR. Установлено, что после обучения в сети KAN доминируют унимодальные, мультимодальные и осциллирующие функции активации, а в ходе обучения доля унимодальных растет за счет осциллирующих.

Ключевые слова

устойчивость к доменному сдвигу; сверточные нейронные сети; сети Колмогорова-Арнольда; обучаемые функции активации; набор данных PlantVillage; классификация болезней растений; анализ пространства признаков; компьютерное зрение.

Издание

Труды Института системного программирования РАН, том 38 вып. 3, часть 3, 2026, стр. 7-26.

ISSN 2220-6426 (Online), ISSN 2079-8156 (Print).

DOI: 10.15514/ISPRAS-2026-38(3)-32

Для цитирования

Ларионов А.И., Турлапов В.Е. Сравнительное исследование устойчивости к доменному сдвигу сверточных сетей Колмогорова-Арнольда и классических CNN. Труды Института системного программирования РАН, том 38 вып. 3, часть 3, 2026, стр. 7-26. DOI: 10.15514/ISPRAS-2026-38(3)-32.

Полный текст статьи в формате pdf Вернуться к содержанию тома