Сравнительное исследование устойчивости к доменному сдвигу сверточных сетей Колмогорова-Арнольда и классических CNN
Новости
Сравнительное исследование устойчивости к доменному сдвигу сверточных сетей Колмогорова-Арнольда и классических CNN
Аннотация
Выполнено экспериментальное сравнение устойчивости к доменному сдвигу классических сверточных нейронных сетей (CNN), со сверточными сетями Колмогорова-Арнольда (convKAN), имеющими в ядрах свертки обучаемые нелинейности. Исследование выполнено на примере архитектуры ResNet-18 в конфигурации без декодера. Опорным выбран набор данных PlantVillage, как содержащий норму и 26 заболеваний, в том числе 17 грибковых для 14 видов растений (всего 38 классов). Заболевания представлены 4 классами, из которых наиболее представленными являются 2 грибовые и бактериальные. Домены со сдвигом представлены 6 наборами изображений растений, в которых лишь малая часть типов растений и заболеваний пересекается с классами PlantVillage. Исследованы 3 метрики сдвига домена: Maximum Mean Discrepancy (MMD); дивергенция Йенсена-Шеннона; расстояние Вассерштейна. Сравнение моделей проводилось по метрикам: Accuracy, F1 macro, F1 weighted, Recall, FAR. Исследованы эмбеддинги, извлеченные сверточной частью моделей KAN и CNN. Установлено, что сверточные сети KAN, показывают лучшие результаты по устойчивости к доменному сдвигу в среднем на: 10% по Accuracy, 2% по F1-macro, 6% по F1-weighted. Показано, что влияние величин метрик доменного сдвига на результат KAN и CNN носит неоднородный характер, но в итоге эти метрики способны показать какие из доменных сдвигов являются сильными. Выявлена роль анализа ошибок на примере FAR, показавшего экстремальный рост для KAN и CNN в грибковых заболеваниях, с преимуществом сети CNN. Результаты показывают, что сильный доменный сдвиг является причиной существенной деградации качества классификации для обеих моделей, но сети KAN более устойчивы к доменному сдвигу, проигрывая CNN по величине FAR. Установлено, что после обучения в сети KAN доминируют унимодальные, мультимодальные и осциллирующие функции активации, а в ходе обучения доля унимодальных растет за счет осциллирующих.
Ключевые слова
Издание
Труды Института системного программирования РАН, том 38 вып. 3, часть 3, 2026, стр. 7-26.
ISSN 2220-6426 (Online), ISSN 2079-8156 (Print).
DOI: 10.15514/ISPRAS-2026-38(3)-32
Для цитирования
Полный текст статьи в формате pdf
Вернуться к содержанию тома