Co-training $2^L$ Submodels for Visual Recognition

Touvron, Hugo; Cord, Matthieu; Oquab, Maxime; Bojanowski, Piotr; Verbeek, Jakob; Jégou, Hervé

Computer Science > Computer Vision and Pattern Recognition

arXiv:2212.04884 (cs)

[Submitted on 9 Dec 2022]

Title:Co-training $2^L$ Submodels for Visual Recognition

Authors:Hugo Touvron, Matthieu Cord, Maxime Oquab, Piotr Bojanowski, Jakob Verbeek, Hervé Jégou

View PDF

Abstract:We introduce submodel co-training, a regularization method related to co-training, self-distillation and stochastic depth. Given a neural network to be trained, for each sample we implicitly instantiate two altered networks, ``submodels'', with stochastic depth: we activate only a subset of the layers. Each network serves as a soft teacher to the other, by providing a loss that complements the regular loss provided by the one-hot label. Our approach, dubbed cosub, uses a single set of weights, and does not involve a pre-trained external model or temporal averaging.
Experimentally, we show that submodel co-training is effective to train backbones for recognition tasks such as image classification and semantic segmentation. Our approach is compatible with multiple architectures, including RegNet, ViT, PiT, XCiT, Swin and ConvNext. Our training strategy improves their results in comparable settings. For instance, a ViT-B pretrained with cosub on ImageNet-21k obtains 87.4% top-1 acc. @448 on ImageNet-val.

Subjects:	Computer Vision and Pattern Recognition (cs.CV)
Cite as:	arXiv:2212.04884 [cs.CV]
	(or arXiv:2212.04884v1 [cs.CV] for this version)
	https://doi.org/10.48550/arXiv.2212.04884

Submission history

From: Hugo Touvron [view email]
[v1] Fri, 9 Dec 2022 14:38:09 UTC (1,259 KB)

Computer Science > Computer Vision and Pattern Recognition

Title:Co-training $2^L$ Submodels for Visual Recognition

Submission history

Access Paper:

References & Citations

Bookmark

Bibliographic and Citation Tools

Code, Data and Media Associated with this Article

Demos

Recommenders and Search Tools

arXivLabs: experimental projects with community collaborators

Computer Science > Computer Vision and Pattern Recognition

Title:Co-training $2^L$ Submodels for Visual Recognition

Submission history

Access Paper:

References & Citations

BibTeX formatted citation

Bookmark

Bibliographic and Citation Tools

Code, Data and Media Associated with this Article

Demos

Recommenders and Search Tools

arXivLabs: experimental projects with community collaborators