Dynamic Spatial Sparsification for Efficient Vision Tra…更多
分类归档:CV
简记:Tokens-to-Token ViT: Training Vision Transformers from Scratch on ImageNet
在 Transformer 主干之前增加了一个 Tokens-to-Token(T2T) 模块,并将 Transformer 主干以「深而窄」的形式重新设计。更多
简记:Rich CNN-Transformer Feature Aggregation Networks for Super-Resolution
一个应对图像超分辨问题(super-resolution,SR)的模型 ACT 更多
简记:Learning Affinity from Attention: End-to-End Weakly-Supervised Semantic Segmentation with Transformers
这是一篇做自然图像弱监督语义分割的论文,利用图像级的类别标签来实现像素级的语义分割。论文收录于 CVPR2022。更多
A Closed Form Solution to Natural Image Matting – 笔记
笔记-A-Close-Form-Solution-to-Natural-Image-Matting A Clo…更多
基于CNN实现对摄像头捕捉人脸的性别和年龄预测
程序于2023年10月10日更新,移步代码仓库(https://github.com/NICE-FUTURE/…更多