IT 论文精读

CS Papers Deep-Read — BigCat's Milestone-Papers Shelf

> 一篇一图 · 提纯精读 · 读完这页 ≈ 读懂这篇论文

Paper 1Attention Is All You Need — 用纯注意力取代 RNN，一个架构成了当代所有大模型的地基Vaswani 等 · 2017 Paper 2Deep Residual Learning (ResNet) — 一条「跳跃连接」让网络堆到上百层，几乎所有深网络的地基He 等 · 2015 Paper 3AlexNet — 让深网络自己从百万张图里学特征，2012 断崖式夺冠、点燃深度学习革命Krizhevsky 等 · 2012 Paper 4Word2Vec — 让机器读海量文本自学词向量，「国王−男人+女人≈王后」，embedding 时代的起点Mikolov 等 · 2013 Paper 5ViT (An Image is Worth 16×16 Words) — 把图切成小块当「词」喂给标准 Transformer，数据够大时反超 CNN，视觉与语言从此共用一种架构Dosovitskiy 等 · 2020