IT 论文精读
CS Papers Deep-Read — BigCat's Milestone-Papers Shelf
> 一篇一图 · 提纯精读 · 读完这页 ≈ 读懂这篇论文
Paper 1
Attention Is All You Need — 用纯注意力取代 RNN,一个架构成了当代所有大模型的地基
Vaswani 等 · 2017
Paper 2
Deep Residual Learning (ResNet) — 一条「跳跃连接」让网络堆到上百层,几乎所有深网络的地基
He 等 · 2015
Paper 3
AlexNet — 让深网络自己从百万张图里学特征,2012 断崖式夺冠、点燃深度学习革命
Krizhevsky 等 · 2012
Paper 4
Word2Vec — 让机器读海量文本自学词向量,「国王−男人+女人≈王后」,embedding 时代的起点
Mikolov 等 · 2013
Paper 5
ViT (An Image is Worth 16×16 Words) — 把图切成小块当「词」喂给标准 Transformer,数据够大时反超 CNN,视觉与语言从此共用一种架构
Dosovitskiy 等 · 2020