← Hub

AI / ML

AI & ML — BigCat's Learning Path

> AI · Agents · Machine Learning · 每日四则
Day 1 LLM 基础 Transformer · Attention · Tokenization · 位置编码 Day 2 预训练与微调 Pre-training · SFT · RLHF · DPO Day 3 Prompt Engineering Zero/Few-shot · CoT · ReAct · Self-Consistency Day 4 RAG 体系 Embedding · Vector DB · Retrieval 策略 · Re-ranking Day 5 Agent 架构 ReAct · Plan-and-Execute · Reflexion · AutoGPT Day 6 Tool Use Function Calling · MCP · 工具选择 · Sandboxing Day 7 Multi-Agent 系统 AutoGen · CrewAI · 角色分工 · 协作协议 Day 8 Context 工程 Context Window · Prompt Caching · 压缩 · Memory 管理 Day 9 推理优化 KV Cache · Speculative Decoding · Continuous Batching · Quantization Day 10 Loss 与 Optimization Cross-Entropy · AdamW · LR Schedule · Gradient Clipping Day 11 Tokenization 深度 BPE · WordPiece · SentencePiece · UTF-8 边界 Day 12 Attention 变种 MHA · GQA/MQA · Sliding Window · FlashAttention Day 13 位置编码深入 Sinusoidal · Learned · RoPE · ALiBi Day 14 Scaling Laws 规模定律 幂律 · Chinchilla 计算最优 · 涌现能力 · Mirage 批判 Day 15 评估与基准 MMLU · HumanEval/pass@k · MT-Bench · LLM-as-Judge Day 16 经典 ML 算法 线性/逻辑回归 · 决策树 · 随机森林 · SVM Day 17 深度学习基础 反向传播 · 梯度下降 · 激活函数 · 正则化 Day 18 CNN 与视觉 卷积原理 · ResNet · ViT · CLIP Day 19 RNN 与序列 LSTM · GRU · Seq2Seq · Attention 起源 Day 20 生成模型 GAN · VAE · Diffusion · Flow Matching Day 21 强化学习 Q-Learning · Policy Gradient · Actor-Critic · PPO Day 22 语义搜索 BM25 · Dense Retrieval · Hybrid Search · HNSW Day 23 多模态 VLM · Audio LLM · 视频理解 · Embodied AI Day 24 编码模型 BERT · RoBERTa · Sentence Transformers · ColBERT Day 25 训练基础设施 分布式训练 · ZeRO · FSDP · Megatron-LM Day 26 Alignment 数学 RLHF · Reward Model · Constitutional AI · DPO Day 27 可解释性 Mechanistic Interp · Sparse Autoencoders · Feature Circuits · Probing Day 28 推理模型 测试时计算 · CoT · 自我验证 · Best-of-N Day 29 数据工程 合成数据 · 数据策展 · 去重 · 质量过滤 Day 30 表示与嵌入几何 词向量线性结构 · 对比学习/InfoNCE · 各向异性与白化 · Matryoshka Day 31 模型压缩 知识蒸馏 · 剪枝 · LoRA/QLoRA · 量化数学 Day 32 激活函数与归一化 ReLU/GELU/SwiGLU · BatchNorm/LayerNorm/RMSNorm Day 33 概率与信息论基础 熵 · KL 散度 · 互信息 · ELBO Day 34 前沿架构 MoE · 状态空间模型/S4 · Mamba · 长上下文 Day 35 时间序列预测 ARIMA · 指数平滑/卡尔曼滤波 · Prophet · 时序基础模型/TimesFM Day 36 因果推断 因果 vs 相关 · 潜在结果框架 · 工具变量 · 双重差分 Day 37 图机器学习 消息传递/GNN · GCN · GAT · 图嵌入/node2vec Day 38 概率编程与贝叶斯深度学习 MCMC · 变分推断 · 不确定性量化 · PyMC/Stan Day 39 元学习与小样本 迁移学习 · MAML · 原型网络 · In-context Learning Day 40 联邦与隐私学习 联邦学习/FedAvg · 差分隐私 · 同态加密 · 安全多方计算 Day 41 世界模型与具身智能 世界模型/Dreamer · JEPA · 因果表示学习 · 具身智能/VLA Day 42 神经符号 神经符号结合 · 知识图谱嵌入/TransE · 可微分推理 · 程序合成/DreamCoder Day 43 优化的几何与前沿 损失景观/平坦极小 · 锐度与泛化/SAM · 二阶方法/K-FAC/Shampoo · Lion/Sophia Day 44 训练中的反常现象 Grokking/延迟泛化 · 双下降 · 相变与突现 · 涌现是度量假象吗 Day 45 解码与采样数学 贪心/束搜索 · 温度/Top-p/Min-p · 对比解码 · 推测解码