← Hub
AI 超级个体实战
Super Individual — BigCat's Power Stack
> 工具栈 · Prompt 库 · 工作流自动化 · PKM
D01
Prompt Engineering
四层架构 · XML vs MD · CoT 边界 · Prefix Caching
D02
Context Engineering
Lost-in-the-Middle · 信息排布 · Chunk 设计 · Compaction
D03
Harness Engineering
Agent Runtime · Tool Registry · Permission Gate · Loop Control
D04
Tool Use & Function Calling
Schema 即 Prompt · 工具粒度 · Selection 退化 · Parallel Calls
D05
Agent Design Patterns
Workflow vs Agent · ReAct/Plan/Reflexion · Multi-agent 反模式 · 失败模式
D06
Eval 工程
Golden Set · LLM-as-Judge 去偏 · Prompt Regression · Anthropic Evals
D07
Memory & State 管理
State 四层 · 短期三档 · 长期 3 架构 · Self-Maintained Profile
D08
多模态工程
分辨率即 Token · PDF 三档 · Vision Prompt · 多模态 RAG
D09
Prompting Patterns
Calibration 漂移 · 否定指令失效 · Examples > Rules · Sycophancy → Steelman
D10
RAG 实战工程
Chunking 五代 · Hybrid + RRF · Reranker · HyDE / Multi-query
D11
Hallucination 的工程治理
RLHF 偏差 · Token 风险图谱 · Grounding 三层 · Calibration Eval
D12
Fine-tuning vs Prompting
ROI 决策树 · LoRA/QLoRA · 数据集质量 · 解码参数
D13
Multi-agent Systems
反模式 · Orchestrator-Worker · Debate · 协调税 / A2A
D14
Inference Optimization
Memory-Bound · Continuous Batching · KV Cache · Speculative Decoding
D15
Latency Engineering
TTFT vs TPOT · Streaming · Prompt Caching · 尾延迟 / p99
D16
Cost Engineering
Token 经济学 · Prompt Caching · Model Routing · Batch & 监控
D17
Claude Code 高阶用法
Memory 分层 · Subagents · Skills · Headless + MCP
D18
MCP
三层原语 · stdio vs HTTP · 自建 Server · Context 税
D19
Coding Agents
Edit Format · Plan Mode · 自主度光谱 · Closing the Loop
D20
Refactoring with AI
Characterization Test · Strangler Fig · 非局部推理 · Codemod vs LLM
D21
AI for Research
Deep Research Loop · 研究 Harness · 信息源筛选 · 引用追溯
D22
Writing Engineering
Voice Spec · Slop 反检测 · 分层 Prompt · AI as Editor
D23
Personal AI Infra
LLM Gateway · 跨模型路由 · Cache 两层 · Observability & Key 治理
D24
Prompt Injection 攻防
Lethal Trifecta · 不可信内容隔离 · Capability Gate · Injection Eval
D25
Agentic IDE
异步 Agent · Index vs Agentic Search · Verification 瓶颈 · Fan-out 并行
D26
Computer Use & Browser Agents
Pixel vs DOM · Screenshot Loop · 可靠性工程 · Injection 隔离
D27
Synthetic Data & Self-Improvement
蒸馏过滤 · Constitutional/RLAIF · Rejection Sampling · Model Collapse
D28
Local & Edge LLM
量化损失 · 显存数学 · 运行时差异 · Hybrid 路由
D29
Eval Beyond Benchmark
污染与饱和 · Construct Gap · Slice-Based · Agentic Eval
D30
Open Source Models 实战
选型与 License · 量化与显存 · Prompt/Tool 移植 · MoE 与 Reasoning
D31
Personal AI Safety
Kill Switch · Blast Radius · 欺骗信号 · 可逆性设计
D32
AI Coding 的下一个五年
SWE-bench 局限 · Time Horizon · 能力重定价 · Agent-Ready
D33
大规模 Legacy 代码库的 AI 治理
Strangler 渐进引入 · 护栏即代码 · Ratchet 棘轮 · AI 评审不成瓶颈
D34
Human-in-the-Loop 工程
置信度路由 · 异步审批 · 可中断恢复 · 审批审计
D35
Prompt 即代码 / 版本治理
Registry · Eval 门 · 灰度与回滚 · 跨模型漂移
D36
大型组织的 Skills Library 治理
准入契约 · 去重 · 安全门 · 度量淘汰
D37
AI 可观测性
Trace/Span · 成本归因 · 漂移检测 · 在线评估
D38
结构化输出
四档机制 · 约束解码 · Schema 即 Prompt · 容错栈
D39
Agent 错误恢复与韧性
两层 Retry · 幂等与补偿 · Checkpoint 续跑 · 熔断与部分失败
D40
Data Pipeline for AI
嵌入 ETL · 增量索引 · 索引版本迁移 · Feature Store
D41
流式与中断工程
TTFT 感知 · 增量解析 · Tool Call 流式 · 取消与回滚
D42
AI 测试与 CI/CD
回归断言 · Eval 门 · 影子测试 · 金丝雀回滚
D43
检索质量工程
召回优先 · RRF 融合 · Reranker · 分层归因
D44
AI 辅助数据分析
Schema Linking · Code Interpreter · 统计陷阱 · 数字对账
D45
AI 工程的反模式
过度工程化 · 评估缺失 · Prompt 脆弱性 · 供应商锁定
D46
Voice AI Engineering
级联 vs 端到端 · 轮次检测 · Barge-in · 延迟预算 · 水印
D47
图像生成工程
控制栈分层 · Prompt 反直觉 · 生成 Agent · Provenance 双层
D48
知识库与 GraphRAG
布局感知解析 · 表格行级记录 · 实体消歧 · Local/Global 双路
D49
推理模型工程
路由决策 · 思维预算甜区 · Interleaved Thinking · Trace 可信度
D50
LLM 安全护栏与沙箱
输入输出双闸门 · 越狱 Classifier · 策略门 Fail-closed · 切断 Lethal Trifecta
D51
自动 Prompt 优化
值不值得自动化 · DSPy 编译 · APE/OPRO 指令搜索 · Few-shot 选样与 Overfit 治理
D52
智能体商务与支付协议
AP2/ACP/x402 三层选型 · Mandate 可验证授权 · HTTP 402 结算流 · 授权·真实性·问责治理