如何写好一篇论文

下面这些是写过几篇、改过几版、被按着头指导过几次之后沉淀下来的一些「再抽象一层」的原则——不是改哪一篇的具体意见，是以后每次打开新文档都会用到的那种

# 写作的本质：帮读者搭一张地图

一篇好论文，不是「我想说啥就说啥」，而是一路拉着读者的注意力，让他用最短的时间，在脑子里建好这样一张地图：世界是什么样 → 已有工作站在哪 → 你站在哪 → 这两个位置之间差的那一步是什么。

几乎所有「读不懂 / 读着累 / 读完没印象」的毛病，本质上都是这张地图哪里断了。所以写作时最值得反复问自己的，不是「我说清楚了没」，而是：

读者到这一行为止，他脑子里的那张地图长什么样？我下一句要往哪里加一块？

下面几条，都是这一个核心的不同侧面。

# 先在心里当五分钟审稿人

别一上来就抠词。先把自己当成第一次看这方向的读者，按这个顺序在心里过一遍——能答上，后面写起来就不飘：

这件事为什么值得做前人做到哪、卡在哪你看见了什么新视角你具体做了什么有多好、凭什么算好

整篇里每一章、每一段、每个图，最好都能对上这里面的某一条。对不上的多半是废话；同一条被车轱辘三遍的多半是啰嗦。 这五个格子之所以每次都管用，是因为它们就是读者脑子里那张地图要填的五个空。

# 一切写作都在回答「相对谁」

研究论文最容易犯的毛病，是只讲自己，不讲坐标。真正要让读者接收到的，从来不是"我做了什么"，而是"在已有的谱系里，我站在哪一格"。具体体现在几个地方：

重要性：不是"这方向很重要"，是相对于别的方向，它重要在哪；
已有工作：不是"别人做了 A、B、C"，是把所有工作放进一个统一坐标系（一对 trade-off、一种分类视角、一条时间线……），然后指出一个空格；
贡献：不是"我们提了 X"，是对照前面那个空格，X 刚好填上了哪一维；
数字：不是"Y 提升了 N%"，是在什么基准、多强的 baseline、什么样的设定下，N% 意味着什么。

一句话总结：没有坐标的陈述，对读者都是噪声。

# Abstract & Introduction：决定印象的那几分钟

读者对一篇论文的判断，几乎是在 Abstract 和 Introduction 读完的那一瞬间就定格了。后面写得再好，多数时候也只是在微调这个第一印象。所以这两段不能当"内容摘要"来写，要当说服段来写。

几条可以脱开任何具体论文的结构原则：

第一句只能放你最想让读者记住的那件事。 凡是"这领域很重要 / 某现象很普遍"这种人人都知道的句子，删掉再读一遍，如果后面更顺，那第一句就是废话。
重要性不是重点，"别人不够好"才是重点。 如果不是开山之作，别用两大段去论证方向的意义——只会推迟读者对你贡献的理解。
既有工作要用一个统一视角概括，而不是逐篇点评。 逐篇罗列读起来像综述；用一个轴（trade-off / 分类 / 演进线）收束起来，读起来才像论文。
贡献之前要有一个 insight 段。 insight 不是"我们发现了一个事实"，而是"我们找到了看问题的更好姿势"，让后面的贡献显得"应当如此"，而不是"灵光一闪"。
抽象概念必须配图。 任何新视角、新边界、新分层，都该有一张图让读者一眼看出：已有工作在哪、你在哪。如果图上标不出"你在哪"，这张图就没完成任务。
Evaluation 的预告只给维度和对照，不给形容词。 "我们更好"不是信息，"在哪一维、相对哪个 SOTA、好了多少"才是信息。

Intro 写完自检：把 insight 那段盖住，贡献段读起来是不是突然悬空？悬空就说明 insight 没写透。

# 术语是「产品名」，不是装饰

一篇论文里真正重要的术语通常只有 2–4 个。它们承担的作用是帮读者把你的贡献结晶成一个可复述的名字。这意味着：

关键词一旦在 Abstract / Intro 定下来，全文必须一字不换。 近义词替换是读者最大的困惑来源——你以为在说同一件事，读者每次看到新词都当成新概念。
新术语第一次出现时要有"锚"：一句定义、一个类比、一张图，三选一，最好三选二。没有锚的术语在读者脑子里就是浮空的噪声。
每次术语复现时，顺手钉一下它的含义和它为什么好。 一个术语以完全同一个词 + 略微不同的解释重复三五次，读者就会自然把它当成事实记住——这就是你的 contribution 真正被植入读者脑子的过程。

把那 2–4 个术语当产品名来经营：你要让审稿人写意见时下意识用你的词，而不是他自己的词。

# Evaluation：避免「自我总结陷阱」

实验部分最常见的两种坏味道：单维度比对（只比精度、或只比速度）和自我总结（每个小节结尾都来一句 "this demonstrates that our approach is better"）。两者的共同问题是——都在替读者下结论，而不是给读者证据。

几条通用做法：

基线要覆盖不同路线的代表，而不是同流派的几个变体。比较的价值来自代表性，不是数量。
至少两个维度一起看（精度 × 吞吐 / 规模 × 泛化 / 覆盖率 × 成本……），让权衡本身可见。
图表的命名、轴单位、图例必须和正文术语完全一致（回到术语一致性）。
段尾那句"综上我们更好"，十有八九是废话。删掉，段落自己会站住。

# 多版本对照：降噪最快的一招

卡在一段写不出来时，最有效的做法不是继续憋，而是把几个版本摆在一起对比。常用的两种来源：

自己的草稿——最贴近你真实想说的，但往往废话多、结构散；
仿不同风格的重写版——可以是你欣赏的几位作者的风格，也可以是让模型按某种范式再写一版（比如"偏 insight 驱动、短句、视角拔高一层"，或"偏实证动机、以现实世界的不可行性开场"）。

把 2–3 版并排，逐段问：

谁的第一句最早让人 get 到方向？
谁的 insight 拔高得最自然、不是硬塞？
谁把 gap 和贡献对得最整齐？
谁的段落删一句之后反而更好？

挑骨架最漂亮的那一版，把别版里好的句子搬过来，最后自己再润一遍。

任何外部生成或仿写的版本都只是脚手架——逻辑骨架可以学，但精确度、引用密度和领域语感，始终得自己压。

# 三层 checklist：下笔前 / 小节后 / 交稿前

下笔前（一分钟）：

这篇文章的一句话 pitch 是什么？
全文不超过 3 个核心术语，分别是？
用最朴素的话讲，核心 insight 是什么？

Abstract / Intro / 每个小节写完后（五分钟）：

第一句是立场，还是热身？
每个新概念是不是在同段内就被锚住？
所有数字都有对照物吗？
前面列的缺陷和后面的贡献是不是一一对应？
抽象内容有没有一张图让读者一眼看出"别人 / 我们"？
关键词前后是不是一字不差？

全文通完后（二十分钟）：

关键词有没有在每章被"复读"？
有没有 "This demonstrates that…" 这种正确但无信息的段尾？全删。
每段的首句能不能单独拎出来当 outline？拎不出来的段落八成没写清楚。

# 几条心法

"我自己懂"不等于"读者也懂"——所有默认都是读者的隐形雷，写作时最该防的就是「这不显然吗」这个念头。
卡壳多半不是文笔问题，是思路没理顺——回到那五个格子，把地图画在白板上，往往就通了。
论文不是终点，而是关键词的起点——交稿之后还有 poster、slides、talk、rebuttal，都是在反复复读那几个词。定得越准越稳，后面越省力。

感谢 Grace、锦润、琛达，以及所有提供过指导的人

上次更新: 2026/06/13, 04:57:22