如何写好一篇论文
下面这些是写过几篇、改过几版、被按着头指导过几次之后沉淀下来的一些「再抽象一层」的原则——不是改哪一篇的具体意见,是以后每次打开新文档都会用到的那种
# 写作的本质:帮读者搭一张地图
一篇好论文,不是「我想说啥就说啥」,而是一路拉着读者的注意力,让他用最短的时间,在脑子里建好这样一张地图:世界是什么样 → 已有工作站在哪 → 你站在哪 → 这两个位置之间差的那一步是什么。
几乎所有「读不懂 / 读着累 / 读完没印象」的毛病,本质上都是这张地图哪里断了。所以写作时最值得反复问自己的,不是「我说清楚了没」,而是:
读者到这一行为止,他脑子里的那张地图长什么样?我下一句要往哪里加一块?
下面几条,都是这一个核心的不同侧面。
# 先在心里当五分钟审稿人
别一上来就抠词。先把自己当成第一次看这方向的读者,按这个顺序在心里过一遍——能答上,后面写起来就不飘:
整篇里每一章、每一段、每个图,最好都能对上这里面的某一条。对不上的多半是废话;同一条被车轱辘三遍的多半是啰嗦。 这五个格子之所以每次都管用,是因为它们就是读者脑子里那张地图要填的五个空。
# 一切写作都在回答「相对谁」
研究论文最容易犯的毛病,是只讲自己,不讲坐标。真正要让读者接收到的,从来不是"我做了什么",而是"在已有的谱系里,我站在哪一格"。具体体现在几个地方:
- 重要性:不是"这方向很重要",是相对于别的方向,它重要在哪;
- 已有工作:不是"别人做了 A、B、C",是把所有工作放进一个统一坐标系(一对 trade-off、一种分类视角、一条时间线……),然后指出一个空格;
- 贡献:不是"我们提了 X",是对照前面那个空格,X 刚好填上了哪一维;
- 数字:不是"Y 提升了 N%",是在什么基准、多强的 baseline、什么样的设定下,N% 意味着什么。
一句话总结:没有坐标的陈述,对读者都是噪声。
# Abstract & Introduction:决定印象的那几分钟
读者对一篇论文的判断,几乎是在 Abstract 和 Introduction 读完的那一瞬间就定格了。后面写得再好,多数时候也只是在微调这个第一印象。所以这两段不能当"内容摘要"来写,要当说服段来写。
几条可以脱开任何具体论文的结构原则:
- 第一句只能放你最想让读者记住的那件事。 凡是"这领域很重要 / 某现象很普遍"这种人人都知道的句子,删掉再读一遍,如果后面更顺,那第一句就是废话。
- 重要性不是重点,"别人不够好"才是重点。 如果不是开山之作,别用两大段去论证方向的意义——只会推迟读者对你贡献的理解。
- 既有工作要用一个统一视角概括,而不是逐篇点评。 逐篇罗列读起来像综述;用一个轴(trade-off / 分类 / 演进线)收束起来,读起来才像论文。
- 贡献之前要有一个 insight 段。 insight 不是"我们发现了一个事实",而是"我们找到了看问题的更好姿势",让后面的贡献显得"应当如此",而不是"灵光一闪"。
- 抽象概念必须配图。 任何新视角、新边界、新分层,都该有一张图让读者一眼看出:已有工作在哪、你在哪。如果图上标不出"你在哪",这张图就没完成任务。
- Evaluation 的预告只给维度和对照,不给形容词。 "我们更好"不是信息,"在哪一维、相对哪个 SOTA、好了多少"才是信息。
Intro 写完自检:把 insight 那段盖住,贡献段读起来是不是突然悬空?悬空就说明 insight 没写透。
# 术语是「产品名」,不是装饰
一篇论文里真正重要的术语通常只有 2–4 个。它们承担的作用是帮读者把你的贡献结晶成一个可复述的名字。这意味着:
- 关键词一旦在 Abstract / Intro 定下来,全文必须一字不换。 近义词替换是读者最大的困惑来源——你以为在说同一件事,读者每次看到新词都当成新概念。
- 新术语第一次出现时要有"锚":一句定义、一个类比、一张图,三选一,最好三选二。没有锚的术语在读者脑子里就是浮空的噪声。
- 每次术语复现时,顺手钉一下它的含义和它为什么好。 一个术语以完全同一个词 + 略微不同的解释重复三五次,读者就会自然把它当成事实记住——这就是你的 contribution 真正被植入读者脑子的过程。
把那 2–4 个术语当产品名来经营:你要让审稿人写意见时下意识用你的词,而不是他自己的词。
# Evaluation:避免「自我总结陷阱」
实验部分最常见的两种坏味道:单维度比对(只比精度、或只比速度)和自我总结(每个小节结尾都来一句 "this demonstrates that our approach is better")。两者的共同问题是——都在替读者下结论,而不是给读者证据。
几条通用做法:
- 基线要覆盖不同路线的代表,而不是同流派的几个变体。比较的价值来自代表性,不是数量。
- 至少两个维度一起看(精度 × 吞吐 / 规模 × 泛化 / 覆盖率 × 成本……),让权衡本身可见。
- 图表的命名、轴单位、图例必须和正文术语完全一致(回到术语一致性)。
- 段尾那句"综上我们更好",十有八九是废话。删掉,段落自己会站住。
# 多版本对照:降噪最快的一招
卡在一段写不出来时,最有效的做法不是继续憋,而是把几个版本摆在一起对比。常用的两种来源:
- 自己的草稿——最贴近你真实想说的,但往往废话多、结构散;
- 仿不同风格的重写版——可以是你欣赏的几位作者的风格,也可以是让模型按某种范式再写一版(比如"偏 insight 驱动、短句、视角拔高一层",或"偏实证动机、以现实世界的不可行性开场")。
把 2–3 版并排,逐段问:
- 谁的第一句最早让人 get 到方向?
- 谁的 insight 拔高得最自然、不是硬塞?
- 谁把 gap 和贡献对得最整齐?
- 谁的段落删一句之后反而更好?
挑骨架最漂亮的那一版,把别版里好的句子搬过来,最后自己再润一遍。
任何外部生成或仿写的版本都只是脚手架——逻辑骨架可以学,但精确度、引用密度和领域语感,始终得自己压。
# 三层 checklist:下笔前 / 小节后 / 交稿前
下笔前(一分钟):
- 这篇文章的一句话 pitch 是什么?
- 全文不超过 3 个核心术语,分别是?
- 用最朴素的话讲,核心 insight 是什么?
Abstract / Intro / 每个小节写完后(五分钟):
- 第一句是立场,还是热身?
- 每个新概念是不是在同段内就被锚住?
- 所有数字都有对照物吗?
- 前面列的缺陷和后面的贡献是不是一一对应?
- 抽象内容有没有一张图让读者一眼看出"别人 / 我们"?
- 关键词前后是不是一字不差?
全文通完后(二十分钟):
- 关键词有没有在每章被"复读"?
- 有没有 "This demonstrates that…" 这种正确但无信息的段尾?全删。
- 每段的首句能不能单独拎出来当 outline?拎不出来的段落八成没写清楚。
# 几条心法
- "我自己懂"不等于"读者也懂"——所有默认都是读者的隐形雷,写作时最该防的就是「这不显然吗」这个念头。
- 卡壳多半不是文笔问题,是思路没理顺——回到那五个格子,把地图画在白板上,往往就通了。
- 论文不是终点,而是关键词的起点——交稿之后还有 poster、slides、talk、rebuttal,都是在反复复读那几个词。定得越准越稳,后面越省力。
感谢 Grace、锦润、琛达,以及所有提供过指导的人