思维之海

——在云端,寻找我的星匙。

论文写作初级调研

衣带渐宽终不悔 为伊消得人憔悴

写论⽂本质是分享思想,应该以读者为中心,降低阅读难度,提升愉悦感。在科研过程中,创新至上,技法为辅。细节决定成败。

正好组合数学课需要写论文,不妨先做一些论文写作方面的简单总结。

References

How to Write a Paper in Scientific Journal Style and Format 学术写作指导

学术论文写作系列:123,4,5,…

机器翻译学术论文写作方法和技巧 刘洋,(Some notesSome notes 2

浅谈研究生学位论文选题方法,刘洋

如何写一篇合格的NLP论文,刘知远

如何以初学者的身份写好一篇国际学术论文,赵鑫

智源论坛Live丨论文写作线上专题报告会:三位青年科学家深入指导学术论文写作

如何端到端地写科研论文,邱锡鹏

第一次写学术论文无从下手怎么办?学术论文写作基本思路分步SCI写作黄金法则:用IMRAD架构论文的技巧如何以初学者角度写好一篇国际学术论文?教你六步写好一篇学术论文英文学术论文写作有哪些经验心得?

基本知识

论文分类

论文的分类方式

论文有多种分类方式。按贡献分为原创论文和非原创论文(如文献综述)。按出版途径,可以分为学位论文、期刊论文、会议论文、内部报告、电子预印版论文(如:Arxiv)。按文章内涵要求,则分为学位论文、期刊标准论文、快报、综述论文等。以下主要按照文章内涵进行论文分类介绍。

期刊标准论文

最常见的原创论文形式,大多数发表在正规期刊上。一般来说,论文中应包括以前没有发表过的原始研究结果,不能一稿多投。这类论文一般有假设、背景研究、方法和结果等内容。

综述论文 / survey

综述论文往往由编辑依据他人推荐邀请作者,或者作者自荐。一般由特定领域的资深学者撰写,用于总结某一领域的成果和进展,对所涉及的科学分支给予批判分析,并指出未来的研究方向。这类文章不属于原创工作,因此通常不邀请受邀作者提供自己的研究成果。

主要有三种类型:文献综述(literature reviews)、系统综述(systematic reviews)和荟萃分析(meta-analyses)。一般情况下,综述文章较长,但也有期刊发表短评(short reviews)。

论文基本结构

好的论文 = 好的研究 + 好的写作

  • 好的研究 = 良好定义的问题
  • 好的写作 = 以读者为中心 + 逻辑清晰 + 可复现

IMRaD / IMRAD 范式

https://en.wikipedia.org/wiki/IMRAD

Writing a Scientific Research Report (IMRaD)

The introduction, methods, results, and discussion (IMRAD) structure: a fifty-year survey

Introduction, Methods, Results, and Discussion.

什么是 IMRaD / IMRAD(/ˈɪmræd/)?它是一种论文写作的组织方式,并且是最流行的原创科研论文的写作方法。

  • Introduction 引言
    • 研究问题是什么?Why was the study undertaken? What was the research question, the tested hypothesis or the purpose of the research?
  • Methods 方法
    • 怎么研究的?When, where, and how was the study done? What materials were used or who was included in the study groups (patients, etc.)?
  • Results 结果
    • 发现了什么?What answer was found to the research question; what did the study find? Was the tested hypothesis true?
  • Discussion 讨论
    • 研究发现有何意义?What might the answer imply and why does it matter? How does it fit in with what other researchers have found? What are the perspectives for future research?



一般的学术论文除了上述的IMRaD的模块之外,还包括题目、摘要、相关工作、参考文献、附录等部分。

不过这些剩下的部分在论文内容写作的比例上只会占到一个小比重。

通用学术论文结构

Title 标题

标题即论文研究的主题。最好体现出研究的主题、使用的主要方法、做出的贡献。一般不要超过15个单词。

Abstract 摘要 2%

摘要位于文章的首位,但是一般在写完文章主要部分的草稿之后最后再写摘要(此时论文已经成型,方便你直接借鉴或者改动论文中一些已经很成熟的重要语句)。用100-200词简介研究任务与挑战、解决思路与方法、实验效果与结论。摘要应该提供一个简短的对论文通篇内容的总览描述:用一两句话来指出研究的目的和重要性,一两句话介绍你的研究方法,然后几句话来描述主要的研究发现,最后用一两句来说明研究发现的意义。摘要的目的在于让读者快速找到文章的核心(精简 + 完整)。

  • 研究内容
    • 你调研了什么问题?这篇论文做了什么?
  • 研究目的
    • 为什么这个研究重要?你的动机是什么?
  • 研究方法
    • 这项研究采用了什么方法?设计了什么样的实验?
  • 研究结果
    • 我们通过方法得到的最核心的发现/结果/趋势是什么?
  • 研究评价
    • 我们解决了什么问题?结果有什么启示?做出了什么贡献?

Abstract和Introduction要介绍的内容其实有很大的相似性,不同在于,Abstract会非常精简,而Introduction则详细很多。Abstract中一句话带过的东西,可能会在Introduction中用好几段来具体阐述。

Abstract可以直接由对Introduction每个部分精简成1-2句话而得到

技巧:在首页放置⼀个图或者表,让读者一目了然你所做的⼯作。

图和表是论⽂的骨架,争取让读者按照顺序看就能理解论⽂的主要思想,不⽤通过看正文才能懂。
把论文的元素放在最应该被放在的地方,符合读者的认知惯性,降低理解难度。

Introduction 介绍/引言 10%

问题 + 挑战 + 工作

引言部分应该解释你所做的研究的重要性/必要性,并给出这项研究的动机(比如,发现了什么问题?出现了什么新的场景?)。接着,描述在当前领域相关研究的现状,然后揭示之前的研究存在的局限性。然后,解释为什么你的研究可以解决这样的局限性(理论局限、性能问题……)。用1页左右篇幅,一般需要分段落(中心句+支撑句+衔接句),比摘要更详细地介绍研究任务、已有方法、主要挑战、解决思路、具体方法、实验结果。

  • 研究背景(Background)
    • 对主题 / 研究任务泛泛而谈,具体描述在这个话题下的一些工作(baseline),说明这个领域/方向的现状和研究价值
  • 研究动机(Motivation)
    • 针对某个研究,列举从古至今其他人的解决方案,引出——还存在某种【问题 / 挑战】
      • 已有方法需要是目前最好、最具代表性的,也是本文工作准备改进的
      • 注意标注参考文献,务必保证精准客观
  • 研究重点 / 创新思路(Research Question)
    • 这篇研究提出了XXX,主要设计/解决了……
  • 研究意义 / 实验结论(Research Aim)
    • 提出的XXX达到什么样的目标,它的价值所在

行文风格要尽量客观陈述,不要使用模糊的修饰词。

Methods 方法/模型/实验 25%

方法部分需要告诉读者你如何进行的研究,包括提出猜想和论证猜想的过程。一般写成“总-分”结构的形式。你应该给出你的科研过程的具体信息,如实验样本、实验方法、实验设备等等。写作的黄金原则是:让读者可以复现你的研究。在方法部分常常会使用小标题的方式,对不同工作部分分别阐述。Methods用2-3页篇幅介绍本文提出的方法模型细节。这部分内容通常会书写在论文的靠后位置。

  • 整体方法介绍
    • 让读者对本文方法有全景式的理解
  • 关键设计
    • 关键理论
    • 数据来源
  • 分析过程
    • 公式、理论推导
      • 正确性证明,时间复杂度,完整的算法流程,参数汇总+学习算法,与之前工作的区别(突出创新性),与之前工作的联系(增强泛化性),模型可扩展的地方(堵漏)……
    • *实验(主实验 + 辅助实验,先辅后主)不辞⾟劳,做到极致
      • 辅助实验(开发集):参数的影响
      • 主实验(测试集):证明显著超过baseline

方法部分只需要记载研究中最正确的路线部分,对于之前研究过程中走过的弯路则一并舍弃。写作中默认把你研究正确的方向和思路交代给读者。你要详细写清楚你的逻辑和每一步的细节。

Introduction中对创新思路与方法的介绍,不要在Methods中简单重复。

方法部分特别重要,一定不要出现硬伤。

技巧:全篇统⼀使⽤⼀个running example,⽤来阐释你的⽅法。

  • ⾸先给出running example
  • 然后利⽤running example,⽤通俗语⾔描述你的想法
  • 最后才是形式化描述

Results 结果 30%

在结果部分你应该展现你的研究发现。典型的写作方式应该只在结果部分展现研究结果来保持客观性,而不附加多余的解释说明或者评价。在结果部分应该放一些数据分析相关的工作,比如:图、表格……并对每一个图表的基本含义分别加以阐述。结果部分总是以研究中的关键结果为开头,然后结合文中所列的图、表等依次介绍,它们应该以良好的逻辑顺序展示出你的关键结果。

  • 关键发现
  • 次要发现

在结果中应该尽可能细节化地展示出 Differences, directionality, and magnitude

The body of the Results section is a text-based presentation of the key findings which includes references to each of the Tables and Figures.

Discussion 讨论 25%

在讨论部分,你应该对你的主要研究结果作一个总结。评价你的研究发现并和其它相关的研究作对比。你还应该讨论你的研究的局限性,并以此来提供一个对未来研究可能的展望。

  • 研究理解
    • 解释研究之前的认知,得到本论文的研究结果后的新认知
    • You must relate your work to the findings of other studies - including previous studies you may have done and those of other investigators.
  • 研究进展 / 局限
    • 讨论你的研究有哪些进展和局限性
  • 研究展望
    • 讨论你之前没做完或者想继续做的一些工作,以前对未来研究的畅想

典型的在讨论中可以探讨的问题:

  • Do your results provide answers to your testable hypotheses? If so, how do you interpret your findings?
  • Do your findings agree with what others have shown? If not, do they suggest an alternative explanation or perhaps a unforseen design flaw in your experiment (or theirs?)
  • Given your conclusions, what is our new understanding of the problem you investigated and outlined in the Introduction?
  • If warranted, what would be the next step in your study, e.g., what experiments would you do next?

Do not introduce new results in the Discussion.

用0.5-1页左右篇幅介绍研究任务的相关工作,说明本文工作与已有工作的异同。尽量覆盖所有相关工作

这部分主要是介绍本文任务和方法的相关工作,目标是通过对已有工作的梳理,凸显本文工作的创新价值。在对相关工作的介绍中,要进行细致的分类整理(或者按照时间发展顺序,或者按照技术路线划分)并突出相关之处。在Related Work的最后,应该落脚到本文工作与已有工作相比,有什么新的思路,解决了什么挑战问题。

Related Work一般放在Introduction之后,或者Conclusion之前,这一般取决于论文工作的特点。如果论文创新性比较细致,放在前面较好,以增加对比;如果有框架性的创新,则发在后面较好。

Related Work也可以作为Discussion的一部分

Related Work 正确的打开方式:

  • 向审稿⼈显⽰你对本领域具有全⾯深刻的把握
  • 通过与前⼈⼯作的对⽐凸显你的⼯作的创新性
  • 为读者梳理领域的发展脉络,获得全局的认识

Related Work 错误的打开方式:

  • 没有引⽤重要论⽂(可以直接作为rejection的理由)
  • 简单的罗列和堆砌,缺乏深刻到位的评论
  • 通过批评乃⾄攻击前⼈⼯作证明你的⼯作的创新性

Conclusion 结论 3%

结论部分需要重点概述论文的创新点和有价值的结果、现象、研究意义。其本质上是对之前的方法、结果和讨论的一个汇总。一般用一段来再次总结和强调本文的创新思路和实验结果,然后说明未来建议的研究方向和开放问题。它的写作方法与引言相反:引言通过对全局的认识,然后深入到某个具体问题,并提出解决方案;结论则是描述具体方法得到的发现,通过这个发现得到了什么结果,这个结果可以在领域中有怎么的贡献,最后进行展望……从具体的工作不断向外延伸,并点明论文的贡献。

Conclusion可以看作是Discussion的浓缩版

Reference 参考文献

参考文献的作用是标明“引用”。也就是在研究中引用了别人的研究成果时,需要进行参考文献的标注。

在参考文献中不要出现不可信来源的引用,如普通的网址、百度百科等。

尽量引用经典或者近期的研究。

注意引用的格式。一般用latex模板即可。

*Appendix 附录

“鸡肋”

附录并⾮必需,但是对于读者深⼊理解你的⼯作有帮助,往往⾮常形式化。附录中记载了对理解论文本身并不关键的信息,但可能对更深入的细节有所描述。附录很少能在发表的论文上找到。

Some examples of material that might be put in an appendix (not an exhaustive list):

  • raw data
  • maps (foldout(插页) type especially)
  • extra photographs
  • explanation of formulas, either already known ones, or especially if you have “invented” some statistical or other mathematical procedures for data analysis.
  • specialized computer programs for a particular procedure
  • full generic names(全称) of chemicals or compounds that you have referred to in somewhat abbreviated(缩写) fashion or by some common name in the text of your paper.
  • diagrams of specialized apparati(仪器).

论文录用的关键特征

AbstractConclusion 很重要,是第一印象!

表达清晰,提高读者阅读时的愉悦性

  • 逻辑性强、容易理解
  • 合理利用图、表、公式
  • 排版美观、赏心悦目
  • 避免低级的语法错误、排版错误、拼写错误
  • 通过附录展示更详尽的信息,显著提高论文可读性

工作扎实

  • 有一定的工作量
  • 实验设计合理、实验详实
  • State-of-the-art结果

论文写作工具

论文写作流程

文献阅读

一定量的文献阅读是进行有效的论文写作的前提。并进行对比:

文献 方法 场景 创新点 优点 缺点 评价

Idea积累

Idea可以是从文献阅读中通过分析而来,也可能是从科研过程中产生,还有一些则是灵光乍现的联想。难度依次递增,Idea的可行性依次递减。

时间管理

  • coarse-to-fine
    • 截稿前⼀个⽉开始写
    • 每隔两天改⼀次
  • 听取不同背景读者的反馈意⻅
    • 专家:专业意⻅
    • ⾮专家:发现信息壁垒
  • 写到极致,完成完美精致的艺术品

常用论文模板