阶跃AI

阶跃AI，一起探索AI生活方式

https://github.com/hzwer/AIPaperWriting

回答

《Writing AI Conference Papers: A Handbook for Beginners》总结

这篇文章是一份针对初学者的指南，旨在帮助他们撰写人工智能会议论文。它由hzwer和DingXiaoH撰写，并提供了一些实用的建议和技巧。

完成论文

结构：文章建议采用典型的论文结构，包括摘要、引言和正文（相关工作、方法、实验、讨论、结论和参考文献）。
核心思想：作者应该明确他们工作的核心优势，并在论文中强调这些优势。
框架：在开始写作之前，作者应该创建一个简单的大纲，以确保他们的内容有条理。
结果：结果部分应该进行扎实的分析，以支持作者的贡献声明。
引言：引言应该建立研究背景，找到研究空白，并概述研究目的和方法。

完善细节

逻辑连贯性：文章强调了逻辑连贯性的重要性，并建议避免滥用连接词。
基于事实的陈述：作者应该确保他们的陈述基于事实和参考文献。
减少困惑时间：作者应该尽量减少读者在阅读过程中的困惑时间，以提高可读性。
增加信息密度：文章建议作者在不影响清晰度的前提下，尽量提供更多的有效信息。
避免常见错误：作者应该注意避免常见的错误，如拼写错误、语法错误和格式错误。

其他建议

使用智能工具：文章建议使用智能工具（如ChatGPT和Claude）来帮助作者解决基本的英语写作问题。
检查列表：文章提供了一个检查列表，以帮助作者在提交论文之前进行最后的检查。
处理拒绝：文章还提供了一些建议，以帮助作者处理论文被拒绝的情况。

这份指南的目标是帮助初学者克服写作人工智能会议论文的挑战，并提供清晰和自信地分享他们的学术成果的指导。

翻译 Introduction 部分

回答

引言部分翻译

在介绍部分，文章首先指出了撰写研究论文对新手来说可能是一个巨大的挑战，尤其是在截止日期临近且作者缺乏学术提交经验的情况下。准备不充分的手稿可能会给合作者和读者带来压力，并可能导致被拒绝或需要进行大量修改。

然后，文章提到了作者在撰写论文时可能会遇到的一些具体问题，比如：在GPU集群运行了半年后，你觉得结果已经足够显著，但即将到来的会议截止日期不到一个月，而你只写了一些课程作业报告。你应该提前多久完成初稿以避免错过截止日期？一篇好的研究论文和一篇差的研究论文有什么区别？在开始写作之前应该做些什么？

这些问题可能会像噩梦一样困扰着你，让你盯着空白的Overleaf主页无从下手。幸运的是，这篇文章就是为你而写的。作者希望通过分享他们自己在被拒绝和被接受的经历中获得的见解，为新手提供一些指导。

文章的主要目标是为初学者提供一份指南，使他们能够更容易地分享他们的学术成果。它将重点讨论与撰写会议论文相关的方面，并特别关注新手常见的陷阱。文章主要分为两个部分：完成论文和完善细节。作者希望通过提供实用的指导，帮助新手驾驭学术写作的复杂性，并清晰自信地为该领域做出贡献。

最后，文章特别推荐了由马超教授整理的写作技巧资源列表。

翻译 “Build A Paper From Scratch” 部分

回答

从零开始构建论文

本节概述了从头开始撰写人工智能论文的过程，包括结构、核心思想、框架、结果和引言。

层次结构

要点：摘要 - 引言 - 主体部分，逐步展开。每个部分都是自完整的。

论文的典型结构包括：1. 摘要，2. 引言，以及 3. 主体部分，其中包括相关工作、方法、实验、讨论、结论和参考文献等部分。我们可以将这个结构分解为三个层次。在每个层次上，你应该旨在传达一个全面的研究叙述。每个层次都是前一个层次的扩展。有了这个理解，让我们来探索如何有效地呈现一个研究故事。

对于初学者来说，建议首先专注于完成论文的主体部分。你可能有一些有趣的发现和实验结果，但你不确定如何定义核心主题。大多数已发表论文的关键贡献恰好属于以下三个类别之一（来自Nowozion）：

洞察力：你对已经存在的东西有解释。
性能：你可以做得更好。
能力：你可以做以前做不到的事情。

确定你工作的核心优势，并在论文中尽早强调它们。你还可以从其他方面进一步扩展整体新颖性。关键研究主题、高效解决方案和创新技术贡献是论文新颖性的主要要素。例如，许多早期有影响力的深度学习作品来自基础模型研究，因为它们有可能影响整个领域。像“批归一化”和“残差学习”这样的技术因其有效性而受到重视。通过强调你工作的新颖性，你将能够区分哪些方面值得努力，哪些是不重要的细节。我们建议阅读一篇名为《科学中的新颖性》的短文。

要点：明确描述相对于以前方法的增量，并找到一两个核心思想。读者在阅读论文时寻求新的见解。一篇好论文应该有容易记住的强项。完善你的核心思想，直到你确信人们会渴望了解它们并广泛分享它们。特别需要注意的是，有些想法可能很好，但如果缺乏原创性，则不建议在论文中详细描述它们。不要低估你自己工作的新颖性。深入挖掘以揭示基本原理。如果ResNet论文被改写为：“我们基于前两个（受VGGNet启发的大量 $3\times3$ 卷积和简化自GoogleNet的并行快捷方式）设计了一个模型”，那么它也会变成一篇没有新颖性的论文。ResNet的思路是提出一个问题，抽象出基本原理，提出自己的解决方案和具体实现，并通过实验验证它们。这可能不完全反映他们的研究过程，但它有效地展示了他们的发现。

要点：考虑目标受众，介绍有价值的发现而不是曲折的研究过程。

在坚持核心思想的同时，开始概述你打算在论文中呈现的内容。首先，创建一个简单的幻灯片来向你的同行、同事或导师展示你的研究方法和成果，以评估他们的理解。有意地从不熟悉你工作的研究人员那里获取反馈可能是有益的，以确定可能的理解差距。与实验过程不同，建议强调有价值的新颖性，并避免呈现你研究的不完整或复杂方面。从读者的角度持续审查和完善你的演示文稿，直到它易于理解。如果觉得你的实验理由缺乏严谨性，可能还需要补充你的研究进行额外的实验。同时，建议进行彻底的文献研究，理想情况下，确定几篇与你的主题高度相关的论文。将这些视为你论文的潜在竞争对手，并检查它们以寻找改进的领域。反思哪些方面会吸引社区的注意，并强调它们，同时减少陈词滥调内容的包含。

使结果更加坚实

要点：围绕贡献陈述，在结果部分进行坚实的分析。许多读者会首先通过检查结果来评估方法的有效性，然后决定是否阅读整篇论文。他们会看你的贡献是否与实验结果一致。即使你对你的方法的有效性有强烈的信心，你也可能需要额外的比较和消融实验。重要的是创建更多的表格和视觉效果，选择最关键的方面来呈现。诚实和客观至关重要；夸大其词尤其不可取。如果你担心过度宣称，建议与同行讨论。

关于引言的结构，我们直接引用教科书（来自Elena）的内容：

移动1. 建立研究领地：a. 表明一般研究领域是重要的、核心的、有趣的，并且以某种方式存在问题；
移动2. 找到一个细分领域：a. 指出先前研究中的空白，或者以某种方式扩展先前的知识；
移动3. 占据细分领域：a. 概述目的或陈述当前研究的性质；b. 列出研究问题或假设；c. 宣布主要发现；d. 陈述当前研究的价值；e. 指出研究论文的结构。

其他建议：

a. 直奔主题，不要写与论文主题无关的内容；
b. 尊重前辈的工作，在指出不足之前肯定历史贡献；
c. Knuth：将读者放在你心中的首位；
d. 考虑使用“第一页图”来突出论文中最重要的方面，吸引读者的注意力。

“写作流传千古，其优点和缺点只有作者自己知道。” ——杜甫

智能助手（如ChatGPT和Claude）可以轻松帮助作者解决英语写作中的基本问题。我们还建议中国地区的作者使用跃问或豆包。本文没有讨论可以由工具自动处理的细节。

本节使用以下概念来衡量文章的可读性：逻辑强度、可辩护性、困惑时间和信息密度。基于这些概念，描述了一些实用的建议和技术来提高论文的可读性。

继续翻译 Readability Improvement 部分

回答

可读性提升

本节通过以下概念来衡量文章的可读性：逻辑强度、可辩护性、困惑时间和信息密度。基于这些概念，我们将描述一些实用的建议和技巧，以改善论文的可读性。

不要滥用连接词

在学术写作中，逻辑连贯性比词汇的优雅更重要。逻辑连贯性源于逻辑本身，而不是连接词。我们应该将连接词视为使语言更流畅的增强手段，而不是使用它们来人为地构建句子逻辑。连接词与实际逻辑之间的不匹配可能会令人困惑，并大大降低可读性。以下是一些具体的例子：

“我们认为问题A是关键的。为此，我们提出了方法B。” 这里的“为此”指的是哪个目的？实际上，前面的上下文只提出了一个观点，没有指定任何行动或目标，所以使用这个连接词是根本错误的。
“系统由三个模块组成。首先，模块A是...其次，模块B是...最后但同样重要的是，模块C是...” 这里，几个连接词给这三个原本没有顺序关系的事物强加了一定的顺序。我们不应该使用连接词来创造逻辑关系。最好是单独介绍这三个模块。

当我们写作时，我们应该思考读者可能会如何挑剔我们所写的每一个句子。如果他们认为有些东西看起来是错误的，他们可能会怀疑整篇论文。为了增强论文的可信度，我们需要尽量减少被质疑的可能性。

基于参考和事实进行陈述

当我们写“问题A是该领域的痛点，尚未解决”时，我们应该考虑到读者可能会问：“为什么这是个痛点？后果有多严重？这个后果对最终性能是否有重大影响？”这需要添加适当的参考文献。比如：“据报道，问题A导致了...[1,2,3]和...[4,5]，这对...至关重要，因为...[6,7,8]。”

在讨论论文的结果时，更加需要严谨：“性能的提升归因于XXX...”应该突出显示证据；“提升可能是由于XXX...”可以展示一些间接证据，如可视化图表。尽可能保持客观，避免夸大其词。

减少困惑时间

“困惑时间”是指读者在阅读过程中，从“嗯，这是什么？”到“哦，我明白了”的时刻所花费的时间总和。论文的总困惑时间越短，可读性就越高，读者也会更加平静。

尽可能在提出概念时就进行解释。建议在给出名称后直接解释组件的本质，例如：“我们提出了XXX，它使用两层多层感知机（MLP）实现。”如果一个概念不容易解释，可以通过引用文献来补充。
解决关系代词的歧义。如果无法使一个长句子完全没有歧义，应该将其拆分为短句子。很大一部分读者不是母语者，花哨的句子结构不会额外加分。
频繁使用主题句，最好放在段落的开头。读者可能无法快速理解所有的细节，这时可以通过主题句让读者快速获取主要信息，避免影响整体阅读体验。

增加信息密度

“信息密度”是指文本向读者提供有效信息的效率。低信息密度可能导致读者失去焦点，质疑作者的专业知识。

尽快切入正题。每个部分的开头可能会谈到历史背景，但尽量不要过于冗长。“不要写无关的内容，也不要写大多数读者已经熟悉的东西。” 讨论人类写作技能的发展，肯定会让绝大多数读者望而却步。
文本和图表应该适当详细或简洁。使用适当的布局来平衡文本和视觉元素。避免常见的陷阱，比如一个大图表中只突出显示几个关键点，或者一个非常长的段落描述了实验细节和超参数，这些应该放在附录中。
重要的解释和阐述应该尽可能靠近图表。理想的情况是，每个图表都可以独立于正文理解。在图例中，尽量清楚地说明主题和主要结论。如果图表中有缩写，最好有解释。如果你想在表5中强调某个结果，最好分析该结果的句子在与表5相同的页面上，并且在该句子之前和之后都有“表5”这个词。这是因为读者可能不会仔细阅读你所写的文本，而是先看图表，然后寻找与图表内容相关的文本。当他们在表5中看到一个引人注目的结果并感到好奇时，他们可能会使用PDF阅读器的搜索功能来搜索“表5”。不要期望读者自己从一个复杂的表格中找出应该与谁进行比较来得出结论。我们应该放上我们想要比较的内容。如果设计这样一个表格很困难，那么值得多次重复某个结果（通常是需要与几个组结果进行比较的基线），即使这意味着牺牲优雅性。没有人会因为表格不够优雅而拒绝你的论文，但如果表格不清楚，那就非常令人讨厌了。首先，避免犯错。在考虑论文的美观之前，先确保论文的严谨性。

以下是一个检查清单，可以帮助作者改进他们的写作：

浏览图表，确保故事完整。努力提高图表的质量，使其能够自我解释。
检查符号、缩写和参考文献的一致性。
文本和图表的细节程度是否合适？
将重要信息放在显眼的位置。
图表中的文本和图例能否更大一些？是否可以通过使用列分隔、加粗文本和删除冗余等方法来提高表格的理解速度？

我们将在附录中列出更多的小项目。由于这份手稿没有经过同行评审，无疑存在许多不完善之处。这里提出的概念主要来源于广泛共享的社区知识，我们努力将其综合和简化，以造福于该领域的新手。我们的目标是提供一个简明而全面的指南，可以减轻初学者在撰写人工智能会议论文过程中的学习曲线。如果这份文件能够为任何读者提供清晰的方向和指引，我们将认为我们的努力是成功的，我们的目标也已经实现。在附录中，我们将涵盖以下几个主题：人工智能论文的产生和发表、提交前几个小时的检查清单、常见的负面评审意见以及如果论文未被接受该怎么办。

继续翻译 Appendix 后内容

回答

附录之后的内容

人工智能论文的产生与发表

本节主要介绍论文的产生过程和评审过程。会议论文通常在双栏排版下约为八页，或在单栏排版下超过十页，具体取决于会议的要求。作者在截止日期前准备并提交他们的论文，以及补充材料，如代码和演示视频。如果没有严重的疏忽，如未对提交进行匿名处理、格式问题或超过页数限制（这些都可能导致直接被拒稿，也称为“办公桌拒稿”），论文将进入评审阶段。大约两个月后，作者将收到通常由三位评审人员提供的反馈，形式为评论和对他们论文的整体评分。这些评审人员中有很多在相关领域有已发表的论文，可能在提交的论文中被引用过。在最初的评审结果出来后，作者必须撰写一份简短的回应，通常为一页，以解决疑问或提供额外的发现。在回应阶段，大约一半的论文会被撤回。评审人员然后会根据回应进行一到两周的审议（通常在一个私人平台上），以确定他们的问题是否得到解决，并讨论论文的优点。通常，评审人员会对论文持积极或消极的态度，尽管有时领域主席会做出决定。最终的接受结果需要再等待大约一个月，之后会通过电子邮件系统公布。通常，接受率在提交的手稿的六分之一到四分之一之间。作者然后根据评审人员的反馈修改他们的工作，并提交最终的、可用于出版的版本。然而，大多数论文会被拒稿并退还给作者。这些作者可以选择按照前面提到的过程重新提交，或者决定停止对论文的工作。值得注意的是，大多数论文会经过一个漫长的完善和修改过程，俗称为“斐波那契提交方法”。

提交前最后几个小时的检查清单

搜索问号：检查LaTeX错误。
确保所有图表：在正文中被提及，并且提及的顺序与图表出现的顺序一致。图表的标题应该非常显眼。
避免语法错误：建议使用句号。
将图表矢量化：检查所有公式是否完整，它们在编辑过程中很容易被忽视。
检查所有副标题：统一大写风格。
确认没有图表：出现在正文页面之外。
检查匿名性：可能需要删除致谢部分。

常见的负面评审意见

我们列出了一些常见的负面评审意见和建议的修改（斜体）。

批评作者不专业：重要参考文献缺失；论文结构混乱，缺少一些必要的元素，如没有为视频相关研究提交补充视频结果；实验设置与之前的工作有显著差异。参考最近论文的参考文献列表来填补空白，并使配置保持一致。
质疑有效性：报告的结果不符合常识且不可信；夸大自己的成就或做出一些明显错误的断言；实验设置或论证中有缺陷。进行更多的实验，完善表达，并力求严谨。
不尊重之前的工作：没有引用最新的结果，进行低基准的实验；过分贬低前辈的工作；将自己的工作与前辈的贡献混淆。在现有工作表中进行更多的比较，进行更多的论文研究，如果你说别人做得不好，请提供证据。
缺乏新颖性：故事叙述不好，逻辑不清楚，或者大部分是已知的知识；感觉工作是增量的，没有做出太大的贡献。换句话说，效果不令人印象深刻。与一些同行讨论，并突出优点。
论文展示质量差：许多语法错误，写作差，英语水平差；难以理解，缺少一些细节。使用人工智能工具或Grammarly进行修改，并请朋友帮忙阅读。
对方法有分歧：不同意实验设计或不相信这种技术路线。进行更多的实验，或引用相关文献中类似的表达来支持你的论点，并尝试赢得其他评审人员的支持。

如果论文未被接受

评审过程具有高度的随机性。但有一条黄金法则经得起时间和随机性的考验——写得不好的论文会得到不好的评审。不管想法有多好，结果有多好，引用有多好，都没关系。写作至关重要——这很讽刺，因为工程师是大学所有学科中写作能力最差的。你需要自律：留出时间写作，深入思考写作，并一遍又一遍地修改，直到你认为它尽可能地完美。（李飞飞）有很多论文在被拒稿后留在了arXiv上，现在产生了巨大的影响。论文在整个过程中将得到显著改进。如果这个过程帮助你产生了一篇真正好的论文，你可以从中受益，并为之自豪很多年。