一个机器学习博士的经验教训（一个机器学习博士的经验教训）

圣人 2023-04-12 09:25:44 616

一个机器学习博士的经验教训（一个机器学习博士的经验教训）除了对模型本身进行编码之外，尽早建立一个很好的实验管道通常是值得的，这样你就可以在以后快速扩展到许多基线和数据集。我为此目的经常使用的一个工具是神圣的，但你也可以尝试Weights & Biases ，或者 Deepmind 最近开源的XManager。对于绘制图形（初步的，也用于最终论文），我主要使用matplotlib和seaborn. 如果您的研究领域是机器学习（或某些相邻领域），您可能需要编写一些代码来实现测试不同算法的实验。感兴趣的主要语言可能是 Python，尽管Julia 似乎在机器学习方面也有一个不断壮大的社区。我发现对于初步原型设计和模型或数据探索，Jupyter notebook工作得非常好，尤其是与Jupyter Lab结合使用。但是，您应该知道笔记本也有许多缺点（请参阅Joel Grus 的这个有趣的演讲)，因此最佳实践通常是在完成 notebook 中的原型设计后

一个机器学习博士的经验教训（一个机器学习博士的经验教训）(1)

本文作者：Vincent Fortuin，剑桥大学机器学习博士后研究员。科学、莎莎舞和潜水爱好者。

这是该系列的第 2 部分。您可以在这里找到第 1部分和第3 部分。

本文是Vincent Fortuin博士学习机器学习过程的总结，包含了十大步骤和最后的评论总结。

一个机器学习博士的经验教训（一个机器学习博士的经验教训）(2)

1、做研究

在选择了一个研究课题并回顾了文献之后，希望您现在可以兴奋地进行自己的研究！假设您已经头脑风暴了一些想法开始（单独或与您的顾问一起），一个好习惯是通过将这些想法推销给第三方来审查这些想法。理想情况下，您希望这个人在该领域具有一定的专业知识并且不太可能窃取您的想法（大多数人不会窃取它，但稍微小心一点也无妨）。在你开始攻读博士学位时，这个角色最明显的人将是你在小组（或部门）中的同事。如果这些想法存在根本缺陷，他们应该能够发现这一点。一般来说，这暗示了一条更基本的建议，即你应该尽可能多地与尽可能多的人谈论你的研究（再次，假设他们都是不太可能挖你的人）。这将帮助您更好地了解哪些想法是有用的，研究社区对不同主题的一般看法，以及如何更好地传达您的想法。此外，它可以帮助您找到与您关心相同问题的人。

在我的研究中，我发现影响我研究成功的最重要因素之一是我的合作者。与很多人交谈可以帮助您找到好的合作者，这将帮助您进行更好的研究。一个自然的起点是在您的团队中，但您也应该愿意与您部门中其他团队的人交谈，即使他们的兴趣与您的兴趣无关。许多最有趣的合作都是这样开始的！

在开始自己的研究时，一个好的方法是选择该领域的一些相关论文并重新实施它们。无论如何，您可能需要他们的方法作为基线，并且您会惊讶地发现，通过从头开始重新实现一个问题和一个方法，您可以学到很多东西。此外，永远不要害怕给撰写论文的研究人员发电子邮件。您可以告诉他们您有多喜欢他们的论文，并提出您可能有的任何问题。在最坏的情况下，他们只是没有时间回应，但你仍然会让他们的日子变得更美好。在最好的情况下，他们会回答您的问题，甚至可能有兴趣与您合作！

最后，有时你会觉得自己不够聪明，无法进行研究，不属于学术界，其他人只是在做比你更好的研究。这被称为冒名顶替综合症，不幸的是很常见。其他一些人为此写了很多令人欣慰的帖子（例如，Charles Sutton），通常有帮助的是，再次与其他人（例如，您的同事）交谈，以意识到他们实际上都有相同的感受，并且研究是只是通常并不总是那么容易。毕竟，这是我们首先这样做的部分原因。

2、编码实验

如果您的研究领域是机器学习（或某些相邻领域），您可能需要编写一些代码来实现测试不同算法的实验。感兴趣的主要语言可能是 Python，尽管Julia 似乎在机器学习方面也有一个不断壮大的社区。我发现对于初步原型设计和模型或数据探索，Jupyter notebook工作得非常好，尤其是与Jupyter Lab结合使用。但是，您应该知道笔记本也有许多缺点（请参阅Joel Grus 的这个有趣的演讲)，因此最佳实践通常是在完成 notebook 中的原型设计后，定期将代码重构为独立的 Python 脚本和模块。一般来说，一个好的习惯是定期重构代码，例如，使用重构大师的策略。您还应该尝试为您的代码编写测试，这将为您以后省去很多麻烦。好的包是pytest或unittest。在测试机器学习模型本身时，这有点棘手，但您可以从Jeremy Jordan或Eugene Yan应用的策略中获得灵感。

除了对模型本身进行编码之外，尽早建立一个很好的实验管道通常是值得的，这样你就可以在以后快速扩展到许多基线和数据集。我为此目的经常使用的一个工具是神圣的，但你也可以尝试Weights & Biases ，或者 Deepmind 最近开源的XManager。对于绘制图形（初步的，也用于最终论文），我主要使用matplotlib和seaborn.

我对这些工具的主要建议是首先不要将图形大小视为一些随机参数，而是将其实际设置为您在最终论文中想要的大小。例如，在 NeurIPS 论文中，您的图形应为 5.5 英寸宽，而在 ICML 论文中，单栏图形应为 3.25 英寸，双栏图形应为 6.75 英寸。在绘图中坚持这些大小将确保字体大小在论文中的不同图形中保持不变（并希望可读）（还有可以帮助您的库，例如tueplots）。其次，你应该尽量确保你的数字看起来漂亮和干净，因为这是论文的读者（和审稿人）首先会注意到的事情之一。

如果对图形的布局有疑问，请随时向一些同事寻求反馈或查看Edward Tufte的一本书。您可能应该为每个最终数字花费至少一个小时。第三，您应该始终将图形导出为矢量图形（即，通常为 PDF 文件），这样您就不会在论文中的嵌入图形中遇到分辨率问题。或者，您也可以直接将图形导出为 PGF（TiKz 文件规范），但这有点挑剔，我只推荐给高级 LaTeX 用户。最后，确保永远不要使用Type 3 字体在你的数字中。令人讨厌的是，Type 3 字体似乎仍然是 matplotlib 中的默认字体，但您可以在 .matplotlibrc 文件中更改它，或者在代码中调用 matplotlib.rcparams['pdf.fonttype'] = 42 。

最后，关于确认偏差的说明：我经常观察到（也在我自己身上）是编写一些实验的一种模式，意识到结果看起来不像预期的那样，然后调试代码直到结果看起来不错，然后收工并以这种方式进行实验。当然，一般没有理由相信，在结果看起来不错之后，代码中就没有更多的错误了，确实，不错的结果可能是由于一些错误，就像之前的糟糕结果一样. 所以这只是说当结果看起来不错时不要停止调试很重要，而是继续批判性地评估实验的正确性，甚至可以说，结果看起来越好。

如果它们看起来好得令人难以置信，那通常是因为它们确实如此。当然，当结果看起来不错且值得一试时，有很多动机可以停止调查，但是您应该对自己和社区保持警惕并确保不会成为这种确认偏差的牺牲品。尽管写一篇很酷的论文的前景看起来不错，但如果其他人在您的代码中发现了一个在发布后使您的结果无效的错误，那肯定会比您之前自己发现该错误更烦人（并且可能会损害您的声誉）写论文。

请注意，让同事或合作者查看您的代码（甚至尽管写一篇很酷的论文的前景看起来不错，但如果其他人在您的代码中发现了一个在发布后使您的结果无效的错误，那肯定会比您之前自己发现该错误更烦人（并且可能会损害您的声誉）写论文。请注意，让同事或合作者查看您的代码（甚至尽管写一篇很酷的论文的前景看起来不错，但如果其他人在您的代码中发现了一个在发布后使您的结果无效的错误，那肯定会比您之前自己发现该错误更烦人（并且可能会损害您的声誉）写论文。请注意，让同事或合作者查看您的代码（甚至pair-programming），因为他们可能会发现你不会看到的错误。如果您缺少同事和合作者，您也可以尝试橡皮鸭调试。

3、与您的顾问互动

同样，根据您的顾问的亲力亲为或放任自流，您将或多或少地与他们互动。也就是说，如果你真的需要开会，你永远不应该害怕要求开会。尤其是在你攻读博士学位的初期，你需要更频繁的会议来跟上进度，这是完全正常的。一个常见的错误是卡在某件事上，然后从不要求你的顾问开会，因为你“没有什么可展示的”。同时，您的顾问可能会认为您的研究进展顺利，因为您从不寻求帮助。

这个错误是建立在一个常见的误解之上的，即那些会议主要是为你的顾问准备的。它们不是：它们是给你的！这意味着会议的主要目标也不应该是向您的顾问展示您所有令人印象深刻的进步，而是实际上最有效地利用时间来为您的下一步寻求帮助。通常，这当然需要一些进展的介绍，但关键是要理解，这应该只包含在对您有用的范围内，而不是为了它本身。

一般来说，确保您的顾问有效地赶上您项目的当前阶段并了解您的障碍或障碍是什么以及您需要帮助的地方应该符合您的最佳利益。您可以使用不同的工具来确保这一点，但技术含量相对较低的解决方案只是共享的 Google Doc，事先准备好会议议程，并为下次会议保留会议记录和待办事项。您还可以使用此文档来展示一些关键的研究结果，尽管通常准备一个简短的幻灯片会更有效。

当然，您还应该注意顾问的时间，并以能够在分配的时间段内完成的方式准备会议。与您不应该害怕要求额外的会议类似，如果您觉得目前不需要帮助，您也不应该害怕取消预定的会议。

4、与社区互动

虽然您的顾问通常是您的第一个联系人，但您也应该尝试与研究界进行更广泛的互动。正如我在上面提到的，这包括您在小组中的同事、同一部门的人员、可能是您所在机构其他部门的人员以及其他机构的人员。同样，尝试定期与尽可能多的人交谈是学习事物并可能产生新合作的好方法。

与社区互动的一种有效方式是参加可能由您的部门或机构（甚至是其他在线机构）主持的研究讲座。即使看起来演讲的主题与您的研究无关，并且您确实想完成一些实验的编码，但大多数时候参加演讲可能仍然是一个好主意。你几乎肯定会学到一些东西，即使它只是一些关于如何进行好演讲（或避免什么不做坏演讲）的见解。

随着您在整个博士期间的成熟，您可能会获得一些对社区中更多初级成员有用的经验。如果有年轻的学生向您伸出援手，请花时间慷慨解囊并尝试帮助他们。记住：大多数人在学术界都很聪明；通过善良来区分自己。

与新朋友互动并学习很多东西的另一种方法是在您的正常团队之外进行一段时间的研究。您可以通过访问不同机构的另一个研究小组或在该行业进行研究实习来做到这一点。您当然应该与您的顾问讨论这些选项，并且可用性可能会因您所在的机构和博士阶段而有所不同。一般来说，我可以全心全意地推荐这两种活动，但你可能会在你的博士后期（即，不是在第一年）从它们中获得更多。

最后，您绝对应该尽早为自己建立一个个人网站。这将使人们更容易了解您的研究并与您取得联系。我为此使用了GitHub Pages，但有许多不同的选项既简单又免费。同样，拥有一个 Twitter 帐户通常是个好主意。尽管该平台上有许多可能不值得关注的讨论，并且您应该避免过多地陷入其中，但许多学者使用 Twitter 来宣传他们最近的工作，这可能是让更多人阅读您的最新成果的好方法纸。

5、教学和监督学生

如果您在高等教育机构（例如大学）攻读博士学位，通常有机会（甚至是要求）作为助教参与教学工作。这似乎是一件烦人的家务活，会占用你研究的时间，但它可能是你更深入地学习一些东西的好机会。每当我要教一些我确定自己理解得很好的东西时，我总是在教学准备过程中注意到实际上有些细节我没有完全理解，需要阅读。当只为自己研究一个主题时，很容易欺骗自己相信自己理解它，但是当你需要连贯地向别人解释它时，你知道什么和不理解什么就很明显了。因此，我强烈鼓励您一有机会就参与教学。这也是了解年轻学生的好方法，然后您可以对其进行监督。

在你攻读博士学位的初期，你自己可能仍然需要大量的指导和监督，所以监督学生的前景可能看起来令人生畏。但是当你完成了几个研究项目之后，你很快就会意识到你可能对这些项目有后续想法，而你自己没有足够的时间来做这些。这些通常是给年轻学生的好项目（例如，为他们的学士或硕士论文），因为它们定义明确，您通常将拥有特定项目的经验来有效地指导他们完成研究过程。因此监督学生（或与其他人共同监督他们）不仅是获得研究帮助的好方法，而且（与上述教学一起）也是学术工作的重要组成部分。

6、项目和时间管理

博士的伟大之处在于你基本上是你自己的老板。博士的可怕之处在于你基本上是你自己的老板。所以一方面，你有很大的自由，可以专注于让你兴奋的具有挑战性的问题，但另一方面，你必须管理自己的时间。一开始这可能会让人望而生畏，特别是如果您已经习惯了一生都在外部定义的时间表。

我的首要建议是保持健康的工作/生活平衡。这并不一定意味着你不应该在周末工作（有时你可能希望在会议截止日期之前完成一些论文）或者你应该每天下午 5 点离开办公室。但这确实意味着您应该留出足够的时间来休闲和放松。当涉及到你的注意力和创造力时，就像体育锻炼一样，休息时间可能与活动时间一样重要。

我花了很多个晚上疯狂地尝试调试一些代码，但没有成功，只是为了第二天早上返回并在五分钟内发现错误。有时你的大脑只需要休息一下。此外，休息可以帮助您获得一些观点。不要迷失在研究的杂草中，你应该经常退后一步，问自己“这是我现在可以为这个项目做的最有用的实验吗？” 或“这是我现在可以从事的最有用的项目吗？”。不要害怕否定地回答这个问题，然后改变你正在做的事情。通常，当你的主要项目变得艰难而你因为太沮丧而无法高效地工作时，做一个（或两个）小项目也会有所帮助。话虽如此，您可能应该尽量不要有太多的并行项目。

您可以用来更有效地安排工作和计划时间的最强大工具是日历。许多人之前已经注意到日历严格优于待办事项列表，您可能应该阅读Devi Parikh关于此事的帖子。主要论点是，您实际上生活在一个物理世界中，其中时间（由您的日历反映）是受约束的维度之一，而不是任务所在的世界。你的待办事项清单的长度是无限的，而你的一天总是只有 24 小时。因此，与其把任务放在你的清单上，不如把它们放在你的日历上。

现在，您可能已经注意到这会带来一个额外的问题：虽然您的待办事项列表很乐意只包含任务的描述，但您的日历也想知道您执行它需要多长时间。估计这一点没有秘诀，你的估计一开始可能会很不准确，但我发现对某些任务有帮助的是使用番茄钟技术。归结为让你估计 25 分钟有多少块（番茄钟) 您将需要执行一项任务，然后在您的日历中安排该任务。如果您最终没有完成，请估计剩余部分所需的块数，并将其安排在以后的时间。如果您跟踪不同任务最终实际需要多少块，您很快就会发现您过去的持续时间对于未来的任务具有惊人的预测性。因此，理想情况下，您最终会得到一个小查找表，了解不同任务需要多少番茄钟。

使这项工作可靠的主要技巧是以原子方式定义任务。不要将任务定义为“写论文 X”，而是将其定义为“为论文 X 画大纲”、“为实验 Y 画图”或“写论文 Z 的第 2.1 节”。这样做一段时间后，您可能会变得足够熟练，可以自动在日历中为不同的任务分配适当的时间，这将帮助您提前正确计划并按时开始项目的不同阶段，而无需赶在截止日期前。相信我，在截止日期之前提交精美的论文，而你的同事仍在争先恐后地进行最后的实验，这种感觉是非常值得的。

最后，不仅保留前瞻性的日历，而且还可以记录您的进度的回顾性研究日记，这也将大有帮助。当您在已经完成的所有实验中迷失方向或想要根据一些新见解重新审视您在项目开始时的一些旧想法时，这将帮助您。几乎更重要的是，当你觉得你在上周（或一个月或学期）没有取得太多成就时，它会为你提供帮助，并且你可以回顾你实际做过的所有事情，这通常会比你记得。

7、写论文

所以现在你已经做了一些研究，并希望找到一些有趣的结果，是时候把它们写成论文了！许多学生错误地认为他们作为研究人员的工作就是做研究。事实上，它不是！作为一名研究人员，你的主要工作，也是为什么作为一名学者，你通常通过税收支付报酬的原因，就是向世界传播有趣的新颖研究成果，以便他们可以帮助他人。这必然假设你首先做了一些有趣的新颖研究，但这也意味着如果你不传达你的结果，你可能根本就没有做过研究。这一切都只是说：世界（和学术界）通常并不关心你的实验（以及你一路上结交的所有朋友），而只关心你的出版物。

虽然这听起来一开始可能有些愤世嫉俗，但它也揭示了一个很好的机会：如果你的研究过程是混乱、艰巨和令人费解的，那么你现在有第二次机会以更直接的方式讲述这个故事。您可以让其他研究人员免去您必须经历的困惑，并为他们提供最短和最直接的结论途径。而且，用查尔斯·萨顿的话来说，您被授予“参与全球学者社区长达数百年的对话的特权”。如果这不是值得骄傲的事情，我不知道是什么。

现在，要深入了解如何写一篇好论文的实际问题，我通常推荐Simon Peyton-Jones关于这个主题的演讲（顺便说一下，他也有一篇关于如何发表好演讲的精彩演讲）。一个主要想法是尽早提出一个故事，然后相应地计划所需的实验。否则，很容易发生这样的情况，即在撰写论文时，您会意识到一半的实验并没有真正有用，并且缺少许多可能有用的实验。在起草故事时，我喜欢想象如何在白板前向同事讲述这个研究项目。想象中的白板上写的东西的顺序可能也应该是纸上的顺序。另一种组织论文的好方法（也克服了writer's block ) 是先写一个粗略的大纲，就一些要点而言。然后，您可以与您的合著者一起迭代该大纲，直到大家都同意这个故事是有意义的。一旦你有了它，你就可以继续，一个一个地把每个要点变成一个段落。在不知不觉中，您将获得一份纸质草稿！

为确保最终获得精美且可读的论文，您必须磨练自己的写作技巧。虽然影响你论文发表机会的一个主要因素是你自己对英语的掌握（尤其是如果它不是你的母语）这似乎是不公平的，但英语已经牢固地确立了自己作为科学通用语的地位，所以我们都现在必须处理这个问题。阅读《风格元素》是提高写作技巧之旅的良好开端，然后可能会时不时地重新阅读它。除此之外，一些大学还提供科学写作课程，您绝对应该考虑参加。当然，你不必独自对论文的写作承担全部责任，你应该确保所有的合著者都至少阅读了最终草稿，并有机会就写作给你提供反馈。

说到共同作者，如果您将上述建议（关于与多人交谈的建议）牢记在心，您的论文中可能会有一些潜在的共同作者。在决定包括谁时，我通常会建议在包容性方面犯错。当然，如果他们没有对论文做出任何贡献，你不应该邀请任何人成为共同作者，但最有意义的贡献（项目建议，编码帮助，数据分析，写作帮助，等）应保证合着。同时，贡献很小的人可能会拒绝您作为合著者的邀请，这也没关系。您应该确保提前讨论作者顺序，而不仅仅是在截止日期前的最后一天。如果您想让读者更清楚地了解贡献了什么，CRediT 系统），如今许多期刊和会议都鼓励使用它。

此外，正如我在上面所暗示的，请确保慷慨地引用与您的论文相关的所有相关工作。再次，在包容性方面犯了错误。许多才华横溢的人对他们所做的研究的认可度太低，因为他们的论文在某种程度上被后续工作忽视了，所以在应得的地方给予表扬。它不会降低您自己贡献的价值，并且会向读者表明您对您的研究领域有很好的了解。

最后，一旦您提交了手稿，请考虑在arXiv上提供预印本。您当然应该与您的共同作者协调，并确保您提交的地点允许，但这通常是一个好主意，特别是如果您觉得您的论文处于良好和优美的状态（希望是，否则您可能一开始就不应该提交它）。

8、使用LaTeX

如果您正在撰写任何技术学科的论文，您可能会使用LaTeX（或更具体地说，LaTeX2e）来排版您的文档。尽管大多数会议都为您的论文提供了 LaTeX 模板，但仍有许多细微之处需要考虑以改善您的写作体验。

通常，您需要为您的 LaTeX 文档选择一个编辑器。虽然一些纯粹主义者更喜欢使用像vim这样的基本文本编辑器，但还有许多具有更吸引人界面的替代品。对于离线编辑，我个人喜欢Texpad（虽然它不是免费的）。如果您与多位共同作者共同撰写论文，您可能无论如何都不想使用离线编辑器，而是选择协作在线编辑器。这些天最受欢迎的是Overleaf。虽然与离线编辑器相比，它有一些烦人的小问题，但总体上它的工作做得非常好。它通常也是免费的，但您可能希望说服您的机构获得 Pro 许可证以获取其他功能。如果您以前从未使用过 LaTeX，Overleaf 还提供了一个不错的简短教程。

LaTeX 的主要优点之一是您可以很容易地对文档的某些部分进行全局更改。要最有效地使用此功能，您应该养成定义宏的习惯。例如，您可以将某些数学符号定义为宏，如果您想用希腊字母 θ 表示模型的参数，假设定义 \params 以映射到 \theta。然后，您使用 \params 宏编写所有方程式，如果您后来决定实际上希望参数被称为w，您只需将带有宏定义的一行更改为 \mathbf{w} 并且它会自动改变所有方程中的所有出现！如果您对定义自己的数学符号感到不知所措，您也可以采用Ian Goodfellow 的深度学习书，他方便地开源了。另一个有用的宏是方法的名称。您可以在撰写论文时定义 \ourmethod 以映射到一些初步名称，如果您稍后想出一个更吸引人的名称，您可以轻松更新它。

LaTeX 还提供了在您的文档中使用第三方包的能力。最方便的方法之一是cleveref。使用简单的命令 \cref{LABEL} 可以很容易地引用图形、表格、部分、方程式和任何你用 \label{LABEL} 命令标记的东西，然后它会自动扩展为正确的引用文本，遵循您定义的缩写和大写偏好。

新 LaTeX 用户最头疼的问题之一是书目管理。虽然有许多不同的工具可以解决这个问题，但主要用于计算机科学出版物的工具是natbib。通常，natbib 需要一个带有 BibTeX 条目的 .bib 文件。您可以从Google Scholar获取您想要引用的论文的这些条目，但通常会有一些小错误，因此请务必仔细检查。

BibTeX 条目的一个更可靠的来源（至少对于计算机科学出版物）是dblp. 一旦你在你的 .bib 文件中有一个你想引用的论文的条目，比如 key 是 author2022paper，你有两种主要的引用方式：在文本中或作为括号。您可以将文本内引用设置为“Following \citet{author2022paper}，我们做......”，它将呈现为“ Following Author et al. （2022 年），我们确实…… ”。括号内的引用设置为“……这已在先前的工作 \citep{author2022paper} 中显示”并呈现为“ ……这已在先前的工作中显示（作者等人 2022） ”。确保不要混淆这两种类型，因为这可能会让读者感到困惑并影响流畅度。

最后，再次确保您不包含任何 Type 3 字体（主要是通过阻止 matplotlib 使用它们，见上文）。例如，您可以通过在 Acrobat Reader 中查看呈现的 PDF 的文档属性来检查这一点。对于初次投稿来说，这可能不是问题，但是如果您的可拍照版本包含 Type 3 字体，许多会议和期刊将不会接受它，此时删除它们通常会更烦人（通过重新绘制数字），而不仅仅是从一开始就避免它们。

9、写反驳

一旦您将论文提交到某个地点，通常会将其发送给同行评审，然后在几周（或几个月，对于某些期刊的情况下）返回给您进行评审。然后，您通常有机会写一篇反驳文章，即对审稿人的回应。

首先，您可能会对一些评论感到失望。这是完全正常的。毕竟，你在这个项目上花费了很多时间，并为写一篇好论文付出了很多努力，然后有些审稿人有时就是不明白，提出愚蠢的问题并做出不公平的评论。切记不要将其视为个人；主要问题通常是审稿人没有足够的时间正确理解你的论文。最后，这也不是他们的错，只是当前机器学习中的同行评审系统在某些方面有些欠佳。有一些改进它的举措，但就目前而言，我们仍然必须处理这个问题。

有几个人写过如何写一篇好的反驳文章（例如，Devi Parikh）。关键是要了解参与其中的每个人或多或少都是自愿这样做的。对你的论文做出决定的审稿人和区域主席通常不会得到报酬，而是自愿在自己的时间这样做。所以至少，你应该感谢他们花在你论文上的时间。鉴于他们的时间有限，他们经常会忽略或误解事情。您应该以友好和尊重的方式向他们指出这一点。如果几个审稿人有相同的误解，你还应该考虑到你的论文可能有一些澄清的潜力。假装匿名审稿人是您的友好同事会有所帮助，您已将论文草稿提供给他以征求反馈。如果评论读起来特别负面，想象一下，审稿人是您的一位友好同事，他在撰写评论时碰巧度过了非常糟糕的一天。很有可能，这最终离真相并不远。

同样，由于任何相关人员的时间限制，您应该尽可能简洁地写出您的反驳。你应该简短地感谢审稿人的时间，然后有效地指出主要的误解。如果技术上可行，请随意使用某种形式的突出显示，以便区域主席无需详细阅读即可快速了解您的反驳。

即使有最好的反驳，你的论文仍然很有可能被拒绝。这主要是因为主要会议决定拒绝很多论文（通常是 80% 左右），而且审查系统本质上是随机的。所以不要把拒绝放在心上，只要利用你从审稿人那里得到的反馈来改进论文，然后提交给下一次会议。用我曾经听过的棒球比喻来说，一个好的业余球员可能有一个平均击球率0.2，而大联盟球员将在 0.3 左右。因此，如果平均会议论文有 20% 的接受概率，而你的论文有 30% 的时间被接受，那是一件值得骄傲的事情，即使你的论文仍有三分之二以上会被拒绝。或者，您可以考虑提交给TMLR之类的期刊，其中审稿人不太关注新颖性和最先进的性能，并且接受率更高。

10、参观会议

如果您的论文被会议接受，您通常应该有机会参观会议并在那里展示。这些天来，许多会议都是虚拟举行的，这让体验变得不那么令人兴奋了，但它们正在慢慢恢复到亲自举行。这通常意味着，您将前往世界上某个有趣的地方，并在一个挤满其他研究人员的大型会议中心度过一个星期。如果您的顾问或机构无法资助您的旅行，您应该知道大多数会议都为学生提供旅行奖励，并且还有许多外部旅行补助金，但您需要提前申请。因此，请务必尽早与您的顾问讨论。

一旦你参加了会议，就会有大量的演讲、海报会议、研讨会、教程、茶歇和派对，所以它可能会让人不知所措。请记住，没有人可以参加会议的每一个活动，所以不要过度。时不时地休息一下，然后在城市中漫步观光或喝杯咖啡是完全合理的。就实际的会议计划而言，尽量为自己制定一个不想错过的日程。作为优先事项的一般列表，我建议：网络活动、研讨会、海报会议、教程和讲座。

社交活动可能是每次会议中最有价值的部分（遗憾的是，这也是虚拟会议中最难模仿的部分）。他们让您有机会结识可能愿意与您合作的其他博士生、可能会接待您进行实习的工业研究人员，或者您可能会访问以进行研究的高级学者。此外，在你的博士毕业时，你可能会找到一个博士后或工业职位作为你的下一份工作。

出于相同的原因，研讨会很不错，因为它们基本上是网络活动，主题关注较窄，并且有一些演讲和海报。它们提供了一种很好的方式来结识来自您特定研究领域的人，并查看一些通常仍在进行中的初步研究。同样，他们很高兴找到新的合作者。

主要会议海报会议通常非常拥挤，如果您没有做好准备，可能会让人不知所措和令人作呕。你应该提前挑选一些你真正关心的海报，然后甚至可以事先浏览这些论文。在实际会议上，您可以直接前往这些海报，并希望与演示者进行富有成效的讨论，提出您所有的问题。如果你选择了与你自己的研究领域相关的海报，你甚至可以学到一些没有写在论文中的东西，你也可以通过这种方式找到新的合作者。如果您觉得海报演示者的压力太大而无法进行深入讨论，并且周围有太多其他人，请随时建议他们在会议的另一天喝杯咖啡或午餐。

教程通常可以很好地了解您并不真正熟悉的某些领域，但是之后通常也可以在线获得它们，因此如果您有更好的事情要做，请随时跳过它们。

最后，不幸的是，参加会议的演讲通常不是很有用。这不一定是演讲者的错（尽管有时可能是），但主要是因为他们需要准备一次演讲以将他们的研究传达给听众，听众从该特定子领域的专家到一年级学生完全不同的区域。我个人发现，我通常可以通过浏览一篇论文 15 分钟而不是听他们在 15 分钟内解释它来了解更多关于某人的研究的信息，因此我通常会跳过大多数会议演讲。这通常也是在咖啡厅与其他与会者进行更轻松讨论的好时机，在谈话过程中，这里的拥挤程度要低得多。

总的来说，只是尽量保持良好的平衡并度过愉快的时光。如果您遇到任何您喜欢其研究的人，请记得在会议结束后与他们联系并尝试保持联系。你永远不知道这可能会导致什么！

写评论

一旦你经历了提交和重新提交论文和撰写反驳的几个周期，并希望能发表一些论文，会议将开始要求你担任审稿人。这是回馈社会的激动人心的机会！一个好的经验法则是，您可能应该至少像您向会议提交论文一样经常审查会议，否则整个同行评审系统将不可持续。话虽如此，如果你有其他重要的承诺（例如，写你的论文），不时拒绝审稿人邀请也是完全可以理解的。

一旦您接受了审稿邀请，您通常会被要求为您想审阅的有趣论文出价。这是了解您所在领域的其他人在做什么的好方法，因此请计划一些时间来实际查看论文。你应该为任何你觉得有趣的阅读和任何你认为你特别有资格审查的东西出价。

在您开始审查您分配的论文之前，您应该查看特定场所的审稿人指南。您还可以查看来自其他场所的那些（例如ICML one），它们对审查有一些很好的一般指导。此外，您应该查看评论表以了解您最终会写什么。

在实际审阅论文时，请再次尝试假装这是您从一位友好的同事那里得到的草稿，他正在征求您的意见。不管你认为这篇论文有多糟糕，试着在你的评论中保持友好和尊重。此外，不必问自己如何解决这个问题，然后批评作者没有这样做。只需尝试评估他们选择的方式是否在科学上有效，以及他们的结论是否有证据支持。最后，会场希望您评估社区从发表这篇论文中受益的可能性有多大。尝试在不过度依赖研究的“新颖性”或“性能”的情况下做出决定，而是问问自己，您是否可以想象会议的重要部分参与者（或期刊的读者）可以从论文中学到一些有用的东西。如果是这样，您可能应该建议接受。

如果您要推荐拒绝，请确保向作者提供明确的指导，说明他们需要改进哪些内容才能推荐接受。如果这些是微小的改进，有时甚至可以在反驳期内做出，因此请准备好之后重新评估您的评估。此外，请考虑您遗漏或误解某事的可能性（这种情况经常发生），因此请愿意让作者向您指出这一点。最后，一定要参与与其他审稿人的讨论，因为他们可能已经抓住了论文的（积极或消极）方面，而你没有。

这是文章系列的第 2 部分。您可以在顶部找到指向本系列其他部分的链接。

https://medium.com/@vincefort/phd-lessons-part2-ce830329c86f

Vincent Fortuin

网站首页

返回栏目

一个机器学习博士的经验教训（一个机器学习博士的经验教训）

猜您喜欢：

相关文章