很高兴和你相遇
这里正在记录我的所思所学
邮箱 [email protected]
首页 标签 归档 播客 主页 简历

需要时刻留心的24个生物信息学提示

前几天读到一篇英文博客深以为然,所以翻译一下和大家分享。以下24个提示不仅适用于生物信息而是适用于所有科学研究,看似简单但需要我们时刻留心。

  1. 保持简单
  • 如果你刚开始接触生物信息学,务必保持简单。设定几个明确的目标然后专注于它们,不要偏离方向,也不要试图一下子做太多。
  1. 寻求帮助
  • 有许多资源可以帮你解决生物信息学问题。无论是线上论坛还是与身边的同事同学交谈,你都可以获得编程语言或其它技术的支持。
  1. 用熟悉的例子
  • 熟能生巧。在学习新概念或使用新工具时,尽量找一些自己熟悉的例子上手。当你能将学习内容与自己的课题联系起来时学习就会更容易。
  1. 养成好习惯
  • 从长远来看,养成良好的习惯可以节省时间。确保自己有详细的记录文档,这将使你和你的代码都更有效率,并有助于提高可重复性。
  1. 做好计划
  • 从一开始就想清楚要从数据分析中获得什么,并在实验设计和执行阶段牢记这些目标。一个精心设计和执行的实验可以最大限度提高准确得出你想要结论的可能性。
  1. 不重复造轮子
  • 无论开始一个项目还是在当前项目卡住了,在创建新项目前先看看已经有哪些方法可以使用。GitHub和SourceForge都是大型软件仓库,它们可以帮你节省时间并提供代码支持。
  1. 质量、质量、质量
  • 怎么强调质量都不过分,从原始数据质量到生物信息学分析流程中的质量控制,数据质量在研究每个阶段都很重要。使用公共数据集并将其整合到分析中时尤其如此。
  1. 投入什么就会产出什么
  • 如果你的数据质量不好,这对你的生物信息学分析意味着什么呢?当实验设计导致质量问题时,下游质量控制能做的很有限。
  1. 管理范围和期望
  • 范围蔓延、范围蠕变都是生物信息学项目面临的主要挑战。项目起始就要制定好分析计划,不要突然或大幅度改变项目范围和期望,不要浪费资源,确保项目范围是可控的,同时也要管理好分析的期望。
  • 注:范围蔓延scope creep和范围蠕变scope grope都是项目管理中的概念。范围蔓延是指未得到控制的变更,随着项目需求的不断增强而产生。泛围蔓延通常被认为对项目成功有害,因为它增加了成本并延长了进度,每一次增加的功能所带来的范围改变看似不大但是积少成多量变最终有可能引起质变。范围蠕变是指在产品或项目开发期间需求驱动发生变化,带来一些开始没有计划的产品特点,对产品质量或时间表产生影响,特征蠕变来自于客户增长的需求列表或者是开发者本身发现了提升产品的机会。
  • 再注:我目前的项目就是没有做好范围和期望管理,深受其苦。
  1. 寻找合适的工具
  • 理想的生物信息学分析可被重复也可以复用。要做到这一点关键在于你使用的工具。要考虑的因素有很多,比如工具是否被广泛使用,是否能得到开发者的支持,是否开源,是否有版本控制,是否容易安装等等。总之要制定出一个决定使用新工具的标准。
  1. 方法应该能够回答问题
  • 你的研究目标是什么?你生成的数据会产生什么潜在问题?要回答你研究的科学问题而不仅仅是将某种方法用于某种类型的数据,使用的方法应该可以帮助你找到数据中的潜在模型。
  1. 背景至关重要
  • 生物信息学是生物学、统计学和计算机科学的交叉。研究背后的背景非常重要,由生物学主导和数据驱动的结论有助于将你的研究置于更广泛的背景中。
  1. 追踪变动
  • 追踪变动有助于确保数据分析期间的质量控制,还可以使你的研究具有可重复性。工作流程会随着时间的推移而变化,追踪可以验证和确认这些变化。
  1. 数据再利用
  • 无论是从你之前生成的数据还是公共数据库中的数据,你总能从中获得新的信息。在药物开发中,来自试验的数据可以探索药物在未来如何被重新利用。
  1. 存储原始数据
  • 存储图表背后的原始数据有很多好处。它可以让你快速对图表进行修改,也可以退回到之前的图表以确保一致性。此外,存储用于制作图表的代码也是必须的。
  1. 好图胜过千言万语
  • 海报、报告和论文里的图都可以帮助你有效地将研究结果传达给别人,这是别人理解分析结果的关键。
  1. 有效使用颜色
  • 色彩丰富的科学图表可以突出特定特征或直观显示差异,但是过犹不及。要警惕太过相似的颜色和只是为了颜色而颜色。
  1. 不要误导
  • 保持你的图表清晰简单,使用能以最简单的形式表达数据的图表,让读者清楚地了解图表含义。
  1. 你的图是为了什么
  • 对论文有用的图和对演讲有用的图是不一样的。演讲报告需要简单的图去讲述一个简单的故事,但是论文可以用更复杂更详细的图让读者了解的更加深入。
  1. 吸引别人
  • 不要以封面来判断一本书,也不要以标题来判断一个报告。掌握好演讲或论文标题的长度和亮点是一种艺术,但要确保你的主题依旧明确。
  1. 好的格式
  • 好的幻灯片的格式布局可以帮助你传达研究成果并确保观众能够真正理解。拥有易读的文字和清晰的布局可以帮助读者有逻辑地浏览你的研究。
  1. 内容简明扼要
  • 有时很难将所有成果浓缩成一个清晰简洁的总结,尤其是在有限的海报或幻灯片里。清晰的措辞和排列整齐的图会让听众保持兴趣,从而让你的故事被更多人听到。
  1. 简洁胜过复杂
  • 从基本的和简单的方法开始,然后根据需要再增加分析的复杂性。通常对于大型生物信息学项目来说,分析本身就具有内在的复杂性并需要复杂的模型,但不要以为所有项目都如此。
  1. 做就对了
  • 最后的建议是现在就开始。第一步总是最难的,在编程时犯错也是学习曲线的一部分。 做就对了。

原文地址 https://www.fiosgenomics.com/bioinformatics-hints-tips/


本文作者:思考问题的熊

版权声明:本博客所有文章除特别声明外,均采用 知识共享署名-非商业性使用-禁止演绎 4.0 国际许可协议 (CC BY-NC-ND 4.0) 进行许可。

熊言熊语会员通讯「4321X」是一个免费的订阅服务。
每期会为你推荐 4 篇生物信息或者医学相关文献,分享 3 个我过去一周的思考,介绍 2 个我喜欢的工具,同时提出 1 个问题供我们交流,而 X 则代表不固定的 one more thing。可以点击这里进行订阅。


· 分享链接 https://kaopubear.top/blog/2020-01-12-bioinformatics-tips/