Linux Command Line 学习笔记4

说明;写 Linux Command Line 学习笔记系列文章本意只是记录自己学习 《Linux Command Line 》 这本书的过程中看到的一些自己没有留意到的地方,因此绝大多数内容只是记录了相关知识点而没有实际扩展内容,纯粹是为了自己后期回顾时有迹可循。另外,因为直接看的原版书,所以有些地方中英混杂。更详细地学习建议去阅读原书即可。

The Environment

  • shell 会话中维护着大量的信息称为环境

  • 查看环境变量
    printenv 或者 printenv USER
    set |less 按照字母顺序显示
    echo $HOME

  • 别名不能用上述方法查看
    alias

Linux Command Line 学习笔记3

说明;写Linux Command Line 学习笔记系列文章本意只是记录自己学习 《Linux Command Line 》 这本书的过程中看到的一些自己没有留意到的地方,因此绝大多数内容只是记录了相关知识点而没有实际扩展内容,纯粹是为了自己后期回顾时有迹可循。另外,因为直接看的是原版书,所以很多地方中英混杂。更详细地学习建议去阅读原书即可。

Advanced Keyboard Tricks

  • 建议调换大写键和ctrl的映射关系

  • 光标瞬间移动

    Ctrl-a 移动光标到行首
    Ctrl-e 移动光标到行尾
    Ctrl-f 光标前移一个字符;和右箭头作用一样
    Ctrl-b 光标后移一个字符;和左箭头作用一样
    Alt-f 光标前移一个字
    Alt-b 光标后移一个字
    Ctrl-l 清空屏幕

Linux Command Line 学习笔记 2

说明;写Linux Command Line 学习笔记系列文章本意只是记录自己学习 《Linux Command Line 》 这本书的过程中看到的一些自己没有留意到的地方,因此绝大多数内容只是记录了相关知识点而没有实际扩展内容,纯粹是为了自己后期回顾时有迹可循。另外,因为直接看的是原版书,所以很多地方中英混杂。更详细地学习建议去阅读原书即可。

Working With Commands

  • 查看命令类型 type

    命令有四种可能的形式:

    1. 可执行程序,可以编译成二进制文件,诸如用 C 和 C++ 语言写成的程序,也可以是由脚本语言写成的程序,比如说 shell,perl,python 等等
    2. 内建于 shell 自身的命令,如 ls
    3. shell 函数
    4. 命令别名

Linux Command Line 学习笔记 1

说明;写 Linux Command Line 学习笔记系列文章本意只是记录自己学习 《Linux Command Line 》 这本书的过程中看到的一些自己没有留意到的地方,因此绝大多数内容只是记录了相关知识点而没有实际扩展内容,纯粹是为了自己后期回顾时有迹可循。另外,因为直接看的是原版书,所以很多地方中英混杂。更详细地学习建议去阅读原书即可。

关于为什么应该学习 linux 或者说 ubuntn,因为 ubuntn 的中文名字叫做“有盼头”,学了它,你才真正有可能成为计算机的主人,才可能自由地使用你的电脑。

所谓自由,解释如下:

Freedom is the power to decide what your computer does, and the only way to have this freedom is to know what your computer is doing. Freedom is a computer that is without secrets, one where everything can be known if you care enough to find out.

关于为什么要学习命令行操作而非使用图形界面,解释如下:

graphical user interfaces make easy tasks easy, while command line interfaces make difficult tasks possible
图形用户界面让简单的任务更容易完成,而命令行界面使完成复杂的任务成为可能。

Docker 学习笔记 I

越来越无法忍受目前用的几台服务器各种软件配置都不一致,无法做到随时无障碍切换,于是决定学点 Docker。

什么是 docker

Docker 在容器的基础上,进行了进一步的封装,从文件系统、网络互联到进程隔离等等,极大的简化了容器的创建和维护

  • 传统虚拟化

img

虚拟出一套硬件后,在其上运行一个完整操作系统,在该系统上再运行所需应用进程

  • docker

img

容器内的应用进程直接运行于宿主的内核,容器内没有自己的内核,而且也没有进行硬件虚拟

转录调控与生物信息

cis-regulatory motifs

转录调控

img

  • Transcription start site (TSS)
  • Transcription factor binding sites (TFBS)
  • Cis-regulatory module (CRM) 有多个 TF 在一起
  • Proximal promoter and distal enhancer 近端的启动子远端的增强子

在人中,有 300 个 TF 结合在核心启动子区域;有 1500 个结合在基因其他区域,可以调节一系列基因

图示

img

  • 其中的 insulator 可以阻隔 enhancer 起作用

表观遗传与生物信息

不同层次的表观

img

  • Broadly, features at different levels of chromatin organization are generally associated with inactive (off) or active (on) transcription.
  • From the top, genomic DNA is methylated(Me) on cytosine bases in specific contexts and is packaged into nucleosomes, which vary in histone composition and histone modifications (for example, histone H3 lysine 9 trimethylation (H3K9me3)); these features constitute the primary layer of chromatinstructure.
  • Here, different histone modifications are indicated by coloured dots and histone variants such as H2A.Z are brown.
  • DNA in chromatin may remain accessible to DNA-binding proteins such as transcription factors (TFs) and RNA polymerase II (RNAPII)or may be further compacted.
  • Chromatin can also organize into higher-order structuressuch as nuclear lamina-associated domains and transcription factories.
  • DOI:10.1038/nrg2905

表观实例

基因印迹

img

表观遗传定义

  • A mitotically or meiotically heritable state of different gene activity and expression (phenotype) that is independent of differences in DNA sequence (genotype) – based on Conrad Waddington, 1942
  • The sum of the alterations to the chromatin template that collectively establish and propagate different patterns of gene expression (transcription) and silencing from the same genome.
  • Epigenetic changes influence the phenotype without altering the genotype.
  • While epigenetics often refers to the study of single genes or sets of genes, epigenomics refers to more global analyses of epigenetic changes across the entire genome.

马尔科夫模型

马尔科夫是谁

马尔科夫是一位俄国的数学家,他最为人所知的是他在随机过程方面的研究。他早期研究的重点是数论而在 1900 年之后他所研究的重点转向了概率论。他研究的成果颇丰以至于在他 1905 年正式退休之后他仍然在教授课程直至去世。

在他的研究中,马尔科夫成功地拓展了大数定理以及中心极限定理,并将其应用于由独立随机变量组成的特定序列中,如今这也被称为马尔可夫链。

马尔可夫链被广泛的运用于物理学,经济学,统计学,生物学等方面。两个最著名的应用是布朗运动以及随机漫步。

机器学习在生物信息学中的应用

recap

Machine learning methods

general-purpose approaches to learn functional relationships from data without the need to define them a priori

Advantage

derive predictive models without the need for strong assumptions about underlying mechanisms, which are frequently unknown or insufficiently defined (especially for genomic data)

序列比对其他相关问题

全局比对 Global Alignment

由芝加哥的 Needleman 和 Wunsch 两位于上个世纪 70 年代初提出,常被称之为 Needleman-Wunsch 算法。算法针对用户指定的打分函数,确定性地找出两条序列间的最优比对。

Needle-Wunsch 算法对两条序列所有残基进行全局比对的局限性。

  • 功能相关的蛋白之间虽然可能在整体序列上相差甚远, 却常常会具有相同的功能域
  • 序列片段能够独立发挥特定的生物学功能,却在不同蛋白之间相当保守
  • 仅靠全局比对的算法无法发现这样的片段
    • 内含子的发现使得在做核酸水平的序列比对时必须要正确处理内含子导致的大片段的差异
Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×