agc测试方法,闲扯以及使用ATAC-seq数据鉴定motif
agc测试方法,闲扯以及使用ATAC-seq数据鉴定motif自主性就是一个行为、一个决策、一个选择,是由你内心所作出的,而不是由外在的力量逼迫你、引导你作出的。如果一个人缺少自主性,就会慢慢丧失对一切事物的希望,变成行尸走肉。当你无论做什么都不能改变结果的时候,慢慢地你就会丧失一切行动的动力。下面两点可能是现实中很多人面临的问题。快乐,涉及到两个方面,愉悦感和动机。愉悦感,就是我们常说的高兴,开心。动机是指,你有多强烈的愿望想要去做一件事情。有时候,单纯就是因为喜欢才去做。有时候,是因为要避免痛苦、无聊、烦躁才去做,只有做了才能开心。比如,刷短视频。真正的快乐,永远都要从内在寻找,而非依赖于外在力量。只有当你通过付出努力、思考以及行动之后获得的快乐才是健康和持久的。成就感,也就是胜任感,即我能做。如果说快乐是我想做,那么成就感就是我能做。只有当我们意识到“我是能够胜任的”“我能够把它做好”时,才会产生源源不断的想要做下去的动力。
闲扯以及使用ATAC-seq数据鉴定motif周末了,按照久远的惯例,咱们先说点其他的。前段时间,前浪后浪的话题讨论很热烈,朋友圈也见有人转发。我很纠结我是前浪还是后浪,直到我看到这样一句话“不知道自己是前浪还是后浪的其实就是前浪”,那一瞬间我就知道我是前浪了。当我们还是后浪的时候,总会接触一些有点“高级”的话题,比如”活着意义”,“开心快乐”,“你的梦想”之类的话题。当然,作为前浪的我,这些话题一般不会出现在我脑海里。
今天周末,看到一篇讨论“什么样才是好的生活”的文章。看完有点醍醐灌顶的感觉,索性就写点感想。虽然我知道N天以后这篇文章将对我的生活没有任何一点改变,但其实就是想聊一聊这个话题,谁不想过上好的生活呢?当然,有的人可能会说,这有啥聊的呢,有钱就是好生活呢。有钱就是好生活?
那么这篇文章里是怎么定义好生活的呢?如下图所示,包含5个要素,意义,成就感,行动(自主性),快乐以及和谐的环境。这些要素是平等的,没有优先级。
首先,意义是人跟这个真实世界的联结。这个宇宙中,除了你之外,还有哪些人、哪些事,值得你为之付出努力和奋斗。这主要提供目标和方向。咱们这里都是从事科研的学生或老师,国家有没有给科学家设定目标呢?简直不要太多,国奖是不是?各种帽子是不是?职称是不是?这些是国家给科学家的目标。当然我们完全可以自己定义目标和方向,比如想育成一个大品种,想要解析某个生物学现象等一些科学目标。记住,意义是个人定义的。
快乐,涉及到两个方面,愉悦感和动机。愉悦感,就是我们常说的高兴,开心。动机是指,你有多强烈的愿望想要去做一件事情。有时候,单纯就是因为喜欢才去做。有时候,是因为要避免痛苦、无聊、烦躁才去做,只有做了才能开心。比如,刷短视频。
真正的快乐,永远都要从内在寻找,而非依赖于外在力量。只有当你通过付出努力、思考以及行动之后获得的快乐才是健康和持久的。
成就感,也就是胜任感,即我能做。如果说快乐是我想做,那么成就感就是我能做。只有当我们意识到“我是能够胜任的”“我能够把它做好”时,才会产生源源不断的想要做下去的动力。
下面两点可能是现实中很多人面临的问题。
自主性就是一个行为、一个决策、一个选择,是由你内心所作出的,而不是由外在的力量逼迫你、引导你作出的。如果一个人缺少自主性,就会慢慢丧失对一切事物的希望,变成行尸走肉。当你无论做什么都不能改变结果的时候,慢慢地你就会丧失一切行动的动力。
什么是好工作?不同的人或许有不同的理解,但一般都会有一个共性:它应该是自由的,而不是束缚你的自由。管理团队一个非常好的理念是,定下一个目标,给一定的预算、时间和约束条件,只要不违反,就可以采取一切方法完成它。这种模式叫做“无禁止皆可为”,与之相对的是,“无授权不可为”,即事事汇报,事事都要取得授权。显然,前一种模式才能更充分地给予一个人自由,让他得以实现他的创造力。所以话说到这里,什么是好的科研?
无论我们是谁,都要尽量寻求发挥你的自主性。这才是我们能否从生活中、工作中,感受到自由和乐趣,最重要的开关。即使现在已经小有所成,不差钱的人,如果在家庭中、工作中完全没有自主权,这就不是想要的生活。
最后就是和谐以及平和。和谐是指环境和谐,指与外部世界相处的方式。平和,指的是内心对外部世界的反应和投射。我们面临的现实往往是,环境不是那么和谐,我们内心也不是那么平和。这其实涉及到协作和合作。
你看,好生活哪有这么简单?
染色质是由DNA缠绕包裹组蛋白八聚体,继而一步步折叠压缩而成的。基因启动子区染色质的开放使得转录因子得以结合到特异的调控元件(motif)上,进而招募转录复合体开启基因的表达。
ATAC-seq (Assay for Transposase-Accessible Chromatin using sequencing)是2013年开发的用以捕捉全基因组染色质开放谱的技术,其优点是所需样品少(500个细胞核可以产生不错的信号),操作简便(分离细胞核,加Tn5酶孵育半小时,回收片段)。
明确开放区域后,可以直接寻找motif,推测结合转录因子。
即利用ATAC-seq定义染色质开放区域,然后在开放区域找motif。详细的流程如下。
1 数据
SRR9647008.1
2 sra 转成fastq
pfastq-dump --threads 8 --outdir ./ -s ./SRR9647008.1 --split-3 --gzip
3 去除低质量的reads
fastp -p -w 15 -l 30 -i SRR9647008.1_1.fastq.gz -I SRR9647008.1_2.fastq.gz -o SRR9647008_1.filter.fq.gz -O SRR9647008_2.filter.fq.gz -h SRR9647008.html
4 使用hisat2 进行mapping
hisat2 -p 16 -x /data/Index/IWGSCv1.0_hisat2/IWGSCv1.0_hiast2 --no-spliced-alignment --no-mixed --no-discordant --rg-id SRR9647008 --rg "SM:Wheat_ATAC_S1_001" --rg "PL:ILLUMINA_NextSeq_500" -1 SRR9647008_1.filter.fq.gz -2 SRR9647008_2.filter.fq.gz -S SRR9647008-1.sam
5 过滤低质量序列
sambamba view -t 16 -p -S -F "mapping_quality >=10" --format bam -o SRR9647008.bam SRR9647008.sam
samtools sort -@ 10 -o SRR9647008.sorted.bam SRR9647008.bam
samtools index SRR9647008.sorted.bam
6 删除PCR重复
sambamba markdup -r -t 10 SRR9647008.sorted.bam SRR9647008.rmdup.sorted.bam
samtools index SRR9647008.rmdup.sorted.bam
7 生成bigwig文件
bamCoverage --binSize 100 --smoothLength 2100 --centerReads -of bigwig -o SRR9647008.bigwig --bam SRR9647008.rmdup.sorted.bam
8 call peak
macs2 callpeak -t SSRR9647008.rmdup.sorted.bam --qvalue 0.01 --format BAMPE --keep-dup all --gsize 1.46e10 --nomodel --shift -100 --extsize 200
9 motif分析
这里使用HINT软件。HINT(Hmm-based identification of transcription factor footprints)是基于隐马尔科夫模型开发的用于预测转录因子结合足迹的分析技术**。其优点是操作简便,准确性高。操作过程如下。
rgt-hint footprinting --atac-seq --paired-end --output-prefix=fp_paired --organism=wheat1.0 SRR9647008-1.sorted.bam NA_peaks.narrowPeak
10 获取已知motif
rgt-motifanalysis matching --organism wheat1.0 --filter "database:jaspar_plants" --input-files fp_paired.bed
结果文件已经放到小麦多组学网站Jbrowse中。
扫描二维码
关注我们
小麦族多组学网站:http://wheatomics.info
投稿、合作等邮箱:13148474750@163.com
微信群: 加群点击小麦研究联盟交流群
杂志影响因子查询:点击查询