2

《生信与机器学习兴趣小组》第一次分享讨论贴

 2 years ago
source link: https://ming-lian.github.io/2019/06/19/Bioinfo-ML-Club-1st/
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

《生信与机器学习兴趣小组》第一次分享讨论贴

发表于

2019-06-19

|

更新于 2019-07-01

| 分类于 Club

主题:转录组分析里的那些为什么

1:RNA-seq与基因芯片相比有什么优势?



2:三种常规的建库策略





3:先打断再逆转录好,还是先逆转录再打断好?



4:Illumina测序仪给的碱基质量Phred Quality,它的P值是怎么算出来的?





5:为什么会经常出现序列两端质量偏低的现象?





6:测序仪给的碱基质量给出的碱基质量评估靠谱吗?







7:跑完FastQC,拿到若干项质控统计报告,我应该重点关注哪些?





8:那些转录组比对软件的原理是什么样的?



8.1:综述序列比对算法

8.1.1:Brute force approach



8.1.2:Dynamic Programing(DP, 动态规划)



8.1.3:Hash based alignment algorithmn



8.1.4:Burrow and Wheeler Transform(BWT)







8.2:回到转录组序列比对问题

8.2.1:Exon first approach



8.2.2:Seed-extend approach



Like • 7 Comments Issue Page
  • fangjunwodicom commented on Thu Jun 20 2019

    抢 1 楼 沙发
    不得不说,小明同学还是有两把刷子的。 233333
    印象最深的是 测序峰图是如何产生的 这一部分 傅里叶变换 能把复杂的峰图信号分成很多部分,进而分析各个碱基的测序质量。
    后面的算法部分,一知半解吧。回头还是需要复习一下计算机的一些算法。 -_-||汗

    感觉整个一次讨论下来,收获还是很多的。但感觉博主分享的解决办法(比如质控统计报告)还是有点点主观啊,建议博主可以分享一些大佬 对于解决某些问题 提出的建议和想法。
    (PS 一楼通常是托 23333333)

  • duzc-Repos commented on Sun Jun 23 2019

    谢博主分享,关于polyA+策略建库的问题。
    这种建库方法会用到oligo-dT来富集带有polyA tail的RNA,但是如果RNA本身中间的序列中存在A-rich的区域,那么理论上相同的表达量的情况下这种RNA会比其他RNA富集得片段更多,或者说有更大概率被富集到,那么这种现象对RNA定量的影响大吗?
    (PS:这个现象是在一系列基于oligo-dT的3' end sequencing中看到的,英文上叫internal poly(A) priming或者internal primed events, 感觉原理上跟RNA-seq的polyA建库策略很相似,所以看看大家有没有对这个现象做特殊处理的?还是其实影响不大?)

  • reddeery commented on Sat Jul 13 2019

    会有影响,一般针对这种存在internal poly-A priming较多的物种,会考虑其他的建库方式

    谢博主分享,关于polyA+策略建库的问题。
    这种建库方法会用到oligo-dT来富集带有polyA tail的RNA,但是如果RNA本身中间的序列中存在A-rich的区域,那么理论上相同的表达量的情况下这种RNA会比其他RNA富集得片段更多,或者说有更大概率被富集到,那么这种现象对RNA定量的影响大吗?
    (PS:这个现象是在一系列基于oligo-dT的3' end sequencing中看到的,英文上叫internal poly(A) priming或者internal primed events, 感觉原理上跟RNA-seq的polyA建库策略很相似,所以看看大家有没有对这个现象做特殊处理的?还是其实影响不大?)

    会有影响,一般针对这种存在internal poly-A priming较多的物种,会考虑其他的建库方式,如通过移除rRNA的方法……当然这种方法一般更适用于一些样本量较少,mRNA质量较差的样本

  • duzc-Repos commented on Sat Jul 13 2019

    会有影响,一般针对这种存在internal poly-A priming较多的物种,会考虑其他的建库方式

    谢博主分享,关于polyA+策略建库的问题。
    这种建库方法会用到oligo-dT来富集带有polyA tail的RNA,但是如果RNA本身中间的序列中存在A-rich的区域,那么理论上相同的表达量的情况下这种RNA会比其他RNA富集得片段更多,或者说有更大概率被富集到,那么这种现象对RNA定量的影响大吗?
    (PS:这个现象是在一系列基于oligo-dT的3' end sequencing中看到的,英文上叫internal poly(A) priming或者internal primed events, 感觉原理上跟RNA-seq的polyA建库策略很相似,所以看看大家有没有对这个现象做特殊处理的?还是其实影响不大?)

    会有影响,一般针对这种存在internal poly-A priming较多的物种,会考虑其他的建库方式,如通过移除rRNA的方法……当然这种方法一般更适用于一些样本量较少,mRNA质量较差的样本

    在分析上现在有一些计算方法可以进行矫正吗?或者是一些具体的评估的文章,就是internal poly(A) priming的现象对RNA-seq表达定量的影响?

  • lijuan94 commented on Fri Jul 19 2019

    :1:RNA-seq与基因芯片相比有什么优势?除了小明说的以为个人觉得前者检测低丰度的检出率 要高,即动态范围会更广。当然还有大家熟知的就是能检测选择性剪切位点且为的和新的异构体。
    2:三种常规的建库策略方面:讲的还是很清楚的。
    3:先打断再逆转录好,还是先逆转录再打断好?这一点就是以前自己没有接触到的,涨知识了,就是反转后以CDNA由于酶的活性问题是获得的3端信息比较多,因此5端的信息很少。
    4:后续讲的BWT很厉害啊,以前上课都没弄懂,这个分享总结的还挺清楚

  • cjchen5 commented on Sun Jul 21 2019

    谢谢博主分享,时差一直参加不了直播没法互动很难过,但是这些已经是帮忙补充了不少生物学背景了,复习了原理,对我自己做的project很有帮助,感谢明哥!


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK