生物技术

构建系统进化树的步骤

1. 建树前的准备工作

  • 1.1 相似序列的获得——BLAST

BLAST是目前常用的数据库搜索程序.

  • 1.2 序列格式:FASTA格式

将所有的序列做成FASTA格式,其为Clustal X默认的序列输入格式。简而言之,将要用于构建系统进化树的所有序列合并到同一个fasta格式文件,注意:所有序列的方向都要保持一致 ( 5’-3’)。

 

2.用Clustal X构建N-J系统树的过程

  • (1) 打开Clustal X程序,载入源文件.

File-Load sequences- C:\temp\jc.txt.

  • (2) 序列比对

Alignment – Output format options – √ Clustal format; CLUSTALW sequence numbers: ON
Alignment – Do complete alignment
(Output Guide Tree file, C:\temp\jc.dnd;Output Alignment file, C:\temp\jc.aln;)
Align → waiting……
等待时间与序列长度、数量以及计算机配置有关。

  • (3) 掐头去尾

File-Save Sequence as…
Format: ⊙ CLUSTAL
GDE output case: Lower
CLUSTALW sequence numbers: ON
Save from residue: 39 to 1504 (以前后最短序列为准)
Save sequence as: C:\temp\jc-a.aln
OK
将开始和末尾处长短不同的序列剪切整齐。这里,因为测序引物不尽相同,所以比对后序列参差不齐。一般来说,要“掐头去尾”,以避免因序列前后参差不齐而增加序列间的差异。剪切后的文件存为ALN格式。

  • (4) File-Load sequences-Replace existing sequences?-Yes- C:\temp\jc-a.aln

重新载入剪切后的序列。

  • (5) Trees-Output Format Options

Output Files : √ CLUSTAL format tree √ Phylip format tree √ Phylip distance matrix
Bootstrap labels on: NODE
CLOSE
Trees-Exclude positions with gaps
Trees-Bootstrap N-J Tree :
Random number generator seed(1-1000) : 111
Number of bootstrap trails(1-1000): 1000
SAVE CLUSTAL TREE AS: C:\temp\jc-a.njb
SAVE PHYLIP TREE AS: C:\temp\jc-a.njbphb
OK → waiting……
等待时间与序列长度、数量以及计算机配置有关。在此过程中,生成进化树文件*.njbphb,可以用TreeView打开查看。

  • (6) Trees-Draw N-J Trees

SAVE CLUSTAL TREE AS: C:\temp\jc-a.nj
SAVE PHYLIP TREE AS: C:\temp\jc-a.njph
SAVE DISTANCE MATRIX AS: C:\temp\jc-a.njphdst
OK
此过程中生成的报告文件*.nj比较有用,里面列出了比对序列两两之间的相似度,以及转换和颠换分别各占多少。

  • (7) TreeView

File-Open-C:\temp\jc-a.njbphb
Tree- phylogram(unrooted, slanted cladogram,Rectangular cladogram多种树型)
Tree- Show internal edge labels (Bootstrap value)(显示数值)
Tree- Define outgroup… → ingroup >> outgroup → OK(定义外群)
Tree- Root with outgroup
通常需要对进化树进行编辑,这时首先要Edit-Copy至PowerPoint上,然后Copy至Word上,再进行图片编辑。如果直接Copy至Word则显示乱码,而进化树不能正确显示。

 

3.用MEGA构建进化树

3.1打开MEGA软件,选择”Alignment” – “Alignment Explorer/CLUSTAL”,在对话框中选择Retrieve sequences from a file, 然后点OK,找到准备好的序列文件并打开。

3.2 在打开的窗口中选择”Alignment”-“Align by ClustalX” 进行对齐,对齐过程需要一段时间,对齐完成后,最好将序列两端切齐,选择两端不齐的部分,单击右键,选择delete即可。

3.3关闭当前窗口,关闭的时候会提示两次否保存,第一次无所谓,保存不保存都可以,第二次一定要保存,保存的文件格式是.meg。根据提 示输入Title,然后会出现一个对话框询问是否是Protein-coding nucleotide sequence data, 根据情况选择Yes或No。最后出现一个对话框询问是否打开,选择Yes。

3.4 回到MEGA主窗口,在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” -“Neighbor-joining”,打开一个窗口,里面有很多参数可以设置,如何设置这些参数请参考详细的MEGA说明书,不会设置就暂且使用默认 值,不要修改,点击下面的Compute按钮,系统进化树就画出来了。

3.5最后,使用TreeExplorer窗口中提供的一些功能可以对生成的系统进化树进行调整和美化。另外,还可以用Word进一步编辑MEGA构建的进化树。

一般说来,MEGA适用于对少量的序列进行比对和画Tree,如需处理大量或海量的序列数据,建议使用ARB。

4. 其他构建方法不再一一列举

 

参考资料:

http://www.yelinsky.com/blog/archives/282.html

http://bbs.bbioo.com/thread-42602-1-1.html

http://blog.sina.com.cn/s/blog_5462dedd01000af3.html

发表评论