2010年11月17日 星期三

用phylip畫演化樹 MP、ML

本周作業是用phylip畫演化樹。
本次用的方法是character-based method: MP、ML


整體流程如下 :
先用SEQboot將10條接近的蛋白質序列亂數變動100次,模擬自然界亂數演變。
之後用propars (MP)或 proml (ML)將100次結果排序親源順序樹狀圖,
再用consense 將100個樹狀結果統合成1個結果。
philip如下圖所示













MP method
1. 先用bioedit匯入10條序列,並做alignment
 開啟檔案
 做alignment
 alignment結果
 存成phylip檔案格式
 2. 開啟phylip .exe資料夾,要先將電腦內穎藏副檔名的選項勾掉。

3. 將步驟1存的檔案改名成infile
4. 點選SEQBOOT.exe
它有一堆清單,按y
之後 random number seed,按1
他開始跑出新的亂數序列
5. 跑出結果outfile
之後將infile改成infile1
將outfile改成infile
(因為phylip只認infile和outfile)
6. 點選propar.exe,將100組亂數序列排出100棵樹
先按m (analyze multiple data sets)→
再按d (multiple data sets)→
再按100 (100組序列)→
再按1
再按1
然後按y,就開始跑了


按y開始跑
7.Porpars.exe會跑出outfile和outtree
outfile為樹狀圖
outtree為描述的文件檔

outfile結果
outtree結果
8. 將infile改成infile2,outfile改成outfile1,outtree改成intree

9.點選consense.exe,將propars算出的100棵樹整合成1棵樹
它會跳出詢問,按y
開始運算

10.跑出outfile和outtree
outfile

11. outtree可以用treeview來看

12.treeview打開後的畫面















ML method
1.前面5個步驟跟MP相同,
步驟6選proml.exe跑不同的tree
設定:
m→d→100→1→1→y


 2. 跑出outfile和outtree
outfile結果
 outtree結果
 3.將infile改成infile2,outfile改成outfile1,outtree改成intree
跑consense.exe,整合成1棵樹
設定同樣按y
跑出outtree
4.以treeview開啟 outtree
 5. 點選phylogram, and show internal edge label

2010年11月3日 星期三

用CLC workbench combine sequence及bioedit 做sequence alignment


本周作業是要用CLC workbench combine 不同的sequence。
步驟如下:
1. 先打開CLC workbench程式


2. 按Import鍵匯入片段的sequence (sequence 1-5)

3. 選擇general sequence analyses> Join sequences


4.跳出面板,選擇要combine的sequences (sequence 1-5)

5.排序要分析的sequence,此步驟會影響最後combine的結果。
因為一開始的sequence是照順序排,就不用改了。


6. 之後選open,直接先看看結果

7. 結果出來了,還標示restriction enzyme cutting site
8. 按export,把結果存下來,combine的工作就結束了。

之後上NCBI,看combine的結果是否能blast到已知序列。
1. NCBI> Blast
2.進入之後選blastn
3.upload 剛剛存的sequence,記得勾選將結果顯示於新視窗的選項
4. blast結果出來了。 最接近的是human insulin (INS) mRNA
5.之後上biorag查這段基因相關訊息。
填入帳密後選search>genes
6.設定相關選單
7. 跑出結果,參與carbohydrate metabolism



另外同學有用不同blast database,也找到INS,blast 分數較高,但accession number不同。
但此accession number在biorag找不到資料。



之後進入第二部分
用bioedit 比對blast到的sequnce和五段sequence位置關係
1. 打開bioedit程式
2.上NCBI將剛剛blast的結果存下來
3.要選Fasta file
4. 之後用bioedit把檔案打開
5.再匯入五段sequence
6.匯入了
7.點選全部sequence,選accessory application> clustalW multiple alignment。
8.就依預設值跑
9.跑出的結果,怪怪的,五段sequence都聚在一起
10.點上方按鈕還可以標出相近的序列
不過這個部分有些問題,
依此做法,程式會將六段序列當成一樣的序列來比較,而不是一對一(sequence1-5對blast的結果)比較,所以沒辦法顯示原片段的sequence在blast的分布位置。




接著是作業二
用bioedit 排列11物種的同一基因,看其是否存在homologue

1. 將11物種protein sequence匯入
2.點選accessory application> clustalW multiple alignment,會跳出這個新視窗
之後按上方按鈕,會出現色塊標示homologue。