" />
  • 紅軟基地:您身邊最放心的安全下載站!
您所在的位置:首頁 > 軟件 > 應用軟件 > 教育學習 > glimmer基因預測軟件

glimmer基因預測軟件

軟件類型:
國產軟件
軟件語言:
簡體中文
軟件大小:
6 MB
軟件授權:
免費軟件
軟件評級:
4
更新時間:
2017-05-12
應用平臺:
WinXP, Win7, WinAll
軟件簡介

glimmer基因預測軟件是時下互聯網常用的教育教學軟件之一,該軟件綠色、安全、無毒,讓你可以放心使用。

使用說明

下面我們拿結核分枝桿菌H37RV的基因組來做下練習,Glimmer做基因預測一般需要2個步奏。
首先是建立預測的模型,第二步是利用模型來對基因組進行基因預測。模型也叫訓練集,也就是先讓軟件了解基因的一些特征,這樣軟件就能根據已知的信息,來推測未知的信息。
建立模型采用build-icm程序來完成。build-icm的輸入有三種。
1、某基因組的已知信息;
2、通過long-orfs產生的長的無重疊的orfs;
3、高度相似的物種的基因。
這里面我們選用自身作為訓練集來作為模型。
那么就使用long-orfs產生訓練集,那么作為long-orf的訓練集,我們首先要將輸入文件格式化到一條。
聽到這里大家可能有些亂了。下面我們具體來演示一遍大家就明白了。
首先我們將多條fasta文件合并成一條,用于long-orfs程序。
這里面采用sed 命令。
sed -e '/>/d' K12.fna |tr -d '\n' |awk 'BEGIN {print ">wholefile"}{print $0}' >wholefile
這樣就可以用作long-orfs的輸入了。
運行long-orfs產生無重疊的orfs
long-orfs -n -t 1.15 $wholefile $tagname.longorfs  1>/dev/null 2>/dev/null
然后運行extract來提取訓練集
extract -t $wholefile $tagname.longorfs > $tagname.train  2>/dev/null
這樣訓練集就處理好了。
產生訓練集有收那種方法,這里面我們用的是第二種方法,通過long-orfs產生。
如果有某基因組的已知基因,或者高度相似的物種基因不用以上三個步驟
接下來我們運行bulid-icm通過訓練集,來生產預測的模型,用于基因預測
build-icm  -r $tagname.icm < $tagname.train 1>/dev/null 2>/dev/null
最后我們就可以直接運行glimmer3來完成基因預測。
glimmer3 -o50 -g110 -t30  [options]。

軟件說明

生成*.detail  *.predict
那么*.predict就是我們最終得到的預測基因文件,它其實只是一個列表,我們打開看一下。也是以“>"進行分割,
基因的各列信息分別為:
Column 1 預測基因編號,此編號和*.detail文件里編號一致。
Column 2 基因的開始位置。
Column 3 基因的結束位置。為終止密碼子的最后一個堿基位置,也就是說包含終止密碼子。
Column 4 閱讀框。
Column 5 基因的“raw”分值。

相關介紹

基因(遺傳因子、遺傳基因)指攜帶有遺傳信息的DNA序列,是控制性狀的基本遺傳單位,亦即一段具有功能性的DNA序列。基因通過指導蛋白質的合成來表達自己所攜帶的遺傳信息,從而控制生物個體的性狀表現。人類約有兩萬至兩萬五千個基因。染色體在體細胞中是成對存在的,每條染色體上都帶有一定數量的基因。一個基因在細胞有絲分裂時有兩個對列的位點,稱為等位基因,分別來自父與母輩。按照其控制的性狀,又可分為顯性基因和隱性基因。一般來說,生物體中的每個細胞都含有相同的基因,但并不是每個細胞中的每個基因所攜帶的遺傳信息都會被表達出來。不同部位和功能的細胞,能將遺傳信息表達出來的基因也不同。

軟件截圖

glimmer基因預測軟件

軟件下載地址
glimmer基因預測軟件
軟件推薦
下載排行

精品軟件

熱門關鍵詞

熱門軟件推薦