StupidBeauty
Read times:1292Posted at:Thu Jan 27 12:43:04 2011
- no title specified

SWAN参数、选项和输出

SWAN软件是使用C 语言编写的,也使用咯一些C++特性。这个程序的输入是一个序列文件及以下的参数

  1. i. 依赖级别;

  2. ii. 最小和最大周期;

  3. iii.统计学意义计算的模式(也就是说 "基本模式 motif "模式 或者 "掩码 (mask) "模式 ;

  4. iv. 纯文本 fasta EMBL或者GenBank数据格式.

这个程序产生单个结果文件。它是一个包含以下信息的表格

  1. i.序列的名字

  2. ii.重复序列的开始位置、结束位置和长度;

  3. iii.周期大小

  4. iv.重复单元的个数

  5. v.IUPAC 格式的重复序列(consensus)

  6. vi.基本模式(motif)中满足重复序列 (consensus) 的词 (words) 的个数;

  7. vii."基本模式"的概率

  8. viii."掩码"的概率

  9. ix."基本模式"的P (P-value);

  10. x."掩码"的P;

  11. xi."基本模式"的统计学意义;

  12. xii."掩码"的统计学意义;

  13. xiii.串联重复序列本身.

参数

依赖级别

由用户定义的SWAN 的参数之一是一个依赖级别 D 。依赖是由 任意的3个相 的单位之间发生的替换个数来衡量的。在相邻的词中 ,只有那些所发生的替换个数小于 (P-D) 的词会被包含到模式中。

最小和最大的周期大小

最小和最大周期大小是由用户定义的参数,它们的取 值范围是从3 到序列长度的一半。默认 值是:最小 周期为3,最大周期为100.

统计学意义的计算模式:"基本模式"或者"掩码"

你可以使用两种模式中的任一种来评估统计学意义.第一种是”基本模式”模式.基本模式是指一组用于构成重复序列模式的符合IUPAC 格式的重复序列的词.”基本模式”统计学意义是基于对以下概率的计算的:在基本模式出现咯最少一次的情况下,在一个长为N 的独立随机序列中找到一个连续出现不小于n (这里的 n 就是重复单元的个数)的基本模式的概率.这个条件概率准确地反映咯我们的查找算法:“对于序列中的每个词,检查它是否重复咯n 次”.

使用第二种模式的话,统计学意义是基于以下概率计算的:找到一个类似于那个重复模式的结构的概率.在这里,结构的意思就是指一组符合某种”掩码”的词.例如,对于重复序列 R=ATC|ACG|AGC ,我们可 以看到,同一个字母在 1 4 7 三个位置出现咯三次,接下来是三个不同的字母位于 2 5 8 三个位置 ,还有两个相同的字母出现在 3 6 9 三个位置 。如果一个长为 9 的词是勒样的 ,那么我们说它满足重复序列 R 的“掩码”:同一个字母在 1 4 7 三个位置出现三次 ,任意的三个字母位于 2 5 8 三个位置 ,并且最少有二个相同的字母位于 3 6 9 三个位置 。所 以,对于每个位置 i, 1≤i≤T,以及这个重复序列的指数n 都有确定的值 k1 ,..., kT, 其中每个 ki 指的是在位置 i, i+T,…,i+(n-1)T 处的相同字母的最大个数。在上面的例子中 T =3, n=3, k1=3, k2=1, k3=2.其它满足勒个“掩码”的重复序列还有 TTC|TCC|TGG ATC|ATC|ATC CAA|CTA|CTC 等等。
统计学意义是基于我们称之为‘基本模式’和‘掩码’ p值 的概率来判断的。我 们使用咯p 的负对数 (Minus logarithm) 作为统计学意义的值。

数据格式

用户可选择使用以下的数据格式之一

纯文本:

ctatgttgcgaagtattccgacattacattgcatttgcaacatttactgcaatgtatctgaaacagtgttgctgtaaggaccgctgcaagcagtgcatcctgctctgcgctaccatagttatagaggggtgggtttgtgtccagggcagacaaatacatgtggtttcgcaaaatctggtttgtagaatgtaaacaattatttgctccaatctgatgaattatgttctcaccgatccaactggaaatatatatccttgcattgcttccagactcctgatcacagatgccgctattcgttagtgaagtacgtagcattttcctggcaaaaccattaaagtacgatataaatttgaaacaaatgccaacttcaaacatatttaaatgtttcaagggggcggacatccccagctgagctgtcaaatcgaacaccgacctt

Fasta:

>Pfa3D7|chr3|2002.10.03|GENOMIC|Sanger TAAACCCTGAACCCTAAACCCTAAACCCTGAACCCTGAACCCTAAACCCTGAACCCTAACCCTGAACCCAACCCAAACCCTAAACCTAAACCCTAAACCCTAAACCCTGAACCCTAAACCCTGAACCCTAAACCCTAAACCCTAAAACCCTAAACCCTAAACCCTAAACCCTGAACCCTAAACCCTAAACCCTAAACCCTAAACCCTGAACCCTAAACCCTAAACCCTAAACCTAAACCCTGAACCCTAAACCCTAAACCCTGAACCCTGAACCCTTACTTTCTTACTCTTATGTTCTTAATTTTCATTTCTTAGTCTTACTTTCTTCTTCTTAGGTCCTTACTTTTCATTTCTTAATCATATATTCTTACTCATATAGTTCTTGACTTAACTTTTTATTCTTACTTACTTACTCTTATATTCTTTTTATCATGTTCAAGGTCTTACTTCTTAAATACTACGTCTTTAATCTCATAATTCTAGTCTTAATTTCTTACTTCTAGAACCTTATTCTTACTTTCTTCATCTTACATCCTCATTTTCAAGTCTTTAATCTTATCTTCTTACTCTTACATACCTTCTCTTCATTCTTCAATCATCAATTCTCACTCATCATTCCTTGGTCTTACTTCTTTCTTCTTAATGTCATA CTTTTATCCCCTATTATCATCTTCTTAGTCTTCAATTTCTCTTCTAAGTTCTTCATCTATCACTTTTCATCATCATTCATACTTACTTAACTTACTTTCATCTACTTACTTCTACTACTTCTTCACCAAATCCGCACTTAGCTTCATATTTCTTTGTTTGATCTTACTTTACTTAGCTCTTACATACTTAGGATCTACTTCTTACTTACTACTACCTTACTTACCTCTTATTTCACTTACATCTAGGTCCTTATCCTACTTTACTTCTCTTATCTTACTTCTTTATTCTCAAAATCCGGACTTAGCTTAACTTTTCTCTCTTTATTCTTACCTTACTTAGCTCTTACATACTTAGGATCTACTTCTTTACTTAC

EMBL:

ID AY321453_3 "; parent: AY321453AC" "AY321453;" FT enhancer <1..>954 FT "/note=""skeletal" muscle enhancer FT "/gene=""Mef2c""" SQ Sequence "954 BP;" tctagagttg gactgttaaa tttgtgccag atacatcaat gaataccgcc tgcctatctt 60 tttcttccaa ctgaatttac ttatctaaaa aagaaatcgt ctaaaaattc acctgctaat 120 aaatgtaaat gtccttacct taaccagtca ttaaggaata ccagctaaat cagggtcaca 180 catcaagggt ctccacagac gtaagtgtcc attttaaatg gtacagtagc attgtgggtt 240 cccaatcgtt taagtgccat gaccatccag ttttgacacc gagtctctta gagttacaag 300 ctttctaatt tgggagcatg attaatccct cctatgtgat aagttttaac cttctaatat 360 ttctttggat tgaaaaaagc aaatgagctg cggcaaagaa tggcaaataa ctacagtgct 420 taacacagtt taataacctg aaatgaagca agtgtgtgct atgtttccat taaaaagttt 480 ccagccacaa ttaattgaac aaaaacttgt cttgttccaa gattattctt ggaaatgtaa 540 ttttaaagcc tgtgtgaaat gaggaaactt aactttttat accatatgaa agcaatttca 600 ttttttagga atgattttgg atagacttcc gattggatat tttccattgg aactaacagt 660 gtagaggctt ggggtgggga gagagcagtt ctgtgttctt ttgccagcac tgacaaaggt 720 ctggttgtca atgatacctt tacagctaaa tttactccag agtgacatga acaggtgcac 780 cctggcctgc cagacacttg tgcagaggga tcacgcatct caccgcttga cgatcaaggg 840 ggcaaagctt cggtgttcat agaaaaggag aggaggcgag cgcagcccaa actggggggt 900 ttctcttcaa agccagctgg tctggcttta ttctacagga atttttttac ctgt 954 //

GenBank:

LOCUS AY183922 7568 bp DNA linear INV 27-FEB-2003 DEFINITION Drosophila melanogaster centromeric satellite sequence containing transposon You. 1 ataatataat ataatataat ataatataat ataatataat ataatataat ataatataat 61 ataatataat ataatataat ataatataat ataatataat ataatataat ataatataat 121 ataatataat ataatataat ataatataat ataatataat ataatatata aataatataa 181 tataatataa tataatataa tataatataa tataatataa tataatataa tataatataa 241 tataatataa tataatataa tataatataa tataatataa tataatataa tataatataa 301 tataatataa tataatataa tataatataa tataatataa tataatataa tataatataa 361 tataatatag tatagtatag tatagtataa tataatataa tataatataa tataatataa 421 tataatataa tataatataa tataatataa tataatataa tataatataa aaaaatataa 481 tataatataa tataatataa tataatataa tataatataa tataatataa tataatataa 541 tataatataa tataatataa tataatataa tataatataa tataatataa tataatataa 601 tataatataa tataatataa tataatataa tataatatag tataatataa tataatataa 661 aataatataa tataatatat ttatttattt aacaaaatta aatatggtat acaatactaa 721 acctaattaa atttaatgag tactagctac ggtggccttc gactcgagac ttatgggtta 781 attgctttat ataataaact tagctttttg gacaaatttg taaatttttg agatattttc 841 acaggatggg atacttaaac aattcgagag actatgtgta ccaaataagt gagatctaat 901 tgagtgcaat tgactgcagg cgttgagaat atggtcaacg gtgagctcgt ccccgcatag 961 ttggcatgtt ggtcgcgccg atctcatcag taagtgttga tgtgtggatt gggtgtgccc 1021 gatgcgtaga cggataaagg tcgcgcattc ccgtttatgt acgttcgttg gtggcttgaa 1081 catgatgcaa ttcggattga tagactggta cctgtgcatg aagagtgccc attcggagag 1141 tttcttttct ttgaggtata acttgattcg actttttagg tccttggagt taaacggagt 1201 gaacaggatt gatggtgtaa gcctcatctc ttgggcggct ttgtcagcaa gttcattccc 1261 atgaatacct tgatgactgg gaacccagag taaggtgatt ttttttgggt gagaacttag 1321 aatgtgccta acttcttgtg ttgtggggtc attatggttc cagttgcgta tagcggaaag 1381 agaggagagg ctgtctgtgc agataacaga ttttccagcg tttttggaag cgaattggca 1441 tgctttgaga atggcgaaag cttcggctgt aaatatggag ttgtagcacg gaagcctacc 1501 tcctgcaatt attttacggt tagagtcaac aaccgcaaaa gtagttgcgc cggtgacttt 1561 agaaccatcg gtgtagatcc agtttttcac accaagatct tcttgtgcgc tcataaaacg 1621 tttttggtat tctaggcgac ctgtatcctt tttggcagca ttgtatattt gaaggtttat 1681 gttaggctgt ttggaacccc aaagtgctgg cgatttgaag ggcctcctgg gcttaggcag 1741 gggaaggtca agtagcttga tgtagttggc gcaacgtctt agggtggatg tgcacttgaa 1801 tttccgtttt tgtttaaata tggctccgaa gtctttggtt agcaggcagt ttgacgtggt 1861 gtacagcttc gggataagca tcaatgtagt ttcttctacg cgtgattgga tactcgggag 1921 acccgattct gccaatgtgc acgctactgg agatgtggga aatgcgtgaa tggcgcgacg 1981 gaccgctccg tgatatggga cttgtagctt ttttaagtgt gatttggcac accaaccgaa 2041 gattggcagt ccgtagtcaa ttttagatag cattaaagcg cgcgtaatat ctatgagagt 2101 cttaatatgt atgtaagaat atttagatga tagaaattta ataatgttaa atctagtttc 2161 cagttgtttt cttagagtct gacagtgctg tttaaaaagt agtttggagt cgaaggttat 2221 ccccaagatt tttaaaaaat ttacatcttt tattgtgcgg ctgttaaaga caatgtcgga 2281 aaggttgcaa cgttgtttcc gacagatatg taaagtttgg catttttcaa tggcaagaga 2341 ggccccagag gttgctcccc acgagttaat ttcttgcaat atttctaaga atttttctct 2401 aactgtgtta atatttttta ttttagtaaa gattattgcg tcgtctgcgt atagtgagat 2461 gtaaatatct ttatgccgag ttacaatgtc atttatgtct tcaatagcta tcataaataa 2521 aaccaccgaa agtggcgaac cctgcgggat tccattgtgt aaaatgtggg agttcgatgt 2581 gacattgttt attcgaaccc tgaaggaccg attggtcatg aaggctttaa taaggttata 2641 aagcctagga ccaatgcccc agcgctcgag tctgcaaagt acggcgtgaa tccccacgcg 2701 atcgaaggct ctttcaaaat ccgtcgccaa gatagagacg tgatttttgg tcgaaagagc 2761 gttcgacgcg aagtgttgga tacgcaataa cgcgtccatc gtgctttgat tacttttaaa 2821 ggcaacttga ttatgggaaa ttaggttgtg gcgtttaatg aaccaggtaa gtctttgtgc 2881 tattattttt tctagtgttt ttcccagaca ggataacaga gagattggac ggtagctgtt 2941 aatatcggaa gggggtttga taggttttta tatagggata atgatagccg atctccatgt 3001 atgtgggtat tttccagtgg ttaatatttg attaaaaatg tctaaaagtt ttgtttttag 3061 gtggggagat aggtttttga gcatagggta tgatactctg tcagccccag ggcttttccc 3121 ttttgctttt gctactgaat tttctatttc gagcaatgtg aaattggaat ctaaggatgt 3181 agccgatggg gaaagtgagt cgatggcata gggctctaaa agataccgat tttttactcg 3241 tatatattct gctgaaaaat tttggtcaga agagtattta gaccaagata aggcaaactc 3301 ttcggcgata tcaaatgatc cagttagagt acccgagttg gatttgatat atttgaacgg 3361 agtgggaggg atgccggcta gtcgttttat atctgaccag accttttttg tggaggatac 3421 tggggagatt ttggaagtaa atttttcaag ggagttacgc ttggccgaaa gtacagcttt 3481 tttgaaaagc gcgtttgctt ttttgtatcg gataaggttt gtatcattag tattggcttt 3541 gtaggacgag aacaagcgtt gcttttggtc cctaagctgt tgaaggttag cgttccacca 3601 tggcaccttg gctttgtgga tcaccctttt cgtttgggga atgctatagt ttgcagctga 3661 acgtatgact ttcgtcattt gtgcgacttg ctgatttagg caaccgaccg tccaatatgc 3721 tgctgatttt tcgcaacttt cgttaaagcg tttccagttc gcttggtctg tcttgtattt 3781 aggcaggggt aaagtgttat cgggacgggt aggtgtgttt atgtggatgg ttatgggaaa 3841 gtggtcactt ccatggagat tatctgatat agaccagctg cacatatggg ctatctgtgg 3901 agatatcagt gagatatcaa tgtgggtgaa cgtattgtga gttgaaaggt gagtcgggga 3961 accgtcgtta agaacaatta ggctgttttc aagaattacg gtttcaattt ttttacccct 4021 tgtatttgtg cgaggtgaac cccataaagg actccatgag ttaagatcac ccaggagtat 4081 tgtggatccg ttaagatttt gaagaatttc tgatatgtca gaagatgaaa aaatttgact 4141 tggtgggatg tacgcattaa caatattgat gacctgttca aaattaagct gcagtgcgga 4201 gcagagtatg ctggagttaa tgttacggta tgtatgtggg acattccttt taataagaac 4261 accaatgcct tgtttggctg aggtgttata agaaaaattg tggaagtaac cactatattc 4321 tttggggcaa ataaaatttg tagaattaca tggaaggttg gtttcctgca aaaatacaat 4381 atcgggtgca tggtctttta tgagtagtgt cagttcgttg taattattaa aaatgccgtg 4441 gatgttccat tgtaatatag taattgtcat gattaaaatt tttttttttt tatttattgt 4501 tttttgttgg actgttatta atttgtggtg tgtgtatatg aaggtaaggg tgagaggatc 4561 aggactagga atcgggatcg tccatagtgt ctgagtctgt tgtgttgatt tttgtttgta 4621 gatttgaggt ttgtgaagca attgattcgt ttgagttgga tcttgaggtc attaacgtat 4681 tgttgtcgtc gttgtaggtt tgtcctaata gagcgtttgc ttccgcccta agggagcgag 4741 atcgttcgat gcatgttttt tttaggtaag agaaatcagt tttgtcagag gtgcttgggg 4801 aggaagtaag attctcttcg agattcaaag agttcgtccg agaagtggga tacgttggtg 4861 agagcggagc tggtactttt gtcgagctgg tgggcaagtc ggtgtttgta atcgtgttag 4921 ggtttcggga ttttttgaca agcatcacgg atgctgtgct ttggtttgcg acggtcgagt 4981 aggtaagcgt ggggttattt gttgtgtttt gttgttgttt tagtatagtg cgagcttcat 5041 ggaaactgca ttttttgctt gttttgatgt ggagcagttg tttttgtgtt tggtattgtg 5101 ggcattcggg tgaggaggct ggatgttggc cggtgcagtt tgcacagaaa atgcgagtgc 5161 atggcacggg aaggtgggga gcgagattgc atgatacaca agcaggtggg tttttgcagt 5221 gctttgatgt gtggcctaat aattgacaag acttacatct catcgggttg ggtatatatt 5281 ctgacacctt aactgtgtgc caggaaaccg ttagtttact gggaagagtg aaacggtcga 5341 acgttacgag aacttttcca aaaggtttgg gggtgccgtc gatcattttg gtaaatttaa 5401 atacgctgtg tacattttgt gattttagag cgtaaatggt gcctttgaca aagttaagag 5461 tgttgtggag cttgcactcg atatcgcata agccaggtaa agaaatcact ttgataaatt 5521 tgtcactaat ttccctggag ttaaccagca agagaaggtt accatcccga agattagaga 5581 tggatgtaat gtctttgctg atatacttaa gggctctatg gacagcaaag cagttgtagt 5641 cggatatggt tttcggagag ttttttgatg agaccactaa atatctcgga tttttgcact 5701 gcgtttcagg gaggtctggg aaatcaactt gtaatttttg aaagggtctt tttttcttag 5761 ctttggggct aacgctgaga ctggcaaagc gattatcccc aaaattgagt ggcccggggg 5821 ccatggttaa taaatttatg gatattgaat gtttttgatt tgcacgtacg cgttgataag 5881 aagatcaaga agataagatg ttgaatcaat gatgatatca atgtaacggc gatggtaatt 5941 acgcgataag caaagctcac acaattggaa agacacagac gtccgcactc gaagagagat 6001 agtcggtgac tgaatataat ataatataat ataatataat gtagtataat ataatataat 6061 ataatataat ataatataat ataatataat ataatattat aatataatat aatataatat 6121 aatataatat aatataatat aatataatat aatataatat aatataatat aatataatat 6181 aatataatat aatataatat aatataatat aatatagtat aatataatat aatataatat 6241 aatataatat aatataatat aatataatgt aatataatat aatataatat aatataatat 6301 aatataatat aatataatat aatataatat aataaaataa aatataatat aatataatat 6361 aatataatat aatataatat aatataatat aatataatat aatataatat aatataatat 6421 aatataatat aatataatat aatataatat aatataatat aatataatat aatataatat 6481 aatataatat aatataatat aatataatat aatataatat aatataatat aatataatat 6541 aatataatat attataatat aatataatat ataaataata taatataata tataaataat 6601 ataatataat ataatataat ataatataat ataatataat ataatataat ataatataat 6661 ataatataat ataatataat ataatataat ataatataat ataatataat ataatataat 6721 ataatataat ataatataat ataatataat ataatataat ataatataat ataatataat 6781 ataatataat ataatataat ataatataat ataatataat ataatataat ataatataat 6841 ataatataat ataatataat ataatataat ataatataat ataatataat ataatataat 6901 ataatataat ataatataat ataatataat ataaaatcat ataatataat ttaatataat 6961 attcttctct tctcttctct tctcttctct tctcttctct tctcttctct tctcttctct 7021 tctcttctct tctcttctct tctcttctct tctcttctct tctcttctct tctcttctct 7081 tctcttctct tctcttctct tctcttctct tctcttctct tctcttctct tctcttctct 7141 tctcttctct tctcttctct tctcttctct tctcttctct tctcttctct tctcttctct 7201 tctcttctct tctcttctct tctcttctct tctcttctct tctcttctct tctcttctct 7261 tctcttctct tctcttctct tctcttctct tctcttctct tctcttctct tctcttcaat 7321 tctcttctct tctcttctct tctcttctct tctcttctct tctcttctct tctcttctct 7381 tctcttctct tctcttctct tctcttctct tctcttctct tctcttctct tctcttctct 7441 tctcttctct tctcttctct tctcttccct tctcttccct tctcttccct tctcttctct 7501 tctcttctct tcccttctct tcccttctct tctcttctct tctcttccct tctcttccct 7561 tctcttcc

Your opinions
Your name:Email:Website url:Opinion content:
- no title specified

HxLauncher: Launch Android applications by voice commands