Entry information : PtroPGHS02
Entry ID 5940
Creation 2007-10-26 (Christophe Dunand)
Last sequence changes 2010-11-23 (Myriam Duval (Scipio))
Sequence status complete
Reviewer Christophe Dunand
Last annotation changes 2010-12-21 (Christophe Dunand)
Peroxidase information: PtroPGHS02
Name PtroPGHS02
Class H synthase    [Orthogroup: PGHS001]
Taxonomy Eukaryota Metazoa Chordata Mammalia Hominidae Pan
Organism Pan troglodytes (chimpanzee)    [TaxId: 9598 ]
Cellular localisation N/D
Tissue type N/D
Inducer N/D
Repressor N/D
Best BLASTp hits
Perox score E-value PtroPGHS02
start..stop
S start..stop
HsPGHS02 1264 0 137..740 1..604
CfaPGHS02 1165 0 137..740 1..604
OcuPGHS02 1141 0 151..740 15..604
SscPGHS02 1137 0 148..740 12..604
Gene structure Fichierperl './assets/cgi-bin/draw_exon.pl' '5940' 'complement(join(166424665..166425074,166425558..166425705,166426207..166426493,166426776..166427022,166427136..166427219,166427952..166428133,166428563..166428706,166429361..166429504,166429625..166429741,166430542..166430731,166431007..166431276))' Exons
ExonStart..EndSize ExonStart..EndSize ExonStart..EndSize ExonStart..EndSize
N° 1 166431007..166431276 268 N° 2 166430542..166430731 188 N° 3 166429625..166429741 115 N° 4 166429361..166429504 142
N° 5 166428563..166428706 142 N° 6 166427952..166428133 180 N° 7 166427136..166427219 82 N° 8 166426776..166427022 245
N° 9 166426207..166426493 285 N° 10 166425558..166425705 146 N° 11 166424665..166425074 408  
complement(join(166424665..166425074,166425558..166425705,166426207..166426493,1 66426776..166427022,166427136..166427219,166427952..166428133,166428563..1664287 06,166429361..166429504,166429625..166429741,166430542..166430731,166431007..166 431276))


exon

Literature and cross-references PtroPGHS02
Literature Chimpanzee Sequencing and Analysis Consortium Initial sequence of the chimpanzee genome and comparison with the human genome. Nature 437 (7055), 69-87 (2005).
DNA ref. GenBank:   NC_006468.2 (166431276..166424665)
mRNA ref. GenBank:   XM_524999.2
EST ref. GenBank:   DC525522.1 [5' end]
Protein sequence: PtroPGHS02
Sequence Properties
first value : protein
second value (mature protein)
Length (aa):   %s   740 (325)
PWM (Da):   %s   83509.34 (36042.1)  
PI (pH):   %s   8.86 (7.74) Peptide Signal:   %s   cut: 28 range:28-352
Sequence
Send to BLAST
Send to Peroxiscan
.........1.........2.........3.........4.........5.........6.........7.........8.........9.........0.........1.........2
MSAFLNLTRPSLSRRDFLDPLKTYRPDTAAAAGEGIPCAPGPQGG
SDSGRGSQVSFCPPPVSHPRRSVQNWLSEALGQRLRGRKDIWRKP
RPVVRRLAVSVRSTSRNSSAAPPSAPQPDALRQQSLPPRRALPAAAMLARALLLCAVLALSHTANPCCSHPCQNRGVCMSVGFDQYKCDCTRTGFYGENCSTPEFLTRIKLFLKPTPNTV
HYILTHFKGFWNVVNNIPFLRNAIMSYVLT
SRSHLIDSPPTYNADYGYKSWEAFSNLSYYTRALPPVPDDCPTPLGVKGKKQLPDSNEIVEKLLLRRKFIPDPQGSNMMFAFFAQHFTHQ
FFKTDHKRGPAFTNGLGH
VDLNHIYGETLARQHKLRLFKDGKMKYQIIDGEMYPPTVKDTQAEMIYPPQVPEHLRFAVGQEFFGLVPGLMMYATIWLREHNRVCDVLKQEHPEWGDEQLF
QTSRLILI
GETIKIVIEDYVQHLSGYHFKLKFDPELLFNKQFQYQNRIAAEFNTLYHWHPLLPDTFQIHDQKYNYQQFIYNNSILLEHGITQFVESFTRQIAGVAGGRNVPPAVQKVSQA
SIDQSRQMKYQSFNEYRKRFMLKPYESFEELT
GEKEMSAELEALYGDIDAVELYPALLVEKPRPDAIFGETMVEVGAPFSLKGLMGNVICSPAYWKPSTFGGEVGFQIINTASIQSLICN
NVKGCPFTSFSVPDPELIKTVTINASSSRSGLDDINPTVLLKERSTEL

Retrieve as FASTA  
Remarks Complete sequence from genomic (chromo 1, 10 introns) and 1 EST. Isolate="Yerkes chimp pedigree #C0471 (Clint)".
DNA
Send to BLAST
.........1.........2.........3.........4.........5.........6.........7.........8.........9.........0.........1.........2
ATGTCAGCCTTTCTTAACCTTACTCGCCCCAGTCTGTCCCGACGTGACTTCCTCGACCCTCTAAAGACGTACAGACCAGACACAGCGGCGGCGGCGGGAGAGGGGATTCCCTGCGCCCCC
GGACCTCAGGGCGGCTCAGATTCCGGGAGAGGAAGCCAAGTGTCCTTCTGCCCTCCCCCGGTATCCCATCCAAGGCGATCAGTCCAGAACTGGCTCTCGGAAGCGCTCGGGCAAAGACTG
CGAGGAAGAAAAGACATCTGGCGGAAACCT
GTGCGCCTGGGGCGGTGGAACTCGGGGAGGAGAGGGAGGGATCAGACAGGAGAGTGGGGACTACCCGCTCTGCTCCCAAATTGGGGCAGC
TTCCTGGGTTTCCGATTTTCTCATTTGCGTGGGTAAAAAACCCTGCCCCCACCGGGCTTACGCAATTTTTTTAAGGGGAGAGGAGGGAAAAATTTGTGGGGGGTACGAAAAGGCGGAAAG
AAACAGTCATTTCGTCACATGGGCTTGGTTTTCAGTCTTATAAAAAGGAAGGTTCTCTCGGTTAGCGCGACCAGTTGTCAGACGACTTGCAGTGAGCGTCAGGAGCACGTCCAGGAACTC
CTCAGCAGCGCCTCCTTCAGCTCCACAGCCAGACGCCCTCAGACAGCAAAGCCTACCCCCGCGCCGCGCCCTGCCCGCCGCTGCGATGCTCGCCCGCGCCCTGCTGCTGTGCGCGGTCCT
GGCGCTCAGCCATACAG
GTGAGTACCTGGCGCCGCGCACCGGGGACTCCGGTTCCACGCACCCGGGCAGAGTTTCCGCTCTGACCTCCTGGGTCTATCCCAGTACTCCGACTTCTCTCCG
AATAGAGAAGCTACGTGACTGGGGAAAGAGCTTGGACCGCTAGAGTCCGAAAGAACTCCGTGGGTATTCCAGCTTTCCCACAAGCACTGATCATTATGAGCCAGTTACTTAACCGATCTG
AGACACTCTCACCTCCTAAATAGGGATAGATGATACTAATTTGCAGGTTGTCATTATGATAAGACAGGATCTGATCAATATATGTGAATTGTTCATATTTGGAACCTTTTTATTGAGTGG
AAGAAGTTGTTTTAAATACTCTAGTCAGTTCTTTCCTGCTCCCAGGAAAGCCCAGATTATGTTTTAAGATAAGCAAAATGTCTTAAAAGTAAGCTGTTTTACTTTGAATTTTTCCCTAAA
TGTTGATTAGTGTACTAGATCCATTTTAATTTGGAAAGTGAAGTGCTACTTATTTGAACTTCTTAAAAATGCTAATTTTAACATCTAAAGAGTTAACTAAGAAAAGCTTAGTAACATGAT
GTACCAAGTTGAATATGCTGTTATCCTCATTTAGAATAGAAAATTGGTATTTCTACGTTTTATCCATTCTAAGGCAGGTTAAAAAATTGTATTTCCATGACTACCTATATATTTCTTGAA
TTTATTATTGTAAAGTTGATTCATAGTAAAACAATTAAATGTTTAAATTAAGATTAAGACACTAGAGAATGATTTATTTGCTGTCCTTTAATTGCAGCACAAATCCTTGCTGTTCCCACC
CATGTCAAAACCGAGGTGTATGTATGAGTGTGGGATTTGACCAGTATAAGTGCGATTGTACCCGGACAGGATTCTATGGAGAAAACTGCTCAACAC
GTAAGTTTGTCCTTTGGTTGCCTC
ATTAGGAGTGGGGCTGGATACAGTTATCATTGTATAGATTTGTGTCTTATAATGAGTCCCATTAATTTCTCCCTCCCTTTCTTCGTCTTCTTGCAGCGCGGAATTTTTGACAAGAATAAA
ATTATTTCTGAAACCCACTCCAAACACAGTGCACTACATACTTACCCACTTCAAGGGATTTTGGAACGTTGTGAATAACATTCCCTTCCTTCGAAATGCAATTATGAGTTATGTGTTGAC
AT
GTAAGTACAAGTGTCTTTCTAAGGTTTTTAGCTTTCTCAAAGAAAAATATGCTTTATAATACTGTAAGCCTAATCTAAAAACATATTTCCAAGCTTATCAAAAAGACTTTAAGATACC
TTTTAAGTTTGCCTTCCATCTCAATCGCCAAAAATATTGACATTTAGTCCCATCCAGTTTATACAGTCTGCTCACAACTCTGTATACCTCTTCTAACCTTTACTGTTTGGTCCGTTTGTG
GAGGTAGTATGGTCCAGCTGTTTATTGAATGCCCATGGGCCACAGAATTGTTCTGAACATGTAGCACCCATTAAAATAAATCTGGATTTGGATCAGCAAGAAAATAACTTTCCATGATTC
TAAAGTGGGTGCCATACTCAGCCATTCCTTTCATAGGCCTCTTGGATAGTGAGCAGATGGCTACCTGAAAAATCAATATTGCCAGATTATAATGTGCAGAGTATATGTATTTTATTAAAG
ATGTATTTCAAGTGGCCGTTAGACTATAAAGTGTAGTTGTTTTAAAATAGATTTTTCTTATTTTTGGAGTTAAATTCAACTTCTAGTGCCACTTTCCACATTTTACAATAAAAATAATGG
TTGATTTACTTAACAAATGAGAATAAATAAAACATTTTTTTCTTTGAAAATTTCAGCCCCAGATCACATTTGATTGACAGTCCACCAACTTACAATGCTGACTATGGCTACAAAAGCTGG
GAAGCCTTCTCTAACCTCTCCTATTATACTAGAGCCCTTCCTCCTGTGCCTGATGACTGCCCGACTCCCTTGGGTGTCAAAG
GTGAGTAAGAAGAATCCATTAGAGATGTATTAACTATA
AGACGGGCTGCATTGCTGCCAAAAAAAAAATTGACCTTAGACTACCATTTATTTATTAACAAAAGCAGTTTTTACTTTTAGCATGGATATCTATGGGTATTTTTTAAAGTATGAGTCTAT
GTAAACTATTATGTAAAAGCAAATGAGCATCTTGGTATAATGTCTTAATATTTTCAAATTATTTCATTAGAAATGAAATAATTCTAATTAAAATAGATAAAATCATTCAGTAAGAAGTTG
TTCCACCATATCTTAGAACTGTTGTTTATATTATGATCCTATTCACAATTGTAATTCTCATATAAATGAAGAATTCTTGGTATATTGACAGTCACCATCTCCTTTCTTGAATACATAGAT
GGATTCTTATCTTAGCTTTCTCATTTTTCAGGTGTAAAAAGCAGCTTCCTGATTCAAATGAGATTGTGGAAAAATTACTTCTAAGAAGAAAGTTCATCCCTGATCCCCAGGGCTCAAACA
TGATGTTTGCATTCTTTGCCCAGCACTTCACGCATCAGTTTTTCAAGACAGATCATAAGCGAGGGCCAGCTTTCACCAACGGGCTGGGCCATGGG
GTAAGATAGAGTTAATATCTTAGAG
TTAGTAAAATTATACCAAATCATAGTCAAGGGCTAACATTAAAGGAGATATACCGATAGATAGACCCAAATAACTTATCCACTTTTTTAAAAAAGAAGCCTTATCTATAAAAACCTTAAA
GGAATTTTCCATTTACGTCACTGGTCTAGTAAAATTATACACACACACAGACATGCACACACATATATAAACATTCACACACATACATATGTACAGGTATTGTTATTTGTAATTTGACCC
CTGTATTTTTTAGTTTAAAATGTTAGTACTGCAAAATGTTATGTCCTCAAAAACACATTGTATCATGATTATGCTGCTTTCAATATTGTAAAGTGAGGTTTTTGCCGCATTATTATTTTT
TGGATTTCAATAGCATAGCTTCAAGTTATTCGCAAGAATTTTTTATAAATAATACATTTTTATACTTTTTTAGAATTACCATATCATCATAGTGAAGTATATAATATATATGATATAAGC
TCAATATAGTATATTAATTCCATTAAACACAAAGACATATCAGTTTGTAGCTTTGGTGGATAAACAAATTAATTTAGCAATTTGTGACTATGAAAAATGTATATTTTATTTAAAAATTTT
AAAGAAAGCTAAATGATCAAATTATTTAATGATGAATTATATGATAGACAATTTATATAAGAAAAACTTCAACAGCAACAAATTAAAATTTTTTCATCATTTTCTAGGTGTGGACTTAAA
TCATATTTACGGTGAAACTCTGGCTAGACAGCATAAACTGCGCCTTTTCAAGGATGGAAAAATGAAATATCAG
GTATCCTTCCTTTGACTATTAAGACTTAGTTATTACCGCTTATACCC
ATATTTTAAAATCCCTAAAAATGTGTTCCTTAACTTTTTAACTGTTTATTATTATTTTTTTTTTAGATATAATTGATGGAGAGATGTATCCTCCCACAGTCAAAGATACTCAGGCAGAGA
TGATCTACCCTCCTCAAGTCCCTGAGCATCTACGGTTTGCTGTGGGGCAGGAGTTCTTTGGTCTGGTGCCTGGTCTGATGATGTATGCCACAATCTGGCTGCGGGAACACAACAGAGTAT
GCGATGTGCTTAAACAGGAGCATCCTGAATGGGGTGATGAGCAGTTGTTCCAGACAAGCAGGCTAATACTGATAG
GTAAAAAAGAAAATGATTTATATAAAACCCTCTTCCCCAGGGAAA
ATTAGTGTGCTATCTTTGTTATGTTTTGAGTAAATGACAAGATATGGTAAATGAAAACTCACACATTCTATATACATTAAATATGTAAGCATGACTGATCATATAGCTATCTTTTGATAC
TTACAAGGAAGAAAACAGAAATGAAGGAATAGCAAATTTTAAAAATTGCATTCCAATTGCTTGAAAGCTTGTGATCAGATGCAATAAATGTTTTTATTATTTATTTTGTGCAAATAGGAG
AGAGACTATTAAGATTGTGATTGAAGATTATGTGCAACACTTGAGTGGCTATCACTTCAAACTGAAATTTGACCCAGAACTACTTTTCAACAAACAATTCCAGTATCAAAATCGTATTGC
TGCTGAATTTAACACCCTCTATCACTGGCATCCCCTTCTGCCTGACACCTTTCAAATTCATGACCAGAAATACAACTATCAACAGTTTATCTACAACAACTCTATATTACTGGAACATGG
AATTACCCAGTTTGTTGAATCATTCACCAGGCAAATTGCTGGCAGG
GTAAGCATTATTATTGAAAACCAAAACAAAAGACTAGTCAGTAACTTTAGAATTTCTGCCACGGAAATTATTTT
TCTTAAACTTACTAAAAGAGTAGTTAGTTATATTGCTAGTAAAATTATTTTATTGATATAAGAAGCCTAACTTTGTTTGAAAAGTCTAAACTTTTAGTCTAGTCTACAGTTGTCAGACAA
ATAGCAAATTGTACCCCTACCTTAAAAATATTTTCAAAAAGTATCTATAATCTTATAGGAATAAATATTTTAGGCTTGAATACTAGTGTTATTTTTGAAATGTAAAAAGGCAAATTAGTT
CTAGGCTGGTGTCCCATTGAATTTTAAGCAGAGCTCCTGTTGAAATGTAGGTAAGCATCTTTCCAGCAAATAAAAATTGTCTCCGCTGGGAGTTTCAGTTTTACCTGATTTGTACCTAAG
GCAAGCTGAATACAAACAGTAAATATGCCTAAAATTCTTGTTTTACAACTAATTTTACTTTCCACAGGTGTTGCTGGTGGTAGGAATGTTCCACCCGCAGTACAGAAAGTATCACAGGCT
TCCATTGACCAGAGCAGGCAGATGAAATACCAGTCTTTTAATGAGTACCGCAAACGCTTTATGCTGAAGCCCTATGAATCATTTGAAGAACTTACAG
GTAAGAAACAGTTTCTAAACTTC
TTCGTTTTTTGTTTGTTTGTTTGTTTTTGTTGTTTTTGGTTTTCTTTTTGAGATGGAGCCGCCCTCTGTCACCCAGGCTGGAGTGCAGTGGCGCCATCTCGGCTCACTGCAACCTCCGCC
TCCTGGGTTCAAGCAATTCTGCCTCAGCTTCCTGAGTAGCTGGGACTACAGGCGCACGTCGCACGCATGGATAATTTTTTGTATTTTCAGTATAGACGGGGTTTCACCGTGTTAGTCAGA
CTGGTCTCAAACTCCTGACCTAGTGATCCGCCGGCTTCGGCCTCCCGAAGTGCTGGGATTACAGGCGTGAGCCACCGCGCCTGGCCCCTAAACTTCTTAAAAGAATCAGGGGTCAAATGG
AAACAGAGAAGTTGGCAGCAAATTGAGCAAAAGAATCAAACTGTTTTTTATTTTGTGAAGTTTGACATTGGTTGTATCTCTGTCTTCATCGCCTTCACAGGAGAGAAAAGGAAATGTCTG
CAGAGTTGGAAGCACTCTATGGTGACATCGATGCTGTGGAGCTGTATCCTGCCCTTCTGGTAGAAAAGCCTCGGCCAGATGCCATCTTTGGTGAGACCATGGTAGAAGTTGGAGCACCAT
TCTCCTTGAAAGGACTTATGGGTAATGTTATATGTTCTCCTGCCTACTGGAAGCCAAGCACTTTTGGTGGAGAAGTGGGTTTTCAAATCATCAACACTGCCTCAATTCAGTCTCTCATCT
GCAATAACGTGAAGGGCTGTCCCTTTACTTCATTCAGTGTTCCAGATCCAGAGCTCATCAAAACAGTCACCATCAATGCAAGTTCTTCCCGCTCCGGACTAGATGATATCAATCCCACAG
TACTACTAAAAGAACGTTCGACTGAACTGTAG

Retrieve as FASTA  
CDS
Send to BLAST
.........1.........2.........3.........4.........5.........6.........7.........8.........9.........0.........1.........2
ATGTCAGCCTTTCTTAACCTTACTCGCCCCAGTCTGTCCCGACGTGACTTCCTCGACCCTCTAAAGACGTACAGACCAGACACAGCGGCGGCGGCGGGAGAGGGGATTCCCTGCGCCCCC
GGACCTCAGGGCGGCTCAGATTCCGGGAGAGGAAGCCAAGTGTCCTTCTGCCCTCCCCCGGTATCCCATCCAAGGCGATCAGTCCAGAACTGGCTCTCGGAAGCGCTCGGGCAAAGACTG
CGAGGAAGAAAAGACATCTGGCGGAAACCT
CGACCAGTTGTCAGACGACTTGCAGTGAGCGTCAGGAGCACGTCCAGGAACTCCTCAGCAGCGCCTCCTTCAGCTCCACAGCCAGACGCC
CTCAGACAGCAAAGCCTACCCCCGCGCCGCGCCCTGCCCGCCGCTGCGATGCTCGCCCGCGCCCTGCTGCTGTGCGCGGTCCTGGCGCTCAGCCATACAG
CAAATCCTTGCTGTTCCCAC
CCATGTCAAAACCGAGGTGTATGTATGAGTGTGGGATTTGACCAGTATAAGTGCGATTGTACCCGGACAGGATTCTATGGAGAAAACTGCTCAACAC
CGGAATTTTTGACAAGAATAAAA
TTATTTCTGAAACCCACTCCAAACACAGTGCACTACATACTTACCCACTTCAAGGGATTTTGGAACGTTGTGAATAACATTCCCTTCCTTCGAAATGCAATTATGAGTTATGTGTTGACA
T
CCAGATCACATTTGATTGACAGTCCACCAACTTACAATGCTGACTATGGCTACAAAAGCTGGGAAGCCTTCTCTAACCTCTCCTATTATACTAGAGCCCTTCCTCCTGTGCCTGATGAC
TGCCCGACTCCCTTGGGTGTCAAAG
GTAAAAAGCAGCTTCCTGATTCAAATGAGATTGTGGAAAAATTACTTCTAAGAAGAAAGTTCATCCCTGATCCCCAGGGCTCAAACATGATGTTT
GCATTCTTTGCCCAGCACTTCACGCATCAGTTTTTCAAGACAGATCATAAGCGAGGGCCAGCTTTCACCAACGGGCTGGGCCATGGG
GTGGACTTAAATCATATTTACGGTGAAACTCTG
GCTAGACAGCATAAACTGCGCCTTTTCAAGGATGGAAAAATGAAATATCAG
ATAATTGATGGAGAGATGTATCCTCCCACAGTCAAAGATACTCAGGCAGAGATGATCTACCCTCCTCAA
GTCCCTGAGCATCTACGGTTTGCTGTGGGGCAGGAGTTCTTTGGTCTGGTGCCTGGTCTGATGATGTATGCCACAATCTGGCTGCGGGAACACAACAGAGTATGCGATGTGCTTAAACAG
GAGCATCCTGAATGGGGTGATGAGCAGTTGTTCCAGACAAGCAGGCTAATACTGATAG
GAGAGACTATTAAGATTGTGATTGAAGATTATGTGCAACACTTGAGTGGCTATCACTTCAAA
CTGAAATTTGACCCAGAACTACTTTTCAACAAACAATTCCAGTATCAAAATCGTATTGCTGCTGAATTTAACACCCTCTATCACTGGCATCCCCTTCTGCCTGACACCTTTCAAATTCAT
GACCAGAAATACAACTATCAACAGTTTATCTACAACAACTCTATATTACTGGAACATGGAATTACCCAGTTTGTTGAATCATTCACCAGGCAAATTGCTGGCAGG
GTTGCTGGTGGTAGG
AATGTTCCACCCGCAGTACAGAAAGTATCACAGGCTTCCATTGACCAGAGCAGGCAGATGAAATACCAGTCTTTTAATGAGTACCGCAAACGCTTTATGCTGAAGCCCTATGAATCATTT
GAAGAACTTACAG
GAGAAAAGGAAATGTCTGCAGAGTTGGAAGCACTCTATGGTGACATCGATGCTGTGGAGCTGTATCCTGCCCTTCTGGTAGAAAAGCCTCGGCCAGATGCCATCTTT
GGTGAGACCATGGTAGAAGTTGGAGCACCATTCTCCTTGAAAGGACTTATGGGTAATGTTATATGTTCTCCTGCCTACTGGAAGCCAAGCACTTTTGGTGGAGAAGTGGGTTTTCAAATC
ATCAACACTGCCTCAATTCAGTCTCTCATCTGCAATAACGTGAAGGGCTGTCCCTTTACTTCATTCAGTGTTCCAGATCCAGAGCTCATCAAAACAGTCACCATCAATGCAAGTTCTTCC
CGCTCCGGACTAGATGATATCAATCCCACAGTACTACTAAAAGAACGTTCGACTGAACTGTAG

Retrieve as FASTA  
cDNA
Send to BLAST
.........1.........2.........3.........4.........5.........6.........7.........8.........9.........0.........1.........2
ATGTCAGCCT TTCTTAACCT TACTCGCCCC AGTCTGTCCC GACGTGACTT CCTCGACCCT CTAAAGACGT ACAGACCAGA CACAGCGGCG GCGGCGGGAG AGGGGATTCC CTGCGCCCCC  GGACCTCAGG GCGGCTCAGA TTCCGGGAGA GGAAGCCAAG TGTCCTTCTG CCCTCCCCCG GTATCCCATC CAAGGCGATC AGTCCAGAAC TGGCTCTCGG AAGCGCTCGG GCAAAGACTG  CGAGGAAGAA AAGACATCTG GCGGAAACCT CGACCAGTTG TCAGACGACT TGCAGTGAGC GTCAGGAGCA CGTCCAGGAA CTCCTCAGCA GCGCCTCCTT CAGCTCCACA GCCAGACGCC  CTCAGACAGC AAAGCCTACC CCCGCGCCGC GCCCTGCCCG CCGCTGCGAT GCTCGCCCGC GCCCTGCTGC TGTGCGCGGT CCTGGCGCTC AGCCATACAG CAAATCCTTG CTGTTCCCAC  CCATGTCAAA ACCGAGGTGT ATGTATGAGT GTGGGATTTG ACCAGTATAA GTGCGATTGT ACCCGGACAG GATTCTATGG AGAAAACTGC TCAACACCGG AATTTTTGAC AAGAATAAAA  TTATTTCTGA AACCCACTCC AAACACAGTG CACTACATAC TTACCCACTT CAAGGGATTT TGGAACGTTG TGAATAACAT TCCCTTCCTT CGAAATGCAA TTATGAGTTA TGTGTTGACA  TCCAGATCAC ATTTGATTGA CAGTCCACCA ACTTACAATG CTGACTATGG CTACAAAAGC TGGGAAGCCT TCTCTAACCT CTCCTATTAT ACTAGAGCCC TTCCTCCTGT GCCTGATGAC  TGCCCGACTC CCTTGGGTGT CAAAGGTAAA AAGCAGCTTC CTGATTCAAA TGAGATTGTG GAAAAATTAC TTCTAAGAAG AAAGTTCATC CCTGATCCCC AGGGCTCAAA CATGATGTTT  GCATTCTTTG CCCAGCACTT CACGCATCAG TTTTTCAAGA CAGATCATAA GCGAGGGCCA GCTTTCACCA ACGGGCTGGG CCATGGGGTG GACTTAAATC ATATTTACGG TGAAACTCTG  GCTAGACAGC ATAAACTGCG CCTTTTCAAG GATGGAAAAA TGAAATATCA GATAATTGAT GGAGAGATGT ATCCTCCCAC AGTCAAAGAT ACTCAGGCAG AGATGATCTA CCCTCCTCAA  GTCCCTGAGC ATCTACGGTT TGCTGTGGGG CAGGAGTTCT TTGGTCTGGT GCCTGGTCTG ATGATGTATG CCACAATCTG GCTGCGGGAA CACAACAGAG TATGCGATGT GCTTAAACAG  GAGCATCCTG AATGGGGTGA TGAGCAGTTG TTCCAGACAA GCAGGCTAAT ACTGATAGGA GAGACTATTA AGATTGTGAT TGAAGATTAT GTGCAACACT TGAGTGGCTA TCACTTCAAA  CTGAAATTTG ACCCAGAACT ACTTTTCAAC AAACAATTCC AGTATCAAAA TCGTATTGCT GCTGAATTTA ACACCCTCTA TCACTGGCAT CCCCTTCTGC CTGACACCTT TCAAATTCAT  GACCAGAAAT ACAACTATCA ACAGTTTATC TACAACAACT CTATATTACT GGAACATGGA ATTACCCAGT TTGTTGAATC ATTCACCAGG CAAATTGCTG GCAGGGTTGC TGGTGGTAGG  AATGTTCCAC CCGCAGTACA GAAAGTATCA CAGGCTTCCA TTGACCAGAG CAGGCAGATG AAATACCAGT CTTTTAATGA GTACCGCAAA CGCTTTATGC TGAAGCCCTA TGAATCATTT  GAAGAACTTA CAGGAGAAAA GGAAATGTCT GCAGAGTTGG AAGCACTCTA TGGTGACATC GATGCTGTGG AGCTGTATCC TGCCCTTCTG GTAGAAAAGC CTCGGCCAGA TGCCATCTTT  GGTGAGACCA TGGTAGAAGT TGGAGCACCA TTCTCCTTGA AAGGACTTAT GGGTAATGTT ATATGTTCTC CTGCCTACTG GAAGCCAAGC ACTTTTGGTG GAGAAGTGGG TTTTCAAATC  ATCAACACTG CCTCAATTCA GTCTCTCATC TGCAATAACG TGAAGGGCTG TCCCTTTACT TCATTCAGTG TTCCAGATCC AGAGCTCATC AAAACAGTCA CCATCAATGC AAGTTCTTCC  CGCTCCGGAC TAGATGATAT CAATCCCACA GTACTACTAA AAGAACGTTC GACTGAACTG TAGAAGTCTA ATGATCATAT TTATTTATTT ATATGAACCA TGTCTATTAA TTTAATTATT  TAATAATATT TATATTAAAC TCCTTATGTT ACTTAACATC TTCTGTAACA GAAGTCAGTA CTCCTGTTGC GGAGAAAGGA GTCATACTTG TGAAGACTTT TATGTCACTA CTCTAAAGAT  TTTGCTGTTG CTGTTAAGTT TGGAAAACAG TTTTTATTCT GTTTTATAAA CCAGAGAGAA ATGAGTTTTG ACGTCTTTTT ACTTGAATTT CAACTTATAT TATAAGAACG AAAGTAAAGA  TGTTTGAATA CTTAAACACT GTCACAAGAT GGCAAAATGC TGAAAGTTTT TACACTGTCG ATGTTTCCAA TGCATCTTCC ATGATGCATT AGAAGTAACT AATGTTTGAA ATTTTAAAGT  ACTTTTGGTC ATTTTTCTGT CATCAAACAA AAACAGGTAT CAGTGCACTA CTAAATGAAT ATTTAAATTA GACATTACCA GTAATTTCAT GTCTACTTTT TAAAATCAGC AATGAAACAA  TAATTTGAAA TTTCTAAATT CATAGGGTAG AATCACCTGT AAAAGCTTGT TTGATTTCTT AAAGTTATTA AACTTGTACA TATACCAAAA AGAAGCTGTC TTGGATTTAA ATCTGTAAAA  TCAGTAGAAA TTTTACTACA ATTGCTTGTT AAAATATTTC ATAAGTGATG TTCCTTTTTC ACCAAGAGTA TAAACATTTT TAGTGTGACT GTTAAAACTT CCTTTTAAAT CAAAATGCCA  AATTTATTAA GGTGGTGGAG CCACTGCAGT GTTATCTTAA AATAAGAATA TTTTGTTGAG ATATTCCAGA ATTTGTTTAT ATGGCTTGTA ACATGTAAAA TCTATAGCAG CAAAAGGGTC  TACCTTTAAA ATAAGCAATA ACAAAGAAGA AAACCAAATT ATAGTTCAAA TTTAGGTTTA AACTTTTGAA GCAAACTTTT TTTTATCCTT GTGCACTGCA GGCCTGGTAC TCAGATTTTG  CTATGAGGTT AATGAAGTAC CAAGCTGTGC TTGAATAACG ATATGTTTTC TCAGATTTTC TGTTGTACAG TTTAATTTAG CAGTCCATAT CACATTGCAA AAGTAGCAAT GACCTCATAA  AATACCTCTT CAAAATGCTT AAATTCATTT CACACATTAA TTTTATCTCA AGTCTTGAAG CCAATTCAGT AGGCGCATTG GAATCAAGCC TGGCTACCTG CATGCTGTTC CTTTTCTTTT  CTTCTTTTAG CCATTTTGCT AAGAGACACA GTCTTCTCAT CCCTTCATTT CTCCTATTTT GTTTTACTAG TTTTAAGATC AGAGTTCACT TTCTTTGGAC TCTGCCTATA TTTTCTTACC  TGAACTTTTG CAAGTTTTCA GGTAAACCTC AGCTCAGGAC TGCTATTTAG CTCCTCTTAA GAAGATTAAA AGAGAAAAAA AAGGCCCTTT TAAAAATAGT ATACACTTAT TTTAAGTGAA  AAGCAGAGAG TTTTATTTAT AGCTAATTTT AGCTATCTGT AACCAAGATG GCTGCAAAGA GGCTAGTGCC TCAGAGAGAA CTGTACGGGG TTTGTGACTG GAAAAAGTTA CGTTCCTGTT  CTAATTAATG CCCTTTCTTA TTTAAAAACA AAACCAAACG ATATCTAAGT AGTTCTCAGC AATAATAATA ATGATGATAA TACTTCTTTT CCACATCTCA TTGTCACTGA CATTTAATGG  TACTGTATAT TACTTAATTT ATTGAAGATT ATTATTTATG TCTTATTAGG ACACTATGGT TATAAACTGT GTTTAAGCCT ACAGTCATTG ATTTTTTTTT GTTATGTCAC AATCAGTATA  TTTTCTTTGG GGTTACCTCT CTGAATATTA TGTAAACAAT CCAAAGAAAT GATTGTATTA AGATTTGTGA ATAAATTTTT AGAAATCTGA TTGGTATATT GAGATATTTA AGGTTGAATG  TTTGTCCTTA GGATAGGCCT ATGTGCTAGC CCACAAAGAA TATTGTCTCA TTAGCCTGAA TGTGCCATAA GACTGACCTT TTAAAATGTT TTGAGGGATC TGTGGATGCT TCGTTAATTT  GTTCAGCCAC AATTTATTGA GAAAATATTC TGTGTCAAGC ACTGTGGGTT TTAATATTTT TAAATCAAAC GCTGATTACA GATAATAGTA TTTATATAAA TAATTGAAAA AAATTTCTTT  TAGGAAGAGG GAGAAAATGA AATAAATATC ATTAAAGATA AATAACTCAG GAGAATCTTC TTTACAATTT TATGTTTAGA ATGTTTAAGG TTAAGAAAGA AATAGTCAAT ATGCTTGTAT  AAAACACTGT TCACTGATTT TTTTTTTTAA ACTTGATTTG TTATTAACAT TGATCTGCTG ACAAAACCTG GGAATTTGGG TTGTGTATGT GAATGTTTCA GTGCCTCAGA CAAATGTGTA 
TTTAACTTAT GTAAAAGATA AGTCTGGAAA TAAATGTCTG TTTATTTTTG TACTATTTAA AAATTGACAG ATCTTTTCTG AAGATAAACT TTGATTGTTT CTATA 

Retrieve as FASTA