Entry information : SarcCP01
Entry ID 13540
Creation 2016-02-29 (Mbadinga)
Last sequence changes 2016-03-01 (Christophe Dunand)
Sequence status complete
Reviewer Mbadinga
Last annotation changes 2016-03-01 (Mbadinga)
Peroxidase information: SarcCP01
Name SarcCP01
Class Catalase peroxidase    [Orthogroup: CP002]
Taxonomy Eukaryota Ichthyosporea Sphaeroforma
Organism Sphaeroforma arctica    [TaxId: 72019 ]
Cellular localisation N/D
Tissue type N/D
Inducer N/D
Repressor N/D
Best BLASTp hits
Perox score E-value SarcCP01
start..stop
S start..stop
PiCP01 712 0 17..667 24..685
PsojCP 705 0 8..667 12..682
PcapCP02 701 0 1..667 1..682
PsojCP02 692 0 7..667 8..681
Gene structure Fichierperl './assets/cgi-bin/draw_exon.pl' '13540' 'join(79..2085)' Exons
ExonStart..EndSize ExonStart..EndSize ExonStart..EndSize ExonStart..EndSize
N° 1 79..2085 2005  
join(79..2085)


exon

Literature and cross-references SarcCP01
DNA ref. GenBank:   NW_014039929.1
mRNA ref. GenBank:   XM_014298343
Cluster/Prediction ref. Genebank:   25908211
Protein sequence: SarcCP01
Sequence Properties
first value : protein
second value (mature protein)
Length (aa):   %s   668 (650)
PWM (Da):   %s   73142.86 (71080.9)  
PI (pH):   %s   4.38 (4.31) Peptide Signal:   %s   cut: 19 range:19-668
Sequence
Send to BLAST
Send to Peroxiscan
*.........1 .........2 .........3 .........4 .........5 .........6 .........7 .........8 .........9 .........0 .........1 .........2
MHYRQFFFAA VGAAHVSALC PHFAAQRTAA EHILQQKQHI RVARATDDYS GMDSYGDVMT DIAALLTDSQ SSWPADFGNY GPFMIRLAWH CSGSYRTSDG RGGCAGARIR FGPEADWEDN  ANLDQARKPL ESVKEKYGDD LSWGDLIVLT GNVAIESMGG PSLNFCGGRV DAEDGLESVP LGPSTYQEEL ASCEVNGQCE APLGPTTIGL IYVNPEGPMG IPDSVGSAAD IRSSFGRMGM  NDRETVALIG GGHAFGKAHG ACKSPPCGSG AMEGKGPNTF TSGFEGAWTN NPTKWDNAYF NNLVTYNWTK VDGPGGHVQW EAEELPGLMM LTSDIALIND EYYLPLVMEF ATDQDALDKA  FSDAWYKLTS RDMGPAARCK GDKVLYPPAL FQNPLPKSQS DNVDFEEVNK MIKEIMYTES NALRPDRNAK GEPYYGAYFV TLAYQCASTF RTTDYSGGCN GASIRFQPQK FWPRNIDLDK  VMDVLRPVEK QFKDLSWADL IVAAGHAALV DAGGLDLQFK GGRSDAINGD YAATSELRDY YLNPMIANED NANVMGLTAE EFVALAARPR SASHEHTLGY VGSYTGNPSV LSNEYFQLLL 
NEDWVLVSDL ENGYKAKSKG LYMEDYDLAL LDDPDMKAAV EKFAMDEDAF MQAFTSAWEY LMNADRFA* 

Retrieve as FASTA  
Remarks Complete sequence from genomic (no intron).
DNA
Send to BLAST
.........1 .........2 .........3 .........4 .........5 .........6 .........7 .........8 .........9 .........0 .........1 .........2
ATGCACTACA GACAATTCTT CTTCGCGGCT GTGGGCGCTG CACATGTAAG TGCACTATGC CCCCATTTCG CGGCACAGAG AACTGCTGCT GAACATATTT TACAGCAAAA GCAGCACATA  CGAGTTGCGC GGGCCACCGA TGATTATAGT GGCATGGACT CATATGGGGA CGTCATGACA GACATTGCGG CACTCCTAAC CGACTCACAG TCGTCCTGGC CTGCCGATTT TGGAAACTAT  GGACCTTTCA TGATTCGACT AGCCTGGCAT TGCTCTGGTT CATATCGTAC TTCGGACGGT CGTGGAGGCT GTGCTGGAGC GCGCATCAGA TTTGGCCCAG AAGCTGACTG GGAAGACAAC  GCCAATCTTG ACCAGGCGCG TAAGCCACTG GAGTCTGTAA AGGAGAAGTA TGGTGACGAT CTCTCCTGGG GTGATCTAAT AGTTTTGACA GGGAATGTTG CTATCGAGAG CATGGGTGGG  CCATCTCTGA ACTTCTGCGG GGGTCGTGTT GATGCGGAAG ATGGATTAGA GAGTGTGCCA CTCGGACCGT CCACATACCA AGAAGAGCTT GCGTCGTGCG AAGTGAATGG TCAGTGTGAG  GCTCCCCTCG GACCCACTAC AATTGGGTTG ATCTACGTCA ATCCAGAAGG ACCCATGGGG ATTCCTGATT CCGTGGGTAG TGCTGCAGAT ATACGCTCAT CTTTCGGACG CATGGGTATG  AATGACCGCG AGACCGTCGC ACTGATCGGT GGTGGACACG CATTCGGTAA AGCACATGGA GCCTGCAAGA GCCCGCCATG TGGATCAGGC GCAATGGAAG GCAAAGGACC CAATACTTTT  ACAAGTGGGT TTGAGGGAGC ATGGACAAAC AATCCAACAA AATGGGATAA TGCATACTTC AACAACCTAG TCACCTACAA TTGGACCAAA GTCGATGGAC CCGGTGGCCA CGTCCAATGG  GAAGCTGAGG AGCTACCTGG TTTGATGATG CTCACATCCG ACATTGCTCT CATTAATGAC GAGTACTACT TGCCATTGGT AATGGAATTT GCCACCGATC AGGACGCATT AGATAAAGCA  TTCAGTGATG CGTGGTACAA GTTAACATCC CGTGATATGG GTCCAGCTGC ACGGTGTAAG GGGGACAAGG TGTTATATCC ACCAGCACTA TTCCAAAATC CATTGCCCAA GTCGCAGTCT  GACAACGTAG ATTTCGAGGA GGTCAATAAG ATGATCAAAG AGATTATGTA CACTGAGTCC AATGCCCTTA GACCAGACAG AAACGCAAAG GGTGAGCCCT ACTATGGCGC ATACTTTGTC  ACGCTTGCCT ACCAGTGCGC ATCTACATTC AGAACTACAG ATTACAGTGG AGGATGCAAC GGGGCGAGCA TTCGATTTCA ACCACAAAAA TTTTGGCCTC GGAATATAGA CTTGGACAAA  GTGATGGACG TACTGCGACC TGTTGAAAAA CAGTTCAAGG ACCTCTCTTG GGCTGATTTG ATTGTTGCTG CTGGTCATGC AGCGCTTGTA GATGCGGGCG GATTAGATTT ACAGTTCAAA  GGCGGACGTT CGGACGCAAT CAACGGTGAC TACGCAGCTA CGTCAGAACT TCGAGATTAT TATTTGAACC CGATGATAGC CAATGAAGAC AATGCAAACG TTATGGGACT CACTGCCGAA  GAGTTCGTCG CGCTCGCTGC ACGCCCTCGT AGTGCCTCTC ATGAGCATAC GCTCGGGTAT GTAGGTTCAT ACACAGGCAA TCCCTCAGTA CTTTCTAACG AATACTTCCA ACTTCTGCTC  AATGAAGATT GGGTTTTGGT CTCTGACCTA GAGAATGGAT ACAAGGCCAA AAGCAAGGGA CTGTATATGG AAGACTACGA TCTGGCGTTA CTAGACGACC CCGATATGAA AGCCGCTGTT 
GAAAAGTTTG CAATGGACGA AGATGCCTTC ATGCAGGCAT TTACATCTGC TTGGGAGTAT CTGATGAATG CCGACAGATT TGCATAA 

Retrieve as FASTA  
CDS
Send to BLAST
.........1 .........2 .........3 .........4 .........5 .........6 .........7 .........8 .........9 .........0 .........1 .........2
ATGCACTACA GACAATTCTT CTTCGCGGCT GTGGGCGCTG CACATGTAAG TGCACTATGC CCCCATTTCG CGGCACAGAG AACTGCTGCT GAACATATTT TACAGCAAAA GCAGCACATA  CGAGTTGCGC GGGCCACCGA TGATTATAGT GGCATGGACT CATATGGGGA CGTCATGACA GACATTGCGG CACTCCTAAC CGACTCACAG TCGTCCTGGC CTGCCGATTT TGGAAACTAT  GGACCTTTCA TGATTCGACT AGCCTGGCAT TGCTCTGGTT CATATCGTAC TTCGGACGGT CGTGGAGGCT GTGCTGGAGC GCGCATCAGA TTTGGCCCAG AAGCTGACTG GGAAGACAAC  GCCAATCTTG ACCAGGCGCG TAAGCCACTG GAGTCTGTAA AGGAGAAGTA TGGTGACGAT CTCTCCTGGG GTGATCTAAT AGTTTTGACA GGGAATGTTG CTATCGAGAG CATGGGTGGG  CCATCTCTGA ACTTCTGCGG GGGTCGTGTT GATGCGGAAG ATGGATTAGA GAGTGTGCCA CTCGGACCGT CCACATACCA AGAAGAGCTT GCGTCGTGCG AAGTGAATGG TCAGTGTGAG  GCTCCCCTCG GACCCACTAC AATTGGGTTG ATCTACGTCA ATCCAGAAGG ACCCATGGGG ATTCCTGATT CCGTGGGTAG TGCTGCAGAT ATACGCTCAT CTTTCGGACG CATGGGTATG  AATGACCGCG AGACCGTCGC ACTGATCGGT GGTGGACACG CATTCGGTAA AGCACATGGA GCCTGCAAGA GCCCGCCATG TGGATCAGGC GCAATGGAAG GCAAAGGACC CAATACTTTT  ACAAGTGGGT TTGAGGGAGC ATGGACAAAC AATCCAACAA AATGGGATAA TGCATACTTC AACAACCTAG TCACCTACAA TTGGACCAAA GTCGATGGAC CCGGTGGCCA CGTCCAATGG  GAAGCTGAGG AGCTACCTGG TTTGATGATG CTCACATCCG ACATTGCTCT CATTAATGAC GAGTACTACT TGCCATTGGT AATGGAATTT GCCACCGATC AGGACGCATT AGATAAAGCA  TTCAGTGATG CGTGGTACAA GTTAACATCC CGTGATATGG GTCCAGCTGC ACGGTGTAAG GGGGACAAGG TGTTATATCC ACCAGCACTA TTCCAAAATC CATTGCCCAA GTCGCAGTCT  GACAACGTAG ATTTCGAGGA GGTCAATAAG ATGATCAAAG AGATTATGTA CACTGAGTCC AATGCCCTTA GACCAGACAG AAACGCAAAG GGTGAGCCCT ACTATGGCGC ATACTTTGTC  ACGCTTGCCT ACCAGTGCGC ATCTACATTC AGAACTACAG ATTACAGTGG AGGATGCAAC GGGGCGAGCA TTCGATTTCA ACCACAAAAA TTTTGGCCTC GGAATATAGA CTTGGACAAA  GTGATGGACG TACTGCGACC TGTTGAAAAA CAGTTCAAGG ACCTCTCTTG GGCTGATTTG ATTGTTGCTG CTGGTCATGC AGCGCTTGTA GATGCGGGCG GATTAGATTT ACAGTTCAAA  GGCGGACGTT CGGACGCAAT CAACGGTGAC TACGCAGCTA CGTCAGAACT TCGAGATTAT TATTTGAACC CGATGATAGC CAATGAAGAC AATGCAAACG TTATGGGACT CACTGCCGAA  GAGTTCGTCG CGCTCGCTGC ACGCCCTCGT AGTGCCTCTC ATGAGCATAC GCTCGGGTAT GTAGGTTCAT ACACAGGCAA TCCCTCAGTA CTTTCTAACG AATACTTCCA ACTTCTGCTC  AATGAAGATT GGGTTTTGGT CTCTGACCTA GAGAATGGAT ACAAGGCCAA AAGCAAGGGA CTGTATATGG AAGACTACGA TCTGGCGTTA CTAGACGACC CCGATATGAA AGCCGCTGTT 
GAAAAGTTTG CAATGGACGA AGATGCCTTC ATGCAGGCAT TTACATCTGC TTGGGAGTAT CTGATGAATG CCGACAGATT TGCATAA 

Retrieve as FASTA  
cDNA
Send to BLAST
.........1 .........2 .........3 .........4 .........5 .........6 .........7 .........8 .........9 .........0 .........1 .........2
TTATCACGTA CTTCACTGTT CTATCACATT ACTTTCTCGG AAACGTAAAC CAATATATAA ATTCTCTGAT TTTTCACCAT GCACTACAGA CAATTCTTCT TCGCGGCTGT GGGCGCTGCA  CATGTAAGTG CACTATGCCC CCATTTCGCG GCACAGAGAA CTGCTGCTGA ACATATTTTA CAGCAAAAGC AGCACATACG AGTTGCGCGG GCCACCGATG ATTATAGTGG CATGGACTCA  TATGGGGACG TCATGACAGA CATTGCGGCA CTCCTAACCG ACTCACAGTC GTCCTGGCCT GCCGATTTTG GAAACTATGG ACCTTTCATG ATTCGACTAG CCTGGCATTG CTCTGGTTCA  TATCGTACTT CGGACGGTCG TGGAGGCTGT GCTGGAGCGC GCATCAGATT TGGCCCAGAA GCTGACTGGG AAGACAACGC CAATCTTGAC CAGGCGCGTA AGCCACTGGA GTCTGTAAAG  GAGAAGTATG GTGACGATCT CTCCTGGGGT GATCTAATAG TTTTGACAGG GAATGTTGCT ATCGAGAGCA TGGGTGGGCC ATCTCTGAAC TTCTGCGGGG GTCGTGTTGA TGCGGAAGAT  GGATTAGAGA GTGTGCCACT CGGACCGTCC ACATACCAAG AAGAGCTTGC GTCGTGCGAA GTGAATGGTC AGTGTGAGGC TCCCCTCGGA CCCACTACAA TTGGGTTGAT CTACGTCAAT  CCAGAAGGAC CCATGGGGAT TCCTGATTCC GTGGGTAGTG CTGCAGATAT ACGCTCATCT TTCGGACGCA TGGGTATGAA TGACCGCGAG ACCGTCGCAC TGATCGGTGG TGGACACGCA  TTCGGTAAAG CACATGGAGC CTGCAAGAGC CCGCCATGTG GATCAGGCGC AATGGAAGGC AAAGGACCCA ATACTTTTAC AAGTGGGTTT GAGGGAGCAT GGACAAACAA TCCAACAAAA  TGGGATAATG CATACTTCAA CAACCTAGTC ACCTACAATT GGACCAAAGT CGATGGACCC GGTGGCCACG TCCAATGGGA AGCTGAGGAG CTACCTGGTT TGATGATGCT CACATCCGAC  ATTGCTCTCA TTAATGACGA GTACTACTTG CCATTGGTAA TGGAATTTGC CACCGATCAG GACGCATTAG ATAAAGCATT CAGTGATGCG TGGTACAAGT TAACATCCCG TGATATGGGT  CCAGCTGCAC GGTGTAAGGG GGACAAGGTG TTATATCCAC CAGCACTATT CCAAAATCCA TTGCCCAAGT CGCAGTCTGA CAACGTAGAT TTCGAGGAGG TCAATAAGAT GATCAAAGAG  ATTATGTACA CTGAGTCCAA TGCCCTTAGA CCAGACAGAA ACGCAAAGGG TGAGCCCTAC TATGGCGCAT ACTTTGTCAC GCTTGCCTAC CAGTGCGCAT CTACATTCAG AACTACAGAT  TACAGTGGAG GATGCAACGG GGCGAGCATT CGATTTCAAC CACAAAAATT TTGGCCTCGG AATATAGACT TGGACAAAGT GATGGACGTA CTGCGACCTG TTGAAAAACA GTTCAAGGAC  CTCTCTTGGG CTGATTTGAT TGTTGCTGCT GGTCATGCAG CGCTTGTAGA TGCGGGCGGA TTAGATTTAC AGTTCAAAGG CGGACGTTCG GACGCAATCA ACGGTGACTA CGCAGCTACG  TCAGAACTTC GAGATTATTA TTTGAACCCG ATGATAGCCA ATGAAGACAA TGCAAACGTT ATGGGACTCA CTGCCGAAGA GTTCGTCGCG CTCGCTGCAC GCCCTCGTAG TGCCTCTCAT  GAGCATACGC TCGGGTATGT AGGTTCATAC ACAGGCAATC CCTCAGTACT TTCTAACGAA TACTTCCAAC TTCTGCTCAA TGAAGATTGG GTTTTGGTCT CTGACCTAGA GAATGGATAC  AAGGCCAAAA GCAAGGGACT GTATATGGAA GACTACGATC TGGCGTTACT AGACGACCCC GATATGAAAG CCGCTGTTGA AAAGTTTGCA ATGGACGAAG ATGCCTTCAT GCAGGCATTT  ACATCTGCTT GGGAGTATCT GATGAATGCC GACAGATTTG CATAAGGTTC AAGCTGTTCT GTCAAGTTCC AGCTTATGTT ATGTTCTCGT TCCCATTTGA GAATGATTAT TGAAGTTTTA 
TCGATAATTA TTCAGTAATA AATACCAATG ACGAG 

Retrieve as FASTA