Entry information : OcuPxd02
Entry ID 7624
Creation 2010-10-01 (Marcel Zamocky)
Last sequence changes 2016-02-16 (Christophe Dunand)
Sequence status complete
Reviewer Christophe Dunand
Last annotation changes 2016-02-17 (Christophe Dunand)
Peroxidase information: OcuPxd02
Name OcuPxd02
Class Peroxidasin    [Orthogroup: Pxd001]
Taxonomy Eukaryota Metazoa Chordata Mammalia Leporidae Oryctolagus
Organism Oryctolagus cuniculus (Rabbit)    [TaxId: 9986 ]
Cellular localisation N/D
Tissue type N/D
Inducer N/D
Repressor N/D
Best BLASTp hits
Perox score E-value OcuPxd02
start..stop
S start..stop
PtroPxd01 2386 0 1..1467 1..1463
HsPxd02 2375 0 1..1467 1..1463
HsPxd03 2368 0 1..1467 1..1463
EcabPxd02 2314 0 1..1466 1..1467
Literature and cross-references OcuPxd02
Literature Broad Institute of MIT (unpublished since 2009)
DNA ref. GenBank:   NC_013671.1 (66580299..66061249)
mRNA ref. GenBank:   XM_002710472.1
Cluster/Prediction ref. Genebank:   100350152
Protein sequence: OcuPxd02
Sequence Properties
first value : protein
second value (mature protein)
Length (aa):   %s   1467 (1446)
PWM (Da):   %s   163391.77 (161088.6)  
PI (pH):   %s   6.75 (6.72) Peptide Signal:   %s   cut: 22 range:22-1467
Sequence
Send to BLAST
Send to Peroxiscan
*.........1 .........2 .........3 .........4 .........5 .........6 .........7 .........8 .........9 .........0 .........1 .........2
MEPRLLCLAT CFLLAARCLQ GLPCPSRCLC FKSTVRCMHL MLDHIPQAAQ QTTVLDLRFN RIREIPGSAF KKLKNLNTLL LNNNQIRKIS RNAFEGLENL LYLYLYKNEI HALDKQTFKG  LISLEQLYIH FNQIATLQPE TFEDLLKLER LFLHNNKLSK IPAGSFSHLD SLKRLRLDSN ALICDCDLLW LRELLQGYAQ TGQTQAAATC EYPQRLHGQS VASVPVEQFN CERPRITFEP  QDVEVTSGNT VYFTCRAEGN PKPKIIWIHN NHSLDLEYDP RLNMFDDGTL MIRNARESDQ GVYQCMARNS AGEAHTHNAV LRYSSLPAKP NFVIQPRDTE VLIGTSTTLE CMATGQPHPH  VTWTRGNGQE LDESRHVVTS SGLHLQNISL WDHGPFTCHA SNNQGSIQAT ASIIVQAPPQ FTIIPKDQVV LEDHAVEFPC EAEGSPRPVI VWTKAGRQLS LEGRHTVLSS GTLRIDHAAQ  HDQGQYECQA VSPLGVRKVS VQLTVKPKDL PVFTQLPQDM SIEVGRSINI SCHAHGEPQP IITWSKAGVQ ITESGKFHVD SGGTLTIYDA GQADQGRYEC VARNSFGLVV ASMFLGVTAT  QGRQAGDDFV ESSILDAVQR VDSAINSTRR HLFAQKPHTP SDLLALFRYP RDPFTVETAR AGEIFEQTLQ LIQERVKQGL TVDLEGREFH YNDLVSSRYL SLIANLSGCT AHRHQPNCSD  MCFHLKYRKA DGTCNNLRQP AWGAAHTAFV RLLQPAYENG LGSPRGAGRL PGSGRPPLPL PRLVSTELAG AATVRPDGSY THMLMQWGQF LDHDLDHTVP ALSTARFSDG QPCSSVCTDD  PPCFPIAFPH DDPRAGSAAC MFFARSSPVC GSGMTSLMMN SVYAREQINQ LTAYIDASNV YGSSERESQL LRDPSTPEGL LRTGVRWSAS GKHLLPFATG PPTECTVGDQ DSASPCFLAG  DHRANEQLAL TAMHTLWVRE HNRVATELSA LNPHWDGDTV YQEARKVVGA ELQHITYQQW LPKILGEPGM VLLGEYRGYD PNVNAGIFNA FATAAFRFGH TLVNPILYRL NDTFGEIPQG  HLPLHKAFFA PSRILDEGGI DPLLRGLFGV AAKAREPSRL LSLELTERLF AAAHAVALDL AATNVQRGRD HGIPPYGDFR VFCNLTSVES FEDLQHEIKN PEIRRKLEKL YSTPGDIDLW  PALMVEDLIP GTRVGPTLMC LLVIQFQRLR DGDRFWYENP GVFTPAQLTQ LKQVSLARVL CDNGDDIQQV QADVFVRAEY PQGYLSCSDI PKMDLRVWQD CCADCRSRGH LRTSTPESRK  RRSTQYSYPG KKHMDLSDIM IRQQDNLYVD EETRNVTLAG KTDFARDFSN FAVDIQKTIT VLRDQINKLE ARLRQAGCTD DKGIQRKDQE RWMREDCISC TCESGQVTCV VESCPPTPCS 
SPQLETGTCC PVCRRKQGVP TDAPERR 

Retrieve as FASTA  
Remarks Complete sequence from genomic (chromo 3, 22 introns). No EST.
CDS
Send to BLAST
.........1 .........2 .........3 .........4 .........5 .........6 .........7 .........8 .........9 .........0 .........1 .........2
ATGGAGCCCA GACTGCTCTG CTTGGCCACC TGCTTTCTCC TGGCTGCCCG GTGCCTGCAG GGGCTGCCCT GCCCCAGCCG GTGCCTTTGC TTTAAGAGCA CCGTCCGCTG CATGCACTTG  ATGCTGGACC ACATTCCTCA GGCAGCACAG CAGACCACAG TCCTAGACTT GAGATTTAAC AGAATAAGAG AAATTCCAGG GAGTGCCTTT AAGAAACTCA AGAATTTGAA CACCCTTCTG  CTGAACAACA ATCAAATCAG AAAGATTTCC AGAAATGCAT TTGAAGGACT GGAAAATTTG CTGTATCTGT ACCTATACAA GAATGAAATT CATGCACTAG ATAAGCAAAC ATTTAAAGGC  CTCATATCCT TGGAACAGCT GTATATTCAT TTCAACCAAA TAGCAACTCT ACAGCCAGAG ACCTTTGAAG ACCTTCTGAA ATTAGAGCGG CTATTTTTGC ATAACAACAA ATTATCTAAA  ATCCCAGCTG GGAGCTTTTC TCATTTGGAT TCATTAAAAA GACTGCGTCT GGACTCCAAT GCTCTGATTT GTGACTGTGA CCTTCTGTGG CTGAGGGAAC TCCTACAAGG CTATGCTCAA  ACTGGTCAAA CCCAGGCTGC TGCCACCTGT GAATATCCTC AAAGACTCCA TGGGCAGTCG GTTGCTTCAG TCCCAGTGGA GCAGTTCAAC TGTGAGCGTC CTCGGATTAC TTTTGAGCCC  CAAGATGTGG AGGTGACTTC AGGAAATACT GTCTACTTCA CTTGCCGGGC AGAAGGAAAT CCCAAACCTA AGATCATCTG GATACATAAC AACCACTCTC TGGATTTGGA ATACGACCCC  CGACTTAACA TGTTTGATGA TGGGACACTC ATGATCCGAA ATGCCAGAGA GTCAGATCAA GGGGTCTATC AGTGCATGGC GAGAAACTCG GCTGGGGAGG CCCACACGCA CAATGCTGTG  CTGAGATACT CCAGCCTTCC AGCCAAACCT AATTTTGTAA TCCAGCCCCG AGATACAGAG GTTTTAATTG GCACCAGCAC AACTTTGGAA TGTATGGCCA CAGGCCAGCC ACACCCTCAT  GTAACATGGA CCAGAGGCAA TGGACAGGAG CTGGATGAGT CCAGGCATGT GGTGACTTCC AGTGGACTTC ACCTACAGAA CATCTCGCTG TGGGATCACG GTCCATTCAC CTGCCACGCC  AGCAATAACC AAGGTTCTAT TCAAGCCACA GCAAGCATAA TTGTACAAGC TCCTCCGCAA TTCACAATTA TCCCTAAGGA TCAAGTTGTG CTGGAAGATC ATGCTGTGGA ATTTCCTTGT  GAAGCAGAAG GCAGTCCACG CCCAGTAATT GTCTGGACAA AAGCAGGGAG ACAGCTGTCC CTTGAAGGCC GGCATACAGT TCTCTCCTCT GGCACTTTGA GAATTGACCA CGCGGCCCAG  CACGATCAAG GCCAATACGA ATGCCAAGCA GTCAGTCCAC TGGGAGTGAG AAAAGTGTCT GTCCAGCTGA CCGTAAAACC CAAAGATCTC CCGGTGTTTA CTCAACTTCC TCAGGACATG  AGCATTGAGG TTGGAAGGAG TATAAACATC TCCTGTCATG CTCACGGAGA ACCGCAGCCC ATAATTACGT GGAGTAAGGC AGGTGTACAG ATCACTGAGA GTGGTAAGTT CCATGTTGAC  AGTGGAGGCA CGCTGACCAT CTATGATGCT GGGCAAGCTG ATCAAGGAAG ATACGAGTGT GTGGCTCGAA ATTCATTTGG CCTTGTTGTG GCCAGTATGT TTCTTGGAGT TACTGCAACC  CAGGGTAGAC AAGCTGGCGA TGACTTTGTG GAATCATCCA TTCTTGATGC TGTACAGAGA GTTGACAGTG CAATTAACTC AACACGAAGA CATTTGTTTG CACAAAAACC TCACACCCCC  AGTGACCTGC TGGCTCTGTT TCGCTACCCT CGTGACCCAT TTACTGTGGA GACGGCGAGA GCGGGGGAAA TTTTTGAGCA GACCCTGCAG CTGATTCAGG AACGTGTGAA GCAGGGGCTC  ACTGTTGATC TGGAAGGCAG AGAATTCCAC TACAACGACC TGGTGTCTTC GCGATACCTT AGCCTCATCG CCAATCTATC GGGATGCACG GCCCACAGGC ATCAGCCCAA CTGCTCTGAC  ATGTGCTTCC ACCTAAAGTA CCGCAAGGCT GACGGCACTT GCAACAACCT GCGGCAGCCC GCGTGGGGAG CGGCGCACAC GGCCTTCGTG CGCCTGCTGC AACCTGCATA TGAGAACGGC  CTGGGTTCGC CACGTGGTGC CGGGCGTCTT CCTGGCTCTG GCCGCCCTCC GCTCCCGCTG CCCAGGCTGG TTTCTACCGA GCTGGCTGGT GCAGCGACGG TCAGACCCGA TGGCAGCTAC  ACACACATGC TCATGCAGTG GGGCCAGTTT CTAGACCACG ACTTGGACCA CACGGTGCCT GCGCTGAGCA CCGCGCGCTT CTCCGATGGG CAGCCCTGCA GCTCTGTCTG CACCGACGAC  CCTCCGTGCT TCCCCATCGC CTTCCCGCAC GATGACCCCC GGGCCGGCAG CGCAGCCTGC ATGTTCTTTG CACGCTCCAG CCCCGTGTGC GGCAGCGGCA TGACCTCCCT GATGATGAAC  TCGGTGTATG CCCGGGAGCA GATCAACCAG CTCACAGCCT ACATCGACGC CTCCAACGTC TACGGGAGCT CAGAGAGGGA ATCCCAGCTG CTCAGGGACC CCTCCACACC CGAGGGCCTG  CTGAGGACCG GCGTGCGGTG GTCTGCCTCC GGGAAGCATC TACTCCCCTT TGCCACGGGA CCCCCTACGG AGTGCACAGT TGGTGATCAG GACAGCGCCA GTCCCTGCTT CCTGGCCGGT  GACCACCGCG CCAACGAGCA GCTGGCTCTC ACGGCCATGC ACACCCTGTG GGTCCGCGAA CACAACCGGG TGGCTACCGA GCTGTCCGCG CTCAACCCGC ACTGGGATGG GGACACGGTT  TACCAGGAGG CCCGGAAGGT GGTGGGCGCC GAGCTGCAGC ACATCACCTA CCAGCAGTGG CTGCCCAAGA TCCTGGGGGA GCCCGGCATG GTGCTGCTGG GGGAGTACCG GGGCTATGAC  CCCAACGTGA ACGCGGGAAT CTTCAACGCC TTTGCCACCG CAGCTTTTAG ATTTGGCCAC ACGTTGGTCA ACCCCATTCT GTATCGGCTG AACGACACGT TTGGTGAGAT TCCCCAAGGC  CACCTGCCAC TGCACAAGGC TTTCTTCGCC CCGTCTAGAA TCCTGGATGA GGGCGGGATA GACCCCCTGC TCCGGGGCCT GTTTGGGGTG GCCGCAAAGG CGCGGGAGCC TTCTCGGCTG  CTCAGCCTGG AACTCACCGA GAGGCTCTTC GCCGCCGCGC ACGCCGTGGC CCTGGATCTG GCCGCCACCA ATGTGCAAAG GGGCCGAGAC CACGGCATCC CACCCTACGG GGACTTCAGA  GTCTTCTGCA ACTTGACCTC CGTGGAGAGC TTTGAGGATC TGCAACACGA AATCAAAAAT CCTGAGATTC GACGGAAACT GGAAAAGTTG TACAGCACTC CAGGTGACAT TGACTTGTGG  CCCGCCCTTA TGGTTGAAGA TCTGATCCCT GGGACGAGAG TGGGACCAAC ACTCATGTGT CTGTTGGTCA TCCAGTTTCA ACGGCTAAGA GATGGAGATA GGTTCTGGTA TGAAAACCCT  GGCGTGTTCA CCCCTGCACA ACTCACTCAG CTCAAGCAAG TGTCCCTGGC CCGAGTGCTT TGTGACAACG GCGATGACAT TCAGCAAGTC CAGGCAGACG TCTTTGTAAG GGCAGAATAC  CCACAGGGTT ACCTGAGCTG TAGTGACATC CCGAAGATGG ATTTGCGAGT GTGGCAAGAC TGCTGTGCAG ACTGCAGGAG TAGAGGACAC CTGAGGACAT CCACTCCAGA ATCTCGAAAG  AGACGCTCTA CTCAATACAG CTATCCTGGT AAAAAACATA TGGACTTAAG TGATATAATG ATCAGGCAAC AAGATAACTT GTACGTGGAT GAAGAAACTA GAAATGTGAC ACTTGCGGGA  AAAACAGATT TTGCTCGGGA TTTCAGCAAC TTTGCAGTGG ATATTCAAAA GACCATCACA GTGCTCAGAG ACCAGATAAA CAAGCTGGAG GCACGCCTGA GGCAGGCAGG ATGCACAGAT  GATAAAGGGA TTCAAAGGAA GGACCAGGAA CGCTGGATGA GAGAAGACTG CATTAGCTGC ACCTGTGAGA GTGGCCAAGT CACGTGTGTG GTGGAGAGTT GCCCCCCAAC TCCATGTTCC 
AGTCCTCAAC TGGAGACAGG TACCTGTTGT CCAGTTTGCA GAAGAAAGCA AGGGGTGCCA ACTGATGCCC CAGAGAGGCG CTGA 

Retrieve as FASTA