ensembl: variant_effect_predictor/Bio/Tools/OddCodes.pm annotate

annotate variant_effect_predictor/Bio/Tools/OddCodes.pm @ 3:d30fa12e4cc5 default tip

Merge heads 2:a5976b2dce6f and 1:09613ce8151e which were created as a result of a recently fixed bug.

author	devteam <devteam@galaxyproject.org>
date	Mon, 13 Jan 2014 10:38:30 -0500
parents	1f6dce3d34e0
children

rev	line source
0 1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	1 #$Id: OddCodes.pm,v 1.10.2.1 2003/04/07 04:27:42 heikki Exp $
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	2 #-----------------------------------------------------------------------------
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	3 # PACKAGE : OddCodes.pm
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	4 # PURPOSE : To write amino acid sequences in alternative alphabets
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	5 # AUTHOR : Derek Gatherer (D.Gatherer@organon.nhe.akzonobel.nl)
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	6 # SOURCE :
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	7 # CREATED : 8th July 2000
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	8 # MODIFIED :
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	9 # DISCLAIMER : I am employed in the pharmaceutical industry but my
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	10 # : employers do not endorse or sponsor this module
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	11 # : in any way whatsoever. The above email address is
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	12 # : given purely for the purpose of easy communication
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	13 # : with the author, and does not imply any connection
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	14 # : between my employers and anything written below.
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	15 # LICENCE : You may distribute this module under the same terms
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	16 # : as the rest of BioPerl.
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	17 #----------------------------------------------------------------------------
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	18
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	19 =head1 NAME
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	20
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	21 Bio::Tools::OddCodes - Object holding alternative alphabet coding for
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	22 one protein sequence
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	23
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	24 =head1 SYNOPSIS
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	25
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	26 Take a sequence object from eg, an inputstream, and creates an object
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	27 for the purposes of rewriting that sequence in another alphabet.
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	28 These are abbreviated amino acid sequence alphabets, designed to
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	29 simplify the statistical aspects of analysing protein sequences, by
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	30 reducing the combinatorial explosion of the 20-letter alphabet. These
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	31 abbreviated alphabets range in size from 2 to 8.
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	32
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	33 Creating the OddCodes object, eg:
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	34
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	35 my $inputstream = Bio::SeqIO->new( '-file' => "seqfile",
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	36 '-format' => 'Fasta');
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	37 my $seqobj = $inputstream->next_seq();
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	38 my $oddcode_obj = Bio::Tools::Oddcodes->new(-seq => $seqobj);
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	39
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	40 or:
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	41
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	42 my $seqobj = Bio::PrimarySeq->new
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	43 (-seq=>'[cut and paste a sequence here]',
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	44 -alphabet => 'protein',
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	45 -id => 'test');
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	46 my $oddcode_obj = Bio::Tools::OddCodes->new(-seq => $seqobj);
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	47
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	48 do the alternative coding, returning the answer as a reference to a string
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	49
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	50 my $output = $oddcode_obj->structural();
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	51 my $output = $oddcode_obj->chemical();
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	52 my $output = $oddcode_obj->functional();
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	53 my $output = $oddcode_obj->charge();
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	54 my $output = $oddcode_obj->hydrophobic();
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	55 my $output = $oddcode_obj->Dayhoff();
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	56 my $output = $oddcode_obj->Sneath();
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	57 my $output = $oddcode_obj->Stanfel();
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	58
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	59
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	60 display sequence in new form, eg:
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	61
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	62 my $new_coding = $$output;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	63 print "\n$new_coding";
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	64
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	65 =head1 DESCRIPTION
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	66
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	67 Bio::Tools::Oddcodes is a welterweight object for rewriting a protein
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	68 sequence in an alternative alphabet. 8 of these are provided, ranging
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	69 from the the 2-letter hydrophobic alphabet, to the 8-letter chemical
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	70 alphabet. These are useful for the statistical analysis of protein
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	71 sequences since they can partially avoid the combinatorial explosion
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	72 produced by the full 20-letter alphabet (eg. 400 dimers, 8000 trimers
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	73 etc.)
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	74
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	75 The objects will print out a warning if the input sequence is not a
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	76 protein. If you know what you are doing, you can silence the warning
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	77 by setting verbose() to a negetive value.
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	78
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	79 See Synopsis above for object creation code.
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	80
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	81 =head1 FEEDBACK
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	82
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	83 =head2 Mailing Lists
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	84
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	85 User feedback is an integral part of the evolution of this
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	86 and other Bioperl modules. Send your comments and suggestions preferably
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	87 to one of the Bioperl mailing lists.
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	88 Your participation is much appreciated.
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	89
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	90 bioperl-l@bioperl.org - General discussion
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	91 http://www.bioperl.org/MailList.html - About the mailing lists
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	92
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	93 =head2 Reporting Bugs
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	94
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	95 Report bugs to the Bioperl bug tracking system to help us keep track
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	96 the bugs and their resolution. Bug reports can be submitted via email
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	97 or the web:
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	98
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	99 bioperl-bugs@bioperl.org
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	100 http://www.bugzilla.bioperl.org/
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	101
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	102 =head1 AUTHOR
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	103
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	104 Derek Gatherer
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	105
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	106 =head1 APPENDIX
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	107
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	108 The rest of the documentation details each of the object methods.
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	109 Internal methods are usually preceded with a _
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	110
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	111 =cut
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	112
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	113 #'
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	114
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	115 package Bio::Tools::OddCodes;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	116 use vars qw(@ISA);
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	117 use strict;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	118
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	119 use Bio::Root::Root;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	120
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	121 @ISA = qw(Bio::Root::Root);
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	122
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	123
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	124 sub new
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	125 {
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	126 my($class,@args) = @_;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	127
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	128 my $self = $class->SUPER::new(@args);
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	129
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	130 my ($seqobj) = $self->_rearrange([qw(SEQ)],@args);
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	131 if((! defined($seqobj)) && @args && ref($args[0])) {
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	132 # parameter not passed as named parameter?
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	133 $seqobj = $args[0];
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	134 }
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	135 unless ($seqobj->isa("Bio::PrimarySeqI"))
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	136 {
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	137 die("die in _init, OddCodes works only on PrimarySeqI
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	138 objects\n");
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	139 }
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	140
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	141 $self->{'_seqref'} = $seqobj;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	142
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	143 return $self;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	144 }
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	145
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	146 =head2 structural
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	147
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	148 Title : structural
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	149 Usage : $output = $oddcode_obj->structural();
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	150 Function: turns amino acid sequence into 3-letter structural alphabet
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	151 : A (ambivalent), E (external), I (internal)
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	152 Example : a sequence ACDEFGH will become AAEEIAE
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	153 Returns : Reference to the new sequence string
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	154 Args : none
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	155
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	156 =cut
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	157
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	158 sub structural()
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	159 {
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	160 my $self = $_[0];
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	161 my $seqstring = &_pullseq($self); # see _pullseq() below
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	162
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	163 # now the real business
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	164
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	165 $seqstring =~ tr/[ACGPSTWY]/1/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	166 $seqstring =~ tr/[RNDQEHK]/2/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	167 $seqstring =~ tr/[ILMFV]/3/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	168 $seqstring =~ tr/1/A/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	169 $seqstring =~ tr/2/E/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	170 $seqstring =~ tr/3/I/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	171
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	172 return \$seqstring;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	173
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	174 # and that's that one
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	175 }
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	176
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	177 =head2 functional
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	178
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	179 Title : functional
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	180 Usage : $output = $oddcode_obj->functional();
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	181 Function: turns amino acid sequence into 4-letter functional alphabet
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	182 : A (acidic), C (basic), H (hydrophobic), P (polar)
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	183 Example : a sequence ACDEFGH will become HPAAHHC
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	184 Returns : Reference to the new sequence string
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	185 Args : none
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	186
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	187 =cut
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	188
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	189 sub functional()
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	190 {
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	191 my $self = $_[0];
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	192 my $seqstring = &_pullseq($self);
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	193
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	194 # now the real business
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	195
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	196 $seqstring =~ tr/[DE]/1/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	197 $seqstring =~ tr/[HKR]/2/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	198 $seqstring =~ tr/[AFILMPVW]/3/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	199 $seqstring =~ tr/[CGNQSTY]/4/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	200 $seqstring =~ tr/1/A/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	201 $seqstring =~ tr/2/C/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	202 $seqstring =~ tr/3/H/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	203 $seqstring =~ tr/4/P/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	204
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	205 return \$seqstring;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	206
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	207 # and that's that one
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	208 }
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	209
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	210 =head2 hydrophobic
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	211
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	212 Title : hydrophobic
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	213 Usage : $output = $oddcode_obj->hydrophobic();
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	214 Function: turns amino acid sequence into 2-letter hydrophobicity alphabet
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	215 : O (hydrophobic), I (hydrophilic)
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	216 Example : a sequence ACDEFGH will become OIIIOII
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	217 Returns : Reference to the new sequence string
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	218 Args : none
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	219
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	220 =cut
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	221
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	222 sub hydrophobic()
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	223 {
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	224 my $self = $_[0];
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	225 my $seqstring = &_pullseq($self);
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	226
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	227 # now the real business
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	228
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	229 $seqstring =~ tr/[AFILMPVW]/1/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	230 $seqstring =~ tr/[CDEGHKNQRSTY]/2/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	231 $seqstring =~ tr/1/I/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	232 $seqstring =~ tr/2/O/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	233
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	234 return \$seqstring;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	235
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	236 # and that's that one
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	237 }
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	238
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	239 =head2 Dayhoff
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	240
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	241 Title : Dayhoff
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	242 Usage : $output = $oddcode_obj->Dayhoff();
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	243 Function: turns amino acid sequence into 6-letter Dayhoff alphabet
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	244 Example : a sequence ACDEFGH will become CADDGCE
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	245 Returns : Reference to the new sequence string
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	246 Args : none
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	247
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	248 =cut
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	249
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	250 sub Dayhoff()
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	251 {
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	252 my $self = $_[0];
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	253 my $seqstring = &_pullseq($self);
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	254
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	255 # now the real business
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	256
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	257 $seqstring =~ tr/[C]/1/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	258 $seqstring =~ tr/[AGPST]/2/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	259 $seqstring =~ tr/[DENQ]/3/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	260 $seqstring =~ tr/[HKR]/4/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	261 $seqstring =~ tr/[ILMV]/5/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	262 $seqstring =~ tr/[FWY]/6/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	263 $seqstring =~ tr/1/A/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	264 $seqstring =~ tr/2/C/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	265 $seqstring =~ tr/3/D/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	266 $seqstring =~ tr/4/E/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	267 $seqstring =~ tr/5/F/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	268 $seqstring =~ tr/6/G/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	269
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	270 return \$seqstring;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	271
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	272 # and that's that one
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	273 }
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	274
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	275 =head2 Sneath
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	276
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	277 Title : Sneath
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	278 Usage : $output = $oddcode_obj->Sneath();
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	279 Function: turns amino acid sequence into 7-letter Sneath alphabet
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	280 Example : a sequence ACDEFGH will become CEFFHCF
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	281 Returns : Reference to the new sequence string
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	282 Args : none
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	283
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	284 =cut
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	285
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	286 sub Sneath()
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	287 {
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	288 my $self = $_[0];
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	289 my $seqstring = &_pullseq($self);
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	290
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	291 # now the real business
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	292
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	293 $seqstring =~ tr/[ILV]/1/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	294 $seqstring =~ tr/[AGP]/2/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	295 $seqstring =~ tr/[MNQ]/3/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	296 $seqstring =~ tr/[CST]/4/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	297 $seqstring =~ tr/[DE]/5/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	298 $seqstring =~ tr/[KR]/6/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	299 $seqstring =~ tr/[FHWY]/7/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	300 $seqstring =~ tr/1/A/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	301 $seqstring =~ tr/2/C/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	302 $seqstring =~ tr/3/D/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	303 $seqstring =~ tr/4/E/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	304 $seqstring =~ tr/5/F/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	305 $seqstring =~ tr/6/G/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	306 $seqstring =~ tr/7/H/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	307
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	308 return \$seqstring;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	309
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	310 # and that's that one
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	311 }
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	312
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	313 =head2 Stanfel
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	314
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	315 Title : Stanfel
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	316 Usage : $output = $oddcode_obj->Stanfel();
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	317 Function: turns amino acid sequence into 4-letter Stanfel alphabet
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	318 Example : a sequence ACDEFGH will become AACCDAE
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	319 Returns : Reference to the new sequence string
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	320 Args : none
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	321
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	322 =cut
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	323
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	324 sub Stanfel()
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	325 {
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	326 my $self = $_[0];
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	327 my $seqstring = &_pullseq($self);
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	328
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	329 # now the real business
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	330
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	331 $seqstring =~ tr/[ACGILMPSTV]/1/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	332 $seqstring =~ tr/[DENQ]/2/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	333 $seqstring =~ tr/[FWY]/3/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	334 $seqstring =~ tr/[HKR]/4/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	335 $seqstring =~ tr/1/A/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	336 $seqstring =~ tr/2/C/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	337 $seqstring =~ tr/3/D/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	338 $seqstring =~ tr/4/E/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	339
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	340 return \$seqstring;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	341
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	342 # and that's that one
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	343 }
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	344
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	345 =head2 chemical()
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	346
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	347 Title : chemical
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	348 Usage : $output = $oddcode_obj->chemical();
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	349 Function: turns amino acid sequence into 8-letter chemical alphabet
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	350 : A (acidic), L (aliphatic), M (amide), R (aromatic)
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	351 : C (basic), H (hydroxyl), I (imino), S (sulphur)
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	352 Example : a sequence ACDEFGH will become LSAARAC
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	353 Returns : Reference to the new sequence string
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	354 Args : none
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	355
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	356 =cut
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	357
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	358 sub chemical()
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	359 {
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	360 my $self = $_[0];
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	361 my $seqstring = &_pullseq($self);
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	362
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	363 # now the real business
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	364
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	365 $seqstring =~ tr/[DE]/1/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	366 $seqstring =~ tr/[AGILV]/2/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	367 $seqstring =~ tr/[NQ]/3/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	368 $seqstring =~ tr/[FWY]/4/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	369 $seqstring =~ tr/[RHK]/5/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	370 $seqstring =~ tr/[ST]/6/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	371 $seqstring =~ tr/P/7/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	372 $seqstring =~ tr/[CM]/8/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	373 $seqstring =~ tr/1/A/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	374 $seqstring =~ tr/2/L/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	375 $seqstring =~ tr/3/M/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	376 $seqstring =~ tr/4/R/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	377 $seqstring =~ tr/5/C/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	378 $seqstring =~ tr/6/H/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	379 $seqstring =~ tr/7/I/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	380 $seqstring =~ tr/8/S/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	381
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	382 return \$seqstring;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	383
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	384 # and that's that one
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	385 }
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	386
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	387 =head2 charge
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	388
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	389 Title : charge
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	390 Usage : $output = $oddcode_obj->charge();
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	391 Function: turns amino acid sequence into 3-letter charge alphabet
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	392 Example : a sequence ACDEFGH will become NNAANNC
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	393 Returns : Reference to the new sequence string
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	394 Args : none
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	395
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	396 =cut
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	397
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	398 sub charge()
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	399 {
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	400 my $self = $_[0];
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	401 my $seqstring = &_pullseq($self);
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	402
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	403 # now the real business
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	404
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	405 $seqstring =~ tr/[DE]/1/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	406 $seqstring =~ tr/[HKR]/2/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	407 $seqstring =~ tr/[ACFGILMNPQSTVWY]/3/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	408 $seqstring =~ tr/1/A/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	409 $seqstring =~ tr/2/C/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	410 $seqstring =~ tr/3/N/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	411
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	412 return \$seqstring;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	413
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	414 # and that's that one
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	415 }
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	416
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	417 # _pullseq is called within each of the subroutines
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	418 # it just checks a few things and returns the sequence
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	419
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	420 sub _pullseq
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	421 {
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	422 my $self = $_[0];
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	423
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	424 my $seqobj = $self->{'_seqref'};
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	425
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	426 unless ($seqobj->isa("Bio::PrimarySeqI"))
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	427 {
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	428 die("die, OddCodes works only on PrimarySeqI objects\n");
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	429 }
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	430 $self->warn("\tAll OddCode alphabets need a protein sequence,\n".
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	431 "\tbut BioPerl thinks this is not: [". $seqobj->id. "]")
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	432 unless $seqobj->alphabet eq 'protein' or $self->verbose < 0;;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	433
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	434 my $seqstring = uc $seqobj->seq();
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	435
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	436 if(length($seqstring)<1)
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	437 {
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	438 die("$seqstring: die, sequence has zero length\n");
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	439 }
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	440 return $seqstring;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	441 }
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	442
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	443 1;

Mercurial > repos > mahtabm > ensembl

annotate variant_effect_predictor/Bio/Tools/OddCodes.pm @ 3:d30fa12e4cc5 default tip