ensembl: variant_effect_predictor/Bio/SeqIO/chado.pm annotate

annotate variant_effect_predictor/Bio/SeqIO/chado.pm @ 0:1f6dce3d34e0

Uploaded

author	mahtabm
date	Thu, 11 Apr 2013 02:01:53 -0400
parents
children

rev	line source
0 1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	1 # $Id: chado.pm,v 1.1 2002/12/03 08:13:55 cjm Exp $
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	2 #
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	3 # BioPerl module for Bio::SeqIO::chado
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	4 #
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	5 # Chris Mungall <cjm@fruitfly.org>
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	6 #
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	7 # You may distribute this module under the same terms as perl itself
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	8
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	9 # POD documentation - main docs before the code
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	10
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	11 =head1 NAME
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	12
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	13 Bio::SeqIO::chado - chado sequence input/output stream
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	14
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	15 =head1 SYNOPSIS
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	16
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	17 It is probably best not to use this object directly, but
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	18 rather go through the SeqIO handler system. Go:
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	19
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	20 $stream = Bio::SeqIO->new(-file => $filename, -format => 'chado');
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	21
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	22 while ( my $seq = $stream->next_seq() ) {
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	23 # do something with $seq
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	24 }
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	25
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	26 =head1 DESCRIPTION
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	27
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	28 This object can transform Bio::Seq objects to and from chado flat
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	29 file databases. CURRENTLY ONLY TO
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	30
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	31
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	32 =head2 Optional functions
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	33
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	34 =over 3
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	35
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	36 =item _show_dna()
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	37
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	38 (output only) shows the dna or not
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	39
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	40 =item _post_sort()
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	41
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	42 (output only) provides a sorting func which is applied to the FTHelpers
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	43 before printing
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	44
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	45
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	46 =back
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	47
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	48 =head1 FEEDBACK
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	49
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	50 =head2 Mailing Lists
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	51
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	52 User feedback is an integral part of the evolution of this
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	53 and other Bioperl modules. Send your comments and suggestions preferably
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	54 to one of the Bioperl mailing lists.
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	55 Your participation is much appreciated.
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	56
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	57 bioperl-l@bioperl.org - General discussion
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	58 http://www.bioperl.org/MailList.shtml - About the mailing lists
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	59
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	60 =head2 Reporting Bugs
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	61
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	62 Report bugs to the Bioperl bug tracking system to help us keep track
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	63 the bugs and their resolution.
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	64 Bug reports can be submitted via email or the web:
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	65
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	66 bioperl-bugs@bio.perl.org
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	67 http://bio.perl.org/bioperl-bugs/
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	68
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	69 =head1 AUTHOR - Chris Mungall
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	70
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	71 Email cjm@fruitfly.org
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	72
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	73 =head1 APPENDIX
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	74
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	75 The rest of the documentation details each of the object methods. Internal methods are usually preceded with a _
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	76
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	77 =cut
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	78
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	79 # Let the code begin...
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	80
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	81 package Bio::SeqIO::chado;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	82 use vars qw(@ISA);
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	83 use strict;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	84
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	85 use Bio::SeqIO;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	86 use Bio::SeqFeature::Generic;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	87 use Bio::Species;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	88 use Bio::Seq::SeqFactory;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	89 use Bio::Annotation::Collection;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	90 use Bio::Annotation::Comment;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	91 use Bio::Annotation::Reference;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	92 use Bio::Annotation::DBLink;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	93
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	94 use Data::Stag qw(:all);
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	95
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	96 @ISA = qw(Bio::SeqIO);
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	97
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	98 sub _initialize {
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	99 my($self,@args) = @_;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	100
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	101 $self->SUPER::_initialize(@args);
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	102 if( ! defined $self->sequence_factory ) {
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	103 $self->sequence_factory(new Bio::Seq::SeqFactory
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	104 (-verbose => $self->verbose(),
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	105 -type => 'Bio::Seq::RichSeq'));
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	106 }
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	107 my $wclass = $self->default_handler_class;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	108 $self->handler($wclass->new);
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	109 $self->{_end_of_data} = 0;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	110 $self->handler->S("chado");
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	111 return;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	112 }
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	113
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	114 sub DESTROY {
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	115 my $self = shift;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	116 $self->end_of_data();
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	117 $self->SUPER::DESTROY();
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	118 }
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	119
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	120 sub end_of_data {
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	121 my $self = shift;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	122 $self->{_end_of_data} = 1;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	123 $self->handler->E("chado");
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	124 }
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	125
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	126 sub default_handler_class {
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	127 return "Data::Stag::BaseHandler";
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	128 }
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	129
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	130 =head2 next_seq
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	131
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	132 Title : next_seq
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	133 Usage : $seq = $stream->next_seq()
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	134 Function: returns the next sequence in the stream
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	135 Returns : Bio::Seq object
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	136 Args :
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	137
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	138 =cut
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	139
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	140 sub next_seq {
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	141 my ($self,@args) = @_;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	142 my $seq = $self->sequence_factory->create
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	143 (
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	144 # '-verbose' =>$self->verbose(),
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	145 # %params,
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	146 # -seq => $seqc,
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	147 # -annotation => $annotation,
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	148 # -features => \@features
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	149 );
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	150 return $seq;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	151 }
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	152
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	153 sub handler {
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	154 my $self = shift;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	155 $self->{_handler} = shift if @_;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	156 return $self->{_handler};
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	157 }
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	158
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	159
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	160 =head2 write_seq
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	161
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	162 Title : write_seq
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	163 Usage : $stream->write_seq($seq)
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	164 Function: writes the $seq object (must be seq) to the stream
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	165 Returns : 1 for success and 0 for error
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	166 Args : Bio::Seq
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	167
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	168
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	169 =cut
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	170
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	171 sub write_seq {
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	172 my ($self,$seq) = @_;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	173
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	174 if( !defined $seq ) {
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	175 $self->throw("Attempting to write with no seq!");
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	176 }
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	177
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	178 if( ! ref $seq \|\| ! $seq->isa('Bio::SeqI') ) {
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	179 $self->warn(" $seq is not a SeqI compliant module. Attempting to dump, but may fail!");
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	180 }
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	181
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	182 # get a handler - must inherit from Data::Stag::BaseHandler;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	183 my $w = $self->handler;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	184
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	185 # start of data
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	186 $w->S("seqset");
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	187
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	188 # my $seq_temp_uid = $self->get_temp_uid($seq);
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	189
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	190 my $seq_temp_uid = $seq->accession . '.' . ($seq->can('seq_version') ? $seq->seq_version : $seq->version);
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	191
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	192 # data structure representing the core sequence for this record
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	193 my $seqnode =
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	194 Data::Stag->new(feature=>[
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	195 [feature_id=>$seq_temp_uid],
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	196 [dbxrefstr=>$seq->accession_number],
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	197 [name=>$seq->display_name],
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	198 [residues=>$seq->seq],
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	199 ]);
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	200
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	201 # soft properties
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	202 my %prop = ();
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	203
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	204 my ($div, $mol);
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	205 my $len = $seq->length();
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	206
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	207 if ( $seq->can('division') ) {
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	208 $div=$seq->division;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	209 }
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	210 if( !defined $div \|\| ! $div ) { $div = 'UNK'; }
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	211
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	212 if( !$seq->can('molecule') \|\| ! defined ($mol = $seq->molecule()) ) {
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	213 $mol = $seq->alphabet \|\| 'DNA';
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	214 }
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	215
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	216
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	217 my $circular = 'linear ';
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	218 $circular = 'circular' if $seq->is_circular;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	219
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	220 # cheeky hack - access symbol table
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	221 no strict 'refs';
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	222 map {
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	223 $prop{$_} =
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	224 $ {*$_};
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	225 } qw(mol div circular);
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	226 use strict 'refs';
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	227
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	228 map {
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	229 $prop{$_} = $seq->$_() if $seq->can($_);
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	230 } qw(desc keywords);
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	231
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	232 local($^W) = 0; # supressing warnings about uninitialized fields.
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	233
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	234 # Organism lines
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	235 if (my $spec = $seq->species) {
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	236 my ($species, $genus, @class) = $spec->classification();
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	237 my $OS;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	238 if( $spec->common_name ) {
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	239 $OS = $spec->common_name;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	240 } else {
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	241 $OS = "$genus $species";
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	242 }
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	243 if (my $ssp = $spec->sub_species) {
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	244 $OS .= " $ssp";
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	245 }
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	246 }
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	247
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	248 # Reference lines
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	249 my $count = 1;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	250 foreach my $ref ( $seq->annotation->get_Annotations('reference') ) {
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	251 # TODO
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	252 }
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	253 # Comment lines
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	254
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	255 foreach my $comment ( $seq->annotation->get_Annotations('comment') ) {
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	256 $seqnode->add_featureprop([[pkey=>'comment'],[pval=>$comment->text]]);
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	257 }
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	258
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	259 # throw the writer an event
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	260 $w->ev(@$seqnode);
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	261
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	262 $seqnode = undef; # free memory
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	263
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	264 # make events for all the features within the record
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	265 foreach my $sf ( $seq->top_SeqFeatures ) {
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	266 $self->write_sf($sf, $seq_temp_uid);
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	267 }
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	268
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	269 # data end
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	270 $w->E("seqset");
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	271 return 1;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	272 }
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	273
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	274 # ----
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	275 # writes a seq feature
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	276 # ----
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	277
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	278 sub write_sf {
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	279 my $self = shift;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	280 my $sf = shift;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	281 my $seq_temp_uid = shift;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	282
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	283 my $w = $self->handler;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	284
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	285 my %props =
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	286 map {
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	287 $_=>[$sf->each_tag_value($_)]
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	288 } $sf->all_tags;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	289
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	290 my $loc = $sf->location;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	291 my $name = $sf->display_name;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	292 my $type = $sf->primary_tag;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	293 my @subsfs = $sf->sub_SeqFeature;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	294 my @locnodes = ();
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	295 my $sid = $loc->is_remote ? $loc->seq_id : $seq_temp_uid;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	296 if( $loc->isa("Bio::Location::SplitLocationI") ) {
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	297 # turn splitlocs into subfeatures
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	298 my $n = 1;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	299 push(@subsfs,
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	300 map {
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	301 my $ssf =
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	302 Bio::SeqFeature::Generic->new(
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	303
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	304 -start=>$_->start,
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	305 -end=>$_->end,
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	306 -strand=>$_->strand,
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	307 -primary=>$self->subpartof($type),
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	308 );
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	309 if ($_->is_remote) {
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	310 $ssf->location->is_remote(1);
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	311 $ssf->location->seq_id($_->seq_id);
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	312 }
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	313 $ssf;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	314 } $loc->each_Location);
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	315 }
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	316 elsif( $loc->isa("Bio::Location::RemoteLocationI") ) {
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	317 # turn splitlocs into subfeatures
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	318 my $n = 1;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	319 push(@subsfs,
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	320 map {
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	321 Bio::SeqFeature::Generic->new(
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	322 # -name=>$name.'.'.$n++,
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	323 -start=>$_->start,
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	324 -end=>$_->end,
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	325 -strand=>$_->strand,
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	326 -primary=>$self->subpartof($type),
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	327 )
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	328 } $loc->each_Location);
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	329 }
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	330 else {
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	331 my ($beg, $end, $strand) = $self->bp2ib($loc);
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	332 @locnodes = (
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	333 [featureloc=>[
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	334 [nbeg=>$beg],
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	335 [nend=>$end],
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	336 [strand=>$strand],
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	337 [srcfeature_id=>$sid],
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	338 [group=>0],
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	339 [rank=>0],
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	340 ]
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	341 ]
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	342 );
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	343 }
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	344 my $feature_id = $self->get_temp_uid($sf);
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	345
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	346 my $fnode =
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	347 [feature=>[
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	348 [feature_id=>$feature_id],
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	349 [name=>$name],
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	350 [typename=>$type],
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	351 @locnodes,
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	352 (map {
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	353 my $k = $_;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	354 map { [featureprop=>[[pkey=>$k],[pval=>$_]]] } @{$props{$k}}
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	355 } keys %props),
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	356 ]];
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	357 $w->ev(@$fnode);
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	358
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	359 foreach my $ssf (@subsfs) {
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	360 my $ssfid = $self->write_sf($ssf, $sid);
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	361 $w->ev(feature_relationship=>[
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	362 [subjfeature_id=>$ssfid],
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	363 [objfeature_id=>$feature_id]
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	364 ]
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	365 );
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	366 }
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	367 return $feature_id;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	368 }
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	369
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	370 # private;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	371 # an ID for this session that should be
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	372 # unique... hmm
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	373 sub session_id {
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	374 my $self = shift;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	375 $self->{_session_id} = shift if @_;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	376 if (!$self->{_session_id}) {
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	377 $self->{_session_id} = $$.time;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	378 }
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	379 return $self->{_session_id};
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	380 }
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	381
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	382
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	383 our $next_id = 1;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	384 our %obj2id_hash = ();
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	385 sub get_temp_uid {
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	386 my $self = shift;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	387 my $ob = shift;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	388 my $id = $obj2id_hash{$ob};
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	389 if (!$id) {
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	390 $id = $next_id++;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	391 $obj2id_hash{$ob} = $id;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	392 }
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	393 return $self->session_id.'.'.$id;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	394 }
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	395
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	396 # interbase and directional semantics
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	397 sub bp2ib {
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	398 my $self = shift;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	399 my $loc = shift;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	400 my ($s, $e, $str) =
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	401 ref($loc) eq "ARRAY" ? (@$loc) : ($loc->start, $loc->end, $loc->strand);
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	402 if ($str < 0) {
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	403 ($s, $e) = ($e, $s);
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	404 }
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	405 $s--;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	406 return ($s, $e, $str);
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	407 }
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	408
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	409 sub subpartof {
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	410 my $self = shift;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	411 my $type = 'partof_'.shift;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	412 $type =~ s/partof_CDS/CDS_exon/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	413 $type =~ s/partof_\wRNA/exon/;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	414 return $type;
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	415 }
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	416
1f6dce3d34e0 Uploaded mahtabm parents: diff changeset	417 1;

Mercurial > repos > mahtabm > ensembl

annotate variant_effect_predictor/Bio/SeqIO/chado.pm @ 0:1f6dce3d34e0