test1: sra_tools-ffdd41766195/sra.py annotate

annotate sra_tools-ffdd41766195/sra.py @ 1:0d4d6ea22030 draft

new file

author	David Lin <dave.lin@cbiocorp.com>
date	Thu, 28 Feb 2013 15:27:55 -0800
parents	f1de190a2aef
children

rev	line source
0 f1de190a2aef Uploaded dddd parents: diff changeset	1 """
f1de190a2aef Uploaded dddd parents: diff changeset	2 Sra class
f1de190a2aef Uploaded dddd parents: diff changeset	3 """
f1de190a2aef Uploaded dddd parents: diff changeset	4
f1de190a2aef Uploaded dddd parents: diff changeset	5 import galaxy.datatypes.binary
f1de190a2aef Uploaded dddd parents: diff changeset	6 from galaxy.datatypes.binary import Binary
f1de190a2aef Uploaded dddd parents: diff changeset	7 import data, logging, binascii
f1de190a2aef Uploaded dddd parents: diff changeset	8 from galaxy.datatypes.metadata import MetadataElement
f1de190a2aef Uploaded dddd parents: diff changeset	9 from galaxy.datatypes import metadata
f1de190a2aef Uploaded dddd parents: diff changeset	10 from galaxy.datatypes.sniff import *
f1de190a2aef Uploaded dddd parents: diff changeset	11 from galaxy import eggs
f1de190a2aef Uploaded dddd parents: diff changeset	12 import pkg_resources
f1de190a2aef Uploaded dddd parents: diff changeset	13 pkg_resources.require( "bx-python" )
f1de190a2aef Uploaded dddd parents: diff changeset	14 import os, subprocess, tempfile
f1de190a2aef Uploaded dddd parents: diff changeset	15 import struct
f1de190a2aef Uploaded dddd parents: diff changeset	16
f1de190a2aef Uploaded dddd parents: diff changeset	17 class Sra( Binary ):
f1de190a2aef Uploaded dddd parents: diff changeset	18 """ Sequence Read Archive (SRA) """
f1de190a2aef Uploaded dddd parents: diff changeset	19 file_ext = "sra"
f1de190a2aef Uploaded dddd parents: diff changeset	20
f1de190a2aef Uploaded dddd parents: diff changeset	21 def __init__( self, **kwd ):
f1de190a2aef Uploaded dddd parents: diff changeset	22 Binary.__init__( self, **kwd )
f1de190a2aef Uploaded dddd parents: diff changeset	23 def sniff( self, filename ):
f1de190a2aef Uploaded dddd parents: diff changeset	24 # The first 8 bytes of any NCBI sra file is 'NCIB.sra', and the file is binary. EBI and DDBJ files may differ. For details
f1de190a2aef Uploaded dddd parents: diff changeset	25 # about the format, see http://www.ncbi.nlm.nih.gov/books/n/helpsra/SRA_Overview_BK/#SRA_Overview_BK.4_SRA_Data_Structure
f1de190a2aef Uploaded dddd parents: diff changeset	26 try:
f1de190a2aef Uploaded dddd parents: diff changeset	27 header = open( filename ).read(8)
f1de190a2aef Uploaded dddd parents: diff changeset	28 if binascii.b2a_hex( header ) == binascii.hexlify( 'NCBI.sra' ):
f1de190a2aef Uploaded dddd parents: diff changeset	29 return True
f1de190a2aef Uploaded dddd parents: diff changeset	30 return False
f1de190a2aef Uploaded dddd parents: diff changeset	31 except:
f1de190a2aef Uploaded dddd parents: diff changeset	32 return False
f1de190a2aef Uploaded dddd parents: diff changeset	33 def set_peek( self, dataset, is_multi_byte=False ):
f1de190a2aef Uploaded dddd parents: diff changeset	34 if not dataset.dataset.purged:
f1de190a2aef Uploaded dddd parents: diff changeset	35 dataset.peek = "Binary sra file"
f1de190a2aef Uploaded dddd parents: diff changeset	36 dataset.blurb = data.nice_size( dataset.get_size() )
f1de190a2aef Uploaded dddd parents: diff changeset	37 else:
f1de190a2aef Uploaded dddd parents: diff changeset	38 dataset.peek = 'file does not exist'
f1de190a2aef Uploaded dddd parents: diff changeset	39 dataset.blurb = 'file purged from disk'
f1de190a2aef Uploaded dddd parents: diff changeset	40 def display_peek( self, dataset ):
f1de190a2aef Uploaded dddd parents: diff changeset	41 try:
f1de190a2aef Uploaded dddd parents: diff changeset	42 return dataset.peek
f1de190a2aef Uploaded dddd parents: diff changeset	43 except:
f1de190a2aef Uploaded dddd parents: diff changeset	44 return "Binary sra file (%s)" % ( data.nice_size( dataset.get_size() ) )
f1de190a2aef Uploaded dddd parents: diff changeset	45
f1de190a2aef Uploaded dddd parents: diff changeset	46 Binary.register_sniffable_binary_format("sra", "sra", Sra)

Mercurial > repos > dddd > test1

annotate sra_tools-ffdd41766195/sra.py @ 1:0d4d6ea22030 draft