sratoolkit_centos: sra.py annotate

annotate sra.py @ 0:3aa3807c078f

commit

author	pitagora <ryota.yamanaka@riken.jp>
date	Thu, 26 Mar 2015 16:29:05 +0900
parents
children

rev	line source
0 3aa3807c078f commit pitagora <ryota.yamanaka@riken.jp> parents: diff changeset	1 """
3aa3807c078f commit pitagora <ryota.yamanaka@riken.jp> parents: diff changeset	2 NCBI sra class
3aa3807c078f commit pitagora <ryota.yamanaka@riken.jp> parents: diff changeset	3 """
3aa3807c078f commit pitagora <ryota.yamanaka@riken.jp> parents: diff changeset	4 import logging
3aa3807c078f commit pitagora <ryota.yamanaka@riken.jp> parents: diff changeset	5 import binascii
3aa3807c078f commit pitagora <ryota.yamanaka@riken.jp> parents: diff changeset	6 from galaxy.datatypes.data import nice_size
3aa3807c078f commit pitagora <ryota.yamanaka@riken.jp> parents: diff changeset	7 from galaxy.datatypes.binary import Binary
3aa3807c078f commit pitagora <ryota.yamanaka@riken.jp> parents: diff changeset	8
3aa3807c078f commit pitagora <ryota.yamanaka@riken.jp> parents: diff changeset	9 log = logging.getLogger(__name__)
3aa3807c078f commit pitagora <ryota.yamanaka@riken.jp> parents: diff changeset	10
3aa3807c078f commit pitagora <ryota.yamanaka@riken.jp> parents: diff changeset	11 class Sra(Binary):
3aa3807c078f commit pitagora <ryota.yamanaka@riken.jp> parents: diff changeset	12 """ Sequence Read Archive (SRA) """
3aa3807c078f commit pitagora <ryota.yamanaka@riken.jp> parents: diff changeset	13 file_ext = 'sra'
3aa3807c078f commit pitagora <ryota.yamanaka@riken.jp> parents: diff changeset	14
3aa3807c078f commit pitagora <ryota.yamanaka@riken.jp> parents: diff changeset	15 def __init__( self, **kwd ):
3aa3807c078f commit pitagora <ryota.yamanaka@riken.jp> parents: diff changeset	16 Binary.__init__( self, **kwd )
3aa3807c078f commit pitagora <ryota.yamanaka@riken.jp> parents: diff changeset	17
3aa3807c078f commit pitagora <ryota.yamanaka@riken.jp> parents: diff changeset	18 def sniff( self, filename ):
3aa3807c078f commit pitagora <ryota.yamanaka@riken.jp> parents: diff changeset	19 """ The first 8 bytes of any NCBI sra file is 'NCBI.sra', and the file is binary.
3aa3807c078f commit pitagora <ryota.yamanaka@riken.jp> parents: diff changeset	20 For details about the format, see http://www.ncbi.nlm.nih.gov/books/n/helpsra/SRA_Overview_BK/#SRA_Overview_BK.4_SRA_Data_Structure
3aa3807c078f commit pitagora <ryota.yamanaka@riken.jp> parents: diff changeset	21 """
3aa3807c078f commit pitagora <ryota.yamanaka@riken.jp> parents: diff changeset	22 try:
3aa3807c078f commit pitagora <ryota.yamanaka@riken.jp> parents: diff changeset	23 header = open(filename).read(8)
3aa3807c078f commit pitagora <ryota.yamanaka@riken.jp> parents: diff changeset	24 if binascii.b2a_hex(header) == binascii.hexlify('NCBI.sra'):
3aa3807c078f commit pitagora <ryota.yamanaka@riken.jp> parents: diff changeset	25 return True
3aa3807c078f commit pitagora <ryota.yamanaka@riken.jp> parents: diff changeset	26 else:
3aa3807c078f commit pitagora <ryota.yamanaka@riken.jp> parents: diff changeset	27 return False
3aa3807c078f commit pitagora <ryota.yamanaka@riken.jp> parents: diff changeset	28 except:
3aa3807c078f commit pitagora <ryota.yamanaka@riken.jp> parents: diff changeset	29 return False
3aa3807c078f commit pitagora <ryota.yamanaka@riken.jp> parents: diff changeset	30
3aa3807c078f commit pitagora <ryota.yamanaka@riken.jp> parents: diff changeset	31 def set_peek(self, dataset, is_multi_byte=False):
3aa3807c078f commit pitagora <ryota.yamanaka@riken.jp> parents: diff changeset	32 if not dataset.dataset.purged:
3aa3807c078f commit pitagora <ryota.yamanaka@riken.jp> parents: diff changeset	33 dataset.peek = 'Binary sra file'
3aa3807c078f commit pitagora <ryota.yamanaka@riken.jp> parents: diff changeset	34 dataset.blurb = nice_size(dataset.get_size())
3aa3807c078f commit pitagora <ryota.yamanaka@riken.jp> parents: diff changeset	35 else:
3aa3807c078f commit pitagora <ryota.yamanaka@riken.jp> parents: diff changeset	36 dataset.peek = 'file does not exist'
3aa3807c078f commit pitagora <ryota.yamanaka@riken.jp> parents: diff changeset	37 dataset.blurb = 'file purged from disk'
3aa3807c078f commit pitagora <ryota.yamanaka@riken.jp> parents: diff changeset	38
3aa3807c078f commit pitagora <ryota.yamanaka@riken.jp> parents: diff changeset	39 def display_peek(self, dataset):
3aa3807c078f commit pitagora <ryota.yamanaka@riken.jp> parents: diff changeset	40 try:
3aa3807c078f commit pitagora <ryota.yamanaka@riken.jp> parents: diff changeset	41 return dataset.peek
3aa3807c078f commit pitagora <ryota.yamanaka@riken.jp> parents: diff changeset	42 except:
3aa3807c078f commit pitagora <ryota.yamanaka@riken.jp> parents: diff changeset	43 return 'Binary sra file (%s)' % (nice_size(dataset.get_size()))

Mercurial > repos > pitagora > sratoolkit_centos

annotate sra.py @ 0:3aa3807c078f