data_manager_bigg: data_manager/bigg_model_sbml

comparison data_manager/bigg_model_sbml_fetcher.py @ 5:5e6f76507721 draft

"planemo upload for repository https://github.com/brsynth/synbiocad-galaxy-wrappers commit 47caed1dd87e80ae226fabb584e9d63d7c86a436-dirty"

author	ggricourt
date	Thu, 24 Feb 2022 10:56:46 +0000
parents	2f837e65b33c
children	65589e7476b6

comparison

equal deleted inserted replaced

-:a15b229ee755
+:5e6f76507721
 import argparse
+import ast
 import json
 import os
 import sys
+import time
 try:
 # For Python 3.0 and later
 from urllib.request import Request, urlopen
 except ImportError:
 # Fall back to Python 2 imports
 from urllib2 import Request, urlopen
-BASE_URL = 'http://bigg.ucsd.edu/static/models'
-ID2ORG = {
-"iCN718": "Acinetobacter baumannii AYE",
-"iYO844": "Bacillus subtilis subsp. subtilis str. 168",
-"iRC1080": "Chlamydomonas reinhardtii",
-"iCN900": "Clostridioides difficile 630",
-"iHN637": "Clostridium ljungdahlii DSM 13528",
-"iCHOv1_DG44": "Cricetulus griseus",
-"iCHOv1": "Cricetulus griseus",
-"iAF1260b": "Escherichia coli str. K-12 substr. MG1655",
-"iAF1260": "Escherichia coli str. K-12 substr. MG1655",
-"iML1515": "Escherichia coli str. K-12 substr. MG1655",
-"iJO1366": "Escherichia coli str. K-12 substr. MG1655",
-"iJR904": "Escherichia coli str. K-12 substr. MG1655",
-"e_coli_core": "Escherichia coli str. K-12 substr. MG1655",
-"iAF987": "Geobacter metallireducens GS-15",
-"iIT341": "Helicobacter pylori 26695",
-"iAT_PLT_636": "Homo sapiens",
-"Recon3D": "Homo sapiens",
-"iAB_RBC_283": "Homo sapiens",
-"RECON1": "Homo sapiens",
-"iYL1228": "Klebsiella pneumoniae subsp. pneumoniae MGH 78578",
-"iNF517": "Lactococcus lactis subsp. cremoris MG1363",
-"iAF692": "Methanosarcina barkeri str. Fusaro",
-"iMM1415": "Mus musculus",
-"iNJ661": "Mycobacterium tuberculosis H37Rv",
-"iEK1008": "Mycobacterium tuberculosis H37Rv",
-"iLB1027_lipid": "Phaeodactylum tricornutum CCAP 1055/1",
-"iAM_Pb448": "Plasmodium berghei",
-"iAM_Pc455": "Plasmodium cynomolgi strain B",
-"iAM_Pf480": "Plasmodium falciparum 3D7",
-"iAM_Pk459": "Plasmodium knowlesi strain H",
-"iAM_Pv461": "Plasmodium vivax Sal-1",
-"iJN746": "Pseudomonas putida KT2440",
-"iJN1463": "Pseudomonas putida KT2440",
-"iND750": "Saccharomyces cerevisiae S288C",
-"iMM904": "Saccharomyces cerevisiae S288C",
-"STM_v1_0": "Salmonella enterica subsp. enterica serovar Typhimurium str. LT2",
-"iYS1720": "Salmonella pan-reactome",
-"iSB619": "Staphylococcus aureus subsp. aureus N315",
-"iYS854": "Staphylococcus aureus subsp. aureus USA300_TCH1516",
-"iJB785": "Synechococcus elongatus PCC 7942",
-"iJN678": "Synechocystis sp. PCC 6803",
-"iSynCJ816": "Synechocystis sp. PCC 6803",
-"iLJ478": "Thermotoga maritima MSB8",
-"iIS312": "Trypanosoma cruzi Dm28c",
-"iIS312_Trypomastigote": "Trypanosoma cruzi Dm28c",
-"iIS312_Epimastigote": "Trypanosoma cruzi Dm28c",
-"iIS312_Amastigote": "Trypanosoma cruzi Dm28c"
-}
-def url_download(url, workdir):
+MODEL_URL = 'http://bigg.ucsd.edu/static/models/'
-file_path = os.path.abspath(os.path.join(workdir, os.path.basename(url)))
+MODEL_DETAIL_URL = 'http://bigg.ucsd.edu/api/v2/models/'
-src = None
-dst = None
+def url_download(url, path):
 try:
-req = Request(url)
+with urlopen(Request(url)) as fod:
-src = urlopen(req)
+with open(path, 'wb') as dst:
-with open(file_path, 'wb') as dst:
+while True:
-while True:
+chunk = fod.read(2**10)
-chunk = src.read(2**10)
+if chunk:
-if chunk:
+dst.write(chunk)
-dst.write(chunk)
+else:
-else:
+break
-break
 except Exception as e:
 sys.exit(str(e))
-finally:
-if src:
-src.close()
-return file_path
-def download(model_id, out_file):
+def url_json(url):
+data = {}
+try:
+with urlopen(Request(url)) as fod:
+data = fod.read().encode('utf-8')
+data = ast.literal_evals(data)
+except Exception as e:
+sys.exit(str(e))
+return data
-with open(out_file) as fh:
+def get_model_organism(model_id):
+data = url_json(MODEL_DETAIL_URL + model_id)
+org = data.get('organism', 'undefined')
+res = "(%s) %s" (model_id, org)
+return res
+def download_entries(model_ids, workdir):
+for model_id in model_ids:
+model_filename = model_id + '.xml'
+path = os.path.abspath(os.path.join(workdir, model_filename))
+url_download(MODEL_DETAIL_URL + model_filename, path)
+data_manager_entry = {}
+data_manager_entry['value'] = model_id
+data_manager_entry['name'] = get_model_organism(model_id)
+data_manager_entry['path'] = path
+# Make sure that less than 10 requests per second, as required by host (http://bigg.ucsd.edu/data_access)
+time.sleep(1)
+yield data_manager_entry
+if __name__ == '__main__':
+parser = argparse.ArgumentParser()
+pinput = parser.add_mutually_exclusive_group(required=True)
+pinput.add_argument('--model-id', help='Model BIGG id')
+pinput.add_argument('--model-all', action='store_true', help='Download all models')
+parser.add_argument('--out-file', help='JSON output file')
+args = parser.parse_args()
+# Init.
+data_manager_json = {'data_tables': {}}
+with open(args.out_file) as fh:
 params = json.load(fh)
 workdir = params['output_data'][0]['extra_files_path']
 os.makedirs(workdir)
-data_manager_json = {'data_tables': {}}
+model_ids = []
-file_path = url_download(BASE_URL + '/' + model_id + '.xml', workdir)
+if args.model_id:
+model_ids.append(args.model_id)
+else:
+data = url_json(MODEL_DETAIL_URL)
+for result in data.get("results", []):
+model_ids.append(result.get("bigg_id"))
-data_manager_entry = {}
+entries = list(download_entries(model_ids, workdir))
-data_manager_entry['value'] = model_id
-data_manager_entry['name'] = ID2ORG.get(model_id, 'undefined')
-data_manager_entry['path'] = file_path
-data_manager_json['data_tables']['bigg_model_sbml'] = data_manager_entry
+# Write data.
-with open(out_file, 'w') as fh:
+data_manager_json['data_tables']['bigg_model_sbml'] = entries
+with open(args.out_file, 'w') as fh:
 json.dump(data_manager_json, fh, sort_keys=True)
-if __name__ == '__main__':
-parser = argparse.ArgumentParser()
-parser.add_argument('--model-id', help='Model BIGG id')
-parser.add_argument('--out-file', help='JSON output file')
-args = parser.parse_args()
-download(args.model_id, args.out_file)

Mercurial > repos > ggricourt > data_manager_bigg

comparison data_manager/bigg_model_sbml_fetcher.py @ 5:5e6f76507721 draft