# HG changeset patch # User remimarenco # Date 1461978571 14400 # Node ID ec6f7c1ae81bcc8d6c79128e19bc2fec0198b063 planemo upload diff -r 000000000000 -r ec6f7c1ae81b blastXmlToPsl Binary file blastXmlToPsl has changed diff -r 000000000000 -r ec6f7c1ae81b blastXmlToPsl.xml --- /dev/null Thu Jan 01 00:00:00 1970 +0000 +++ b/blastXmlToPsl.xml Fri Apr 29 21:09:31 2016 -0400 @@ -0,0 +1,50 @@ + + + + + + + + + + + + + + = 3 prints each line of file after parsing. + n >= 4 dumps the result of each query + -eVal=n n is e-value threshold to filter results. Format can be either + an integer, double or 1e-10. Default is no filter. + -pslx - create PSLX output (includes sequences for blocks) + -convertToNucCoords - convert protein to nucleic alignments to nucleic + to nucleic coordinates + -qName=src - define element used to obtain the qName. The following + values are support: + o query-ID - use contents of the element if it + exists, otherwise use + o query-def0 - use the first white-space separated word of the + element if it exists, otherwise the first word + of . + Default is query-def0. + -tName=src - define element used to obtain the tName. The following + values are support: + o Hit_id - use contents of the element. + o Hit_def0 - use the first white-space separated word of the + element. + o Hit_accession - contents of the element. + Default is Hit-def0. + -forcePsiBlast - treat as output of PSI-BLAST. blast-2.2.16 and maybe + others indentify psiblast as blastp. +Output only results of last round from PSI BLAST + ]]> + \ No newline at end of file diff -r 000000000000 -r ec6f7c1ae81b test-data/Dbia3.fa --- /dev/null Thu Jan 01 00:00:00 1970 +0000 +++ b/test-data/Dbia3.fa Fri Apr 29 21:09:31 2016 -0400 @@ -0,0 +1,905 @@ +>contig1 +AAAACTAATTTTATCAAAATCGGACAACTATATCATATAGCTGCCATACG +AACGATCGGAAAATTGGTAAGTAAATAATTAAAAATATTATATCTTTGGT +GTGTTTTTGGAAATAACATTTTTTAATATGTTTTGAATTTTGAATTAAAT +TCTATCAAAATCGGACGACTATATCATATAGCTGCCATACAAACGATCGG +AAAATTGGTGAATAAATAATATGAAAAAATTATATCTTTGGTTATTTTTT +AGACAAATAACCTCCAACGCTTGGAAATAACATTTTTTAATTAGTTATAA +ATTTGATATTTTAATTTTATCAAAATCGGACGAATATAGCATATAGCTGT +TAAAATAATATGAAACAAATTATAGCTCCGGTGTTTTTTACATATTATCT +TATACTATTGGGAAAATAGTTTATTATATTTTAAAGAATTTCCAATTAAA +CTCTAACATATAGCTTTCAAAGAAACGGTCAAAAAAGTAAAGAAATCATT +TTTTTTTAACATCACTGAAGCTAGAAACAATCCTTAAAAATGTAACATGG +TGTTAGTAGCATTGAAAATTGCTTATAACTGCAAAGGGAAAACAAACATC +GGCTTGCCGAATGTAATTTCCATTCTTGTTTGACTTGAGTTTATAACTTA +CAATTATGGTAAGGTGCCTGATTTTGGTTTTTGCCATACGGTATGTGGTA +GTTATCATTTTGCCGTGCTATAAGTGACATCACAGCCGATTCTTTTACTC +CATAATGGGCCAATGTGTTGAGGCGTTTCCATCCATTTATTGTTTTTGTA +GTTAGGTCTTCATCTTGTAATGTGAGATGACCTCCTCTTCCATGCCTCCA +TTCTAAGTCAACTTCGTGCACAGATGGTCTCATAGAAAACGGAGTATTTT +TAAAAATTGCGTCCAAAATTTTTAATTTAACTTGCGATATGGTATCCAAA +TCGTTTACACGACATTGGACTTTTTCATCAAGATCATCTTGTAAAATGTG +CAAAATTACAACAGAATGGGTAACTTGTTCGTGGAGAAGTCGTTCCTCTG +AAAGTGAATAACGAGCATCGTGGGTTATTGCGTCCACCAAACCCTTTTCA +ATTTGATGCTTAATTGCCTTGAACAGCAAAAATAAATTAGATCCAGCATA +TTCTTTTAGGTAGTCGTACATACAAATTGCTAAGTAGTTTGTTAACATTT +TTTCAACTACGCTCTCAGTGCGTCGTAGCATTAGCTGAGGATGCTTGCTG +GCGAGCGATTTGTCAATTAATCGCAATAAAAGGGACTTTAAAATTTCCGT +CGCATATTCCATTTTGTTCATTAGAACAACCATAAGTAAAGAGGCGACGT +TAACTCGATCGCGAATTGAGAAAGATGACCGTTGAGCTTCTAAAGTTTCT +ATGAACAATAGTAAAAAATATTTGTTTCCAATAAGTTGCTCGAATTGTAT +CATAGCTGCATCATAGTTAGTGTGCGGGCTACTTCCACAAAATTTTCGGG +AGTTTAGAATAGGATGATCTGATACACCGGGAAAGAAAACTTTCATAATG +TAATTGACGTGATCTAACGTTGGTATACCGGTGCTCTCCAAATCTGCTGT +TAGATCGGTCATGTCCGTTTGGAGCTCAGCAAATGCCTGTTTACACTCAG +AACGAACGTTGCTTTCCAATGTTATCATCTGTATCTGAATTCGTTTGTAT +TCCCGTTCTGCTTGGGTCGATTTCCTTCTAAATATTATTAGTACGACAAC +CAAAACGATGACAAGCACTGCAACTGTCAATATAACGACAAACATGGCAT +GTGAAAAAACATAGGGTTTATTTAAATCATATTTCAAATATCCTATGGCG +AAACGAAGATTTCGCCCTACTTTAACCACAACTAGAGGTAAATCTGTCGA +TTGATCCACACCATTTTCATCAGTTGGGAGTGGTTGATGTTCCGGTGGAA +TGCACAAAAGTTGAGTTAGTGTAAGGCTTGTTATATTGCATTGAGTAGTA +CCAATGGTTACATTAACGTCGTATTCATCAGCTGCCAAATTTAGTAGCTC +GCCTTCAATAACCAAGCTGTCACCCTTGTATAGTTTAATTCCGTCATTTG +GAAATGGTAAATATTTTGGATCGGCTAAATAAACAATAGTGCTCCTGATA +TCATGAAAGTATTTATTTAGATCTCGAACAAGCTGTACATTGTCCATTAC +AAAACTAAGTTGTAAATTCAGTTGCGTTTCATGGACCTTTACAAAAGTTG +TAACATCCATATTATTATTGACGAAATAGCTAGGCGCAGTTCCCCCTGTT +GTGTATATATGAAAGTTGTCTACGAAGTCTGCTTTTCGCTTTCGTCTAGA +ATATTCGTTCTGATGCGCACTTTCATTTTTAAAGTCAAATTCCGAATCCA +TCACTCTGTTAGAACTTTTAAATGCTTGAAATTTATCATTTACCGGAGGA +GATGGGCATTCCATTTGATTTGAATTGATTACTACGCAAGATGTTTTGTT +TACTCTTTCATTATCAAAAAAAACTTCAAGTTCAGGCTTTTGAATTGAAT +TAAGATACATTCCATGAACGGTCAGAACGCGACCACCACTTACAAAACTG +CGTAAAGGCTTAATCTGCATTATACGCGGGTCTTGGGTATAGTTAAAAAT +AGAACAGGGCTGCCTTGGTAACGTACGAAATTGGTATGAACCGAAATTAC +TTCGAGTTAGATTTTTATTGGGTATAGTTGCGGGTGAGATATGACATTCT +AAAGTTCGGTTGGCACCGTCAATAAGAAGGTGTAGAGACCGTATTGGTTC +TGGCTGGGTCGCCTCTGATGTAGTACTACTAACTTGAGTTGAAGAAGCTT +GTGTAACGTTTATATGACACTCGTACTCATCTAAATATGCTCGCATGGTT +GATCCAATGTTCAAAAACTTTCCTATTAACGACAATTGTGTTCCTCCCGA +CCTGGGCCCAATCGTGGGATATAATCCTGTTAGCAAAACATTCTTAAAGT +GAAATTGTACACTAGATTCAGTATACCCTGCATCATTTGCAACCTTTATA +GGCGCTGACATTTCATACATCACTGCTCCAGTGCGGCATTCGATCTTTAC +AGAAATTTGGTAGTTGACTAGTTCACAAGGCACAGACCCAATAAATATTT +TTCCACGCACATCTCCTTCGCGAATGCCCAAATTACTGCCTTCAATTGTA +ATAAGGGTACCACCCTCAATAGGTCCAGATAACGGTTTAATAATATCGAT +CCTTGGTAAAGGGCACTCGTTTTCTTTAGTTGTTTTTGATCCTGCACTAA +TAGCACGATCACTGTCTGCTATGCAAGTCTCGTTATATACACATGAGTTG +CTGCACCAAGCACATTGGTATTTTGGATCACGAGTGACACACAAACTGCA +ATCAGCATGATCCCGATGTGAGCCCAGTACGTCGCATTTATATAATGTAA +CAATCGCCGTGTCCACATAGTGCTGGAAATTCCATGTAATTACAACCTTT +GCTTGGTATTCATGTGTATTAGTCTCGTAGAAATAAGGTGTTTTTTCACA +AACAACAATCTTGTTTGACTCAATGTGGGCAGGCAATAGCATCTGAGCAG +CTTCAATATGAACTGTACACAAGAATCCAGCGTGAGCGCTTTTGGGTTTT +GGTAAGTTTTCTATCTCTAAACGAATTTCTTTTGGCACCCGCACCGGTAA +AAGAATCGCCGGACGATTGCTTTTTAAATGGGGGCATTGACCAACACTAG +TTACCGAATTTTCTATATTACGACATTGTATTGATTGATGGACACATTTA +TTGTCAAAAATACACCAGTTGCAGCCCCATGAACTTTGTAAACATTCCTG +GCAATTTCCATGATGCGAACAGTCAAAGAATGCAAAAAATCTTGATACAA +AGTCCTTATTTGTCTCTGAACTTCTAACGGACAATGGCACCAAAACATGG +TCTGTATTAGTTGGTATTACTGGTCTTTCATCTAGTGGGGGGGTAGCACA +TCCGAGTCCATTGTCCAGGATTTCGGCGTCAATAGGGGTAGAGTTTCCAA +AGACACATCGGTATTTTGCATTAAAAGGTTCGGGCAGTGTTCGAATTATT +AGGTGCAGGTGTGTTAGATCAGTAATTGGTATTTTCTCAGGGATAATTGA +TTCAAACTCAATACACTGTTGCCCACTGCCCAAAGAAAGCCATCGCGATG +CTGACGTATCTCGCTGACATGTTGACCGCACGGTGCACCGTTTTTCCAAT +GAACACCATCCACAAAAAGGGTCCCGAGACTCCAAGCAAGCTGAACAATT +TGTGTATACAGAACAATGCTCGATTCTGAGTTTAGTTATTTTACGTTGCG +ATAAAACGTAAAGGAAATCTTTTTTGGGCGACATCATAGTGTTTGGTAGT +ATCCGATTTCCAGCATCCACAACTATTTCTTCGTACTCACCTGGATTCTG +ACCAGATAATAAAACTTTTTTTATCAATCCCTTGTCGGTTCCAAGAAAAG +CAAGAGAATGCTGCTGATCAGTCGTTGACGTTGCAGTTATTGACGTAACT +GATACATTATCAAAATGAAAGAGAGCGTGTGTAGTGATAGGAGAAACTCC +GCTTATCTTAAGTCCTACAGAACAAAAGTTGTATATGTTACCGAGCGAGC +CAACTATTGGGCACCGGCCGTCATTGATAGTGCCCGATATATAACCCAAA +TTTCTATCCTTTATGGTTCCGTTAAAGCACAGATGAATATTTTCAATAAA +CATGTCCTCAATGTCTTTTATGCTATATATGCACATAGCCGATTTGCTTT +CTGGCTGATCGCTTATCTCTTTCGAGGGCGAAAAAACAGTTACTAACACG +TGATCGTCCTTTTTTATACCCATTTTCTGAGCTAATTTTTGGCTTGCCGG +AGTTACTTTGGCATCGCGTAGTATATTGTAGTCAATATGATTTTCAGTGG +CCGTACACTGAACTGTTATTTCAGTATAACTGTCATAATTGGGATCTGTA +ATACATATTCGAGCCAAACGGGTTACATAACCTGCCTCATCAGCTAAATG +TGATTTTTTTTGAACAATAACAAAGTACGCATATTCAGAAGAGTTAAAGC +CATAAACATAATCGACTAAGAAATGATCCCGATATTTGACATCGATATTT +ATAATTGACTGCTGTATTGAAAACTCTGCGTAGTTTAAATCATCAAGCCG +ACGGGACGAAATGGCAGGAACGTCATGGCGATAATCACCAACGTTCGTGA +ACGTCGTTCCCACATATAAAATATCCTCTTCTTTCCATGAATATCGTGCA +GGACCTACAAATGCATATGTTGATGCATTTTCATCATTAGCCGCCAATGG +AACTGCGACAAATTGAGGCGTTGATGGAAACCGCGGAAGGCTGTAAATTT +CGCATGCGCCTGTAAATAATAAATAAGATAGATTTTAGCGTTATGGGTAT +TAAAGTGAGCGAGGAACATTTTTTTTAAAATAAATTGATGGGTATTCACA +AAAATCAGAACCGCTACAGTGTTAGGCGGTTTGTGAAAGTTAGAGTAAAC +ATATCATTTTTCAGGTCAATCGATGGGTATCGGCGAAACCAATACCTTAC +CTTACAGAATAATTTTTTGATTTAAGATCAAAACTATGAGCGCCACTCAG +TTAGAAAATTAACTATGCGATTATCCCTAGGATTAAGATAATTATTAATC +AATAAAACCCATTTTCATTTTCACTAAAAAAAAGTGTGTACAGATAGACT +TTAGCGATAAGGTTGTTTGTGAGCTTTAAAGTGGGCCCTTTGCTGTAATT +TGTATGCCTAATCCCAACATTCTACCTTCTACTTTTAGTTTTTGAAATTT +AGCAGCTATCGAGGTACATTTTTGATGTTAAAAGGTTATATTATTATAAT +TATTGATTAATTAATTCGATGTCTCGTTTAAAAGGATTTTGATAATCAAG +ATTTGGGGGTACTTTGATGTTTAATTATACATATATGTTTCATAAGAAAC +AGTACATACATCCATACGAATTTTTTCAAAGCCTAAATGCATTTAAAAGA +GTAAATAAATACCTCATTGTGAAAATATGTAAACATTTCCTGTCCTTATT +ATTGTATAAGTGCGTACCGTGTTTTAAGGGTACAAAAGAACAGAAAATAA +AGTAGTTTCAATTTGTTTATTTAAATTTTTTAATTCTAGCCAAATGTCAT +ATAACATCAAAATAAAATATAAATTACGTTAATAGTTTTTGTGTCTTTGG +CCACGATTAGCAGAAAAACATGGTCACTGCTAACTGTTTAGTGAGTAAAC +AAATTTATTCTGCTGAATGCTCTTTATATATATGTCGTATTATGAAATAT +GTTACTTTTTGGCAATACAACAACAACAACAATACATAAAAATCCAAAAC +AAAAAGAGAAAGGGAGCAAGCCATCTTAAGAGGCAGATTTAGCTTTTGCA +CATACGTTGTAAAGGTTAATGACGAAATAACTTTATTTTGTGTTTTATAT +TCGTTACTCGAAGAGTAAAAGCGTACACTAGAGTCATCGGAAAGTGTGTA +AAAGGTAGAAAAAAGCGTTTTTACAATAATATAAATATAAATATTCTTTG +TCATTATCTCAGCCAAGTAAAACAAATTTAAAAATTAAAAAAGAAATTTA +CGAAAATGTCTTTACTGTTCTTAATTTGACTGTTTGTTTGTTTCTGTTTA +GGTGAGGGAGACGTTTCCGAACCCATAAAGTATATATATTCTTAATCAGC +GTCACAAGACGAGTCGATCTAGCCATGTCCGTCTGTCCGTCCGTTTCTAC +GCAAACTAGTCTCTCAGTTTTAAAGCTATCGGGCTGAAACTTTCCCAAAA +GTCTTCTTTCTATTGCAGGTACTATATAAGTCGGAACCAGCCGGATCGGA +CAACTATATCTTATAGCTCCCATAGGAACTATCGGTGAAAAATATTAAAA +AAAATTATATCTTTCGTGTTTTTTAACATATACCTTCTAAGCTTGGATAT +AACATTTTTAAATTAGTTCTTAATTTCGAATTAAATTTTATCAAAATCGG +ACGACTATATCATATAGCTCCCATAGCAACAATCGAAAAATTAGTGGTAA +AATAATATTGAAAAATTATAACTTCGGTGTTTTTTAACTTATGACTTAAA +AGATGAATTAAAAATTATATCTTTGGTGTTTTTTAGCATTTAACTTTATA +AGCTTGAAAATAACATTATTTAATTAGTTCTGAATTTCGAATTAAATTTT +ATTTGGACGACTATATAATATAGCTGTCGTAGCAACGATTGGATAATTGG +TGGCAAATAAAGTGAAACAAATTATAGCTTTGGGGCTTTTTGACATTTTA +TCTTAAAATATTGGGAATATACATTTTTATACTTTTAAGAATTTCGAGTT +CAATTTATTAAAATTATTGATTATTTTTTATTGCTGCAAGGGTATACAAA +CTTTGGCTTGCCGAAGTTAACTTCCTTTCTTGTTTTTTTTTTGTATTTGG +CATATTGAGTAGCGTCGTGCGGAATGTAAAAAATGTAGGAAGAGTTTTTA +TTTAGAAGATCTCGCCAAACTAGCTAGTTTTTCCCAAAGTGGTAAAACTA +AGGTTTCTAATATAGAGCTGTTTAACATCGTCTAGAGTTGTCAGGACTGT +AAAATAACTGTAATTATCCCCACCGGCTCCAACAAATCAAATTGTCCAAA +TTTTTACTTTTACACTTTCACCACTTTCTCTCCAAAACCAATTGATTTTT +AAGTCTTGGTATGCAATTCTTTTAGTTTTTACGATACCTTAGGTTTGATG +TATCACACGAAACAATCGGACGATTACTGTAGGATTTTATTTCTTCGTGT +ATGTATAGTAGTGTCCTTCGGACACCCTTTTCGTGCGCTTCGTAACTACG +TGGACTGGCGTCCACAGTGGTATTTAAATAATTAATTTCACATATTAAAA +AAAAAATAATATTTTATTATCACAAAGTAAGCTGGGCGAAAACCGATAGT +TAACATAACCCTAAAAATTTTAAATTTTTTTAAAATAAAGAAAAACGCTT +AACTTTAGCGACTATAAGATACCCGTTACTCAGCTTAAGGGAGAAAAATG +AATATAAAGATATATAATCATCCCAGCGATATTGTAAAAAAAAATTTTTT +TAGCATGAAAACTTAGCCACAGTTTTGGGCGGTTTGTGGGCGTTGGCTAG +AGTAGGCTCTACATATTTTCGCTAAATGTGGGAGTTAGAGTGGGCGTGTC +ACCCCGCTGAAACAAACTTGCGCTGCGCAGGAAGCTCAGGAATCTGCATG +CCAAGTCTGACTCTTCTAGCTTTTATAGACTCGTCTGGTGATCAAGAACA +TATATACTTTACGGGGTCGGATACGCTTCCTTCTTTCTGGTACATACTTT +CCGACAAATCTAGTATACCCTTTTACTAGAGTAACGTGTATAATAACAAT +CAATTTTATTTTGCCTGCGGTTTAAACCTATCCCAGCGCAAGGTTCCGAG +GCGTTACCAAGAAATATTATTACCATTTAAAACCCGGTTTGCCATCTCCA +ACAGAATATATATATATATTTCGTATAAAATAAAGTTGTAAGATATTGTA +GCCCTACAAGTTTTTTAGGAAAAAAATAAAATATTTGATTAATAATTAGG +AAAAATTTAGTAAACAAAATAAAATATTTGAATAACAATTAGAAGTATAA +CATTTAACTTGAAAGGTATTAGATATAATTTGTTTCTTTTTTGATTACCA +AATAATAAAATAAGTTTTGGGCAGGACTTAAACTACGAACCCTGAAAAGA +AAATAAATCGGGAAGCACAACTTGCTTTCCTGAGCCAAGCCCATAAGATT +TTCTGAAGTGGCAAAATTCTTTCGTTACTTCAAACAAAGTGCGAGAGTCC +GAAGCGTATATATATTCTTGATCAGCGTCACTAGACGAGTCGATCTAGCC +ATGTCCTTCTGTCCGTCCGTTTGTCCGTTTCTACGCAAACAAGTCTCTCA +GTTTAAAAGGTATCGGGCTGAAACTCTTCCAAAAGTCTTCTTTCTATTGC +ATGTAGTATATAAGTCGGAACCAGCCGGATCGGACATCTATATCTTATAG +ATCCCATAGGAACTATCAGGGAAAAAATTAAAAAAAAATTATATCTTCGG +TGTTTTTCAACATACAACCTTCTAAGCTTGGAAATAACATTTCTTAATTA +GTTTTGTATTTCGAATTACATTTTTTTTTAAATCGGACGACTATATCATA +TAGCTGTCATAGGAAGGATTGGATAATTAGTGGTAAAATAATATAAAAAA +AATTATATCTTTGGTGTTTTTAACATATAACCTCCTGCGCTTGGAAATAA +CATTTTTAAATCAGTTCTGAATTTTGAATTAAATTTTTATCAAAATCGGA +CAACTATACCATATAGCTGTCATAGGAACAAATTATAGATTTGGGGCTTT +TTGACTTATTATCTTATAATAATATTGGGAATATAATTTTTTATATTTTT +AAGAATTTCGAAATTAATTTAATAAAAATCGGATTACTCTATGTAAAACA +ATGATCTAAAAAAATGAAATGATTTTATTTTTTAATATCACTGAAGCCAG +CAACAATCATTAAAAATTTCACATGGTCTTACTAAAGTTGATTATTTCAT +TTAACTGCAAGGGTATACAAACTTCGGTTTGCCGAAGTTAACTAATTTTC +TTGGTTTTAAGTTGTATTTTGCTTCCACCGACGTTATAAACGACTTTAAA +GCTTGAAAAAGGTAAATAAATAAAAAATCAAGTTTACTGCATTTGGATGA +ATATAAATCACGCGTAAAAACCTTAAAAGCCATAATGCACCGTTGAAAAC +AAAATTTTTATTTCAAATTTAAAATGAAACGAACTATGGTAAGGATTTAA +ATCAAAAGCATTACGAATTAAAAAAAAAAATAAAAACATACTACAGAAAT +ATTTGTGGACTGCAGTCCACGTAGTGACGTAGCGCACAAGGAGAGTTTTG +CAATCGAAAGGTATTGGATGGGAAACAGAGCGGTAAAAGTGTAAAAATGA +AAATGTAATCTGTAAGGGCCGGTGGTGATAAATACCCCTAATATACACCT +AGTTGTATTTCCACTTAAAATACGCGTCGAATGACACCTTAACTGTCAAA +AAATGTATTTAGTTTTTCCCAAAACGTTATTTTAGAGTCCTGAAAGTTTA +AAACGATGTTAAACAACTCAGTTTAAGAAACATTAGTTTTACCACTTTTG +GAAAAACTAGTTAGTTTGCCGAAAAAATAGCTAAAATAACTAAATTGTTT +ACACCCGTTACTATACATCGCTAGGCATTTCGAAATACTACGTACGCTTT +TTAAACACGATTTTTCCAAATAATAACGTTTACAAATTATGGTCCAACGT +TTTTTTTTATATATTTTTTGTAGCCTTTTTTATGATTTCTCAAAAACGGT +TTTAACGATTTCGAATTAAATTATGGTGTATAGCCGTCCAGATTCCTCAA +CTTTTGACATAGAACACATTCTTGTAAAAAAACGCGTGTCAAAGTTATTA +ATCAATAAAAATGGCCACATTTACCACGGAAATTTAGTCGGAAAATATGA +TGGTGTTTTTTAACATATAACCTTCTATAACCTAACATTTTTAAAACAGT +TCTGAATTTCGAATTACATTTTTTTCAAAATCGAACGACTATATCATATA +GCTGTCGGAGGAACGCTCGAAAAATTGGTTGGAAAATAATATTAAACAAG +TTATAGCTTTGGGGCTTTTTAATATATTATCTTGTAATATTGGGAAAATA +ATTTTTTTATTTGTAAGAATTTCGAATTTAATAAAAATCAGACTACTCCA +TACAAACTTCGGCTTACCGAAGTTAACTTCCTTTCTTGTTTAAACTTGTT +TCCTATTTCTTAAAAGCTGCTTTAACGATTTCGCGCTAGGCCTTAGAGTC +TATACCCATTGACATTCCCTCACGTTTTTTATTCAAGAATGATATTTGCA +GAAGTAGAAGTTAATGTTAAAGAAAAAAACAATGTTATAAATATTTTGTA +AATTTTTAAAAATATTTTTTGGTTATTCCTGTTAGGATATAGTTGTCCGA +TTTAACTTACACATTACCTTCAATAGAAATAATGCTGAGGGACTAGTTTG +GATAGAAATGGACAGACGGACATGGCTAGGACTCTTCATTGGTGTCGGAA +ACTTATCCTTTACACGTTGCCAACTGCTTACTAAAAATATAGTAGCATCT +GCAGGGGTCTAATAATAGGTACACGCCTACTGTTTTACATACTAGTAATA +AATCAAGGCTATATCAACTTATCAAGTGATCCTGATAAAGAATGCCTTTT +TTATCACGATGGACAACATTTCTTTAAAGTCTTTAAAGATTACCTCTCTT +TAAATTTATTAACAGGCACACAAATATTTCCACCCAATATATACATTATA +CAGATTTTATAAGGTCCAAAACTATGCTATTGTAAAGGTTTCTTTGGCAA +TAAAACATTGATTTTGAAATCGTAAAAAAATACTTGACAAAATATTATTT +TAAGGCTGTTCCAAAAAGGATAATGGGTTCCTGGTAAAGTTAAAACCCTA +GGTCACAAAAAAACCTCTTAAATATTTTAATTAAAGTATTTTTCGATTTT +TCACCATTCTTTATATTGTTTTATATATTTATGTTTTTAATTGCATCTAA +CCAATTAGGTTATAAATGTAATTGTATAAATTTATAGTATACATTAAATA +TGTATATTGCGAGCTACAAATTGACAGACTTTAAAATGTTAAATTGTTCA +ACATCGAGACATGCACCACTTTACATTTACTTAACTGTGATGGACTATTA +GTTACTCAGCCAATAGAAGTTCGAGTGGGAACTTCTAGAAAATTCTGCTC +AGAAAATTATTTTTTTCACTAGCACACCTAGTCCATCCCTGCATTACCAA +GTCTATAGCACACACCAGCGGCTTAAAGGCGTATTGGATCCTTCTGACTT +GCTGCACGTTGTGTGTCTAGTAGATAACATTTAAATAGTGCACGTTTCGA +TAATCGGTCGGATTTTTTTGCGTTGTTACGATATTAACACGAGCTTTACT +GTAACTAAATTGTTTAAAAATTTGACATTTTTTTAGGTTTCCGATGTTTT +TACTAGTTTATACTTAATGTAGCCAATTTATTTATTCGGAAAAATTAAAG +GATGACATTATAGTTGTCAACCCAAATTAGTTGGGCGCAGCTCAAAATAG +AATTAAAAATTTGTATACAAAACAAATTTTCCTGAGGGTATTTTAGCCGT +TTTTTTACACAAATATTGACATACAATATATACAAATATTGACATTTGGG +AGATAAAGTACCTTTATAGGTAAGAATCTTAAATATTGTTCTGCAGCGGT +TCGAGTAAGAGTTAATTTAGTGTAATTATCACACAGTATTTTTAATTTTT +ATTCAAAAAGCTGGATACGTCACGACTATTTTTACCTCTTTTAAGAGGTA +CCATTTTTCTCTTTCTATACATATGTTTCAAGGATATTACCTTGTCGAAT +GCTACCACACGATATAAGAATGCCATCGTGAGCGTAGCTTACTACGAGAA +TTTTATTGTAATTGTTGACCAGCGATGTCTCTATGTCCTCCGGGCAACCT +CCTGCATGACATTGTGGTGAATCATTTACGGGTCCAGTGACAGCCTCAGA +CAGCACACGCAGGTTCTCGTTAAGTTTAAGTATTTTATTTGTGGCACCCG +CAAACAAGACATTGTTCATAAAATCGAAGCTCAGATGCGTAAAATAGTTC +TTAGATTGAGAGTCTTCACCGTTTTCTCCATTATATCCTTTTGAGCGATT +TCCATAGTTAGATGCTGACGTTATTGAAGGAAGGTTAAACTGGGCGACAA +TATCATTTGAGGGAGAAGATAACTGAGCCGGCGATTCTTTTGTGCAATTT +ACGGATTGATGATGCGTACTGAGTATGGTAATAATGCACAGTCCACATAA +CATATAAATAAAGTCCGCATAATACAAGCCCTTTCGCATCATATTTATTG +TTTTTTTGTATATGTTTCTGGTCAGATTTAAGTAGATTTTGAGCAGCAAT +TCTCAATAACATTTTAAACAATTACATCCTCAACAGTCTACTAAGTTTTC +AATAACATAATATTTAACCGATACACTTTGAAAGTTTCTTTGCAGGTATA +ATTTGAAATTAGAATTAGTTAGGGACTAAAAACTTCCGATTTTTTTTGAG +AGCATTTATAAAACATAATAAAAACCATTAAGTATATTAAGATTATGATA +TTTCCGAAGCAACGTTTAGTGTGTACACTATTATTCCTATCGAGGAGCAA +ACTAATCTAGGATATATCGATCTATCGAATACTTATTTATTCTCTTTGTA +ATACCCGATTCCCACATATTTCTACTAAACACGACGTTTCAAGCCATTAC +TCACTAGCGTATTCGTAAGCAAATATTAAAAATCTTAGAGATATCTGTAA +GTTCAATTCTCGGCTACTTATAGGAAAAGCAATTGCATGACTCGACTAAT +CAAAATACAAATAATTTAACAATAACAGAAAAATTATTTTATATCAACAA +GAAAGATCACACAATTATAGCTTCATGCACATAACTATAAATTCAGCATA +ATTCTAAATAAAGACCAGTACTTACATCGATGAAAACCACGAGCCAAACC +AAAGGGGTGAGTGAGCAGTAAATAGGCGGCTAATGCTTTTCATCTGGTCT +CTTTTTCAGCGCGGTATTCAGATGAGCTAAAAAAATACCAGAAAGATACC +AGATTTAAGAAGGGAATTTTAATAGACTTCGCTACCCGCGGCCCAAAAAA +TAAGACATTTATTTATAACTGAAGAAGAAATTTATTCTTTTGCTGTGTTT +GTGCAGAAGATGTGTGGAAACCGTAATTTAAAAATGGAATAGAAAACACA +TAAGGACTTCTGTGAATTAGGTGACTTGATTCGCGGAAAGCAACAGCACA +GAGGGTTAATCCTCAGAACAGTGAAAGTGTTAGAGAAAAGTAAAAAATTC +AATTGAGAAGCAGCATGACCAGTGAGACTTCGCTTCCTTGCTTAGACTTC +TACCGGGCGTGTCCACGCAAATAAAAAAAATGCTGTCCAATGGAATAAAC +GTTATAGTAATAAAAGTAACTTATTGGCAGAAACGAAGAGTTCCCCATTT +CCATTTTGTCAAAAAAGCCAGCTGCTAGGTACATGTACATATGTACTTTT +AAAACTGTTAACTTCGGTCACAGCAAATCTGAGTACTAGGCTTACATTTG +CATAACATTCTCTTGCGTTTATTTTTCTTTTTTTTGCTTATGACTAGTGG +GTTTCCCATTTACTTTCATATAGTCACTTTTAATGAGCACAACACTGAGC +ACTCGAACAACCAAATCTGATTTATGAAGAAGATATTTAAAAATGAATTG +CGTAGAAACAACAGTTTTGGTTTGATTAGTCATAGTTATTCAGATTAGCT +GTTACGGAGGGTAGATTTGTCAAAAATCCCAACCGTTTTGAATAGTCCAT +TTATTTATGGAAAGACTTACAACAAATTATTTTATTATATTATTTCATAA +TTTAAATAAATGTTGAAATTAAAAAAGTCTGTTTCCACAGAAAATCCGAT +AAACAGATAATCTTTTTCGTAATGAATAAAACTTTATTTCCAAGTGGTTT +TAAACTGTATTGCTGGTAATGAAAACTGAAAAAAAATGTAAAAAAGTAAA +TTAAATTATTAGTCAGTAAAAACAATATAATGATATATTTAAGCATATTT +AAGTTTGATGATAATCGAACCTTCGGAAAAGGGGTGGCACGCTTGGCAGA +TTTTGACTCCATATGCAAACCGTTATCGAATGGATGGGTGCTAGTTTTAA +CAATATCCGGCCGGATTTAAATTGGTTTACCGCCTTGGTATGTACTGAGG +TTTAAAGTTAAATACAAGTTAGTTATTAATTAACCAGGAATGCAATTATT +AAAATTATGAAATTATGAATATAACTCTATTGCAAAGTATTTGTAAACAA +TTCAATAGTTTTCGTGGAGGATTTAAATTCGCACGGCGGAAAGTTTTTTT +GACATTTTTTTTATGTTATTACCAGTTATTTGGAAATGACTCGAAACCGG +TTTGGGACATTCGAATCTGGCTTTTTTTCTAGTTGAGTTCCTTTCTTCTT +CATCCTTCACCAGCAACAATTTCTGTCTCATGGGTGAATTCGGATAAAAA +TTTTTAAAAATGTCATTTATAACTTCATGTATAACCCATTTTATAGTACC +CTTTTTGTATTTAAAAAAATGGTTTTTAAGGTTATCTATTGGTGTATCAT +TATCGTTTATTTTGGCTTGTGTATGTCCTTCCTCTAACATCTGTCCGCGT +GCTCTGAAGTTTTGGACAATGCTCCTAAAATATTAAATTTGTTCATTTTT +TTCTGTGTCCAAAATAAAATAAATTTTGATCTTCAAAACAATTTTAATTC +ATCCAGGAATTATATATTAACATTTTTGTTAACTATATATATCTATATAT +AGAAATTCATTTGTAATGTTTGTTAAGTTTTTTAAACAGAAACAGAATTT +TCTAGATTTTTTAGGTATTTATCCAGGGTGTCGAATAGAAACATTTGTTT +ATTTAATATATCATTATTGTATTTATTTAACCAAACATACATTTCATGTC +AAAAGCTTATATCATATTATATCTCATTATATCATTTATATCTTTAGTAT +ATTCATTATACTTATATTCATCCCTTATTCATTATATTAGTTCGTCGCAA +TCGTCACGACTCTTTACCTTGCACAAAAAAGATGTTTTGTTCAATATTAG +AAGTTCTTGTTTTAAAAATAAATTTATTGAATTAAAATTAAAGTTCCTTT +CAATTTTGCTGTTATACTAATCATACATGAGTGGTGTTAAAAGAGTTATT +TATTACGAAAATATTTAGTCGATAACAAACTTATAAATGCTTTTCTTTTA +ATTAAAAAGATATCTAATGGCTGTCAAGTAAGCTTAAAATGTTTTCGATA +CTGAACTGAAAGGGATTGCTTCTTTTATCGGTCAATATCTTCCAAACCGT +AATTTGTATGACAGAATCTATATAGTTTTAAATTTTTATATCCTTGCAGA +GAGTATATTGATTTCAGTCAGAAGTTTGCAACGCAGTGAAGGAGACGTTT +CCGACCCCATAAAGAATATATATTCTTGATCAGCGTCACAAGACGAGTCG +ATCTAGCCATATCCGTCTGTTCGTACGTCTGTCCGTCCGTCTGTCCGTCC +GTTTCTACGCAAAATAGTCTCTCAGTTTAAAAGCTTTCGGGCTAAAACTT +TCCCAAAAGCCTTATTTCTCTTGCAGGTAGTACTTATATAAGTCGGAACC +AGCCGGATCGGATATCTATATCTTATACTTCCCATAAAAATTATAATTAT +GTGTTTGGTGTTTTTTAACATATACCCTCCTACGCTTGGAAATAACATTT +TTTTAATTAGTTCTGAATTTTGATTTCAATTTTATCAAAATCGGACGTCT +ATATCAAAGTCATAAATTGGTGGATCGAAAAATTGGTGGGAAAATAAAAT +GAAAGTTAGTAATCCCCTTCTAGTAATGCTGCGTCCAGCAGCTAGTGGCG +TATTGCTAATTTTCAGCATGTGATGTGCAAGCTCAATTGAGATTGCAAAA +TATTGAATATATTTGGGTTTAACTTTTAAATGTGTAGTTCGATTATTTTT +TGGCACGTAGATGGGTATTGATAATAAGAGAACAATGTAATTTACTTTTT +AACATAATATTAAAAAATGTGCGAGCTAGATGGTTTCTATTGTTATGTTA +TTTGTGAGCGTTGGCACCCTGCTGACAAATTTGCGCTGCGCAAGAAGCTG +AAAAATCTACATACCAAATGTCAAACTTATAGCTTTTATAGTTTCCAAGA +TCTCAGCGTTCATACGGACGGACGGACAAATGGACAGACGGACATGGATA +GATCGACTATGCTATTGATCCTGAACAAGATTGTATACTTTACTGTATTG +TACTCTGTCGAATCTAGTATACCCTTTTACTCTACGAGTAACGGTTATAA +ATATATACCTTAATATGATGTTTTCATTTTTTTTTCAGTTTTTTCTAATC +TATTTTAATGAACAACAACGTAATTTCTACCAAAAAGGGCGTTTACCCGC +CACTTTTCGTGACAGATGAAGAGAGCCGAAGTGTCTCGTGCGAACTTCGC +GAGAAGTGCAATAAAGTCGATTAATTAAATGGAAACAAAACACAAAAACT +AAACAGGCTAATTTCAAATAAGCAAATTTTATATTATAAAATATTAATTA +CTGAGCTATGAACAAAATAAAGAGCGACTAAGTAAGAAAAAACGACCCTA +CTGTCGGTCGAAAGCCAAATCATGCCAACGACGTGGAGTTAACAATGCGA +AACCCCTCACCATCAGTTTCGAACCTGGCGCACCAACAAAATGCAGCGGT +AAAACTTCTGCATCCGCACTACATTTATCAGCAACACCTACAGCTACGGC +AAAAAAAAAAAAACAACAACATCCACAGCTGCAGCCGCAGGTCTAAATAC +AACTGCAACAAAAACCACGACAACGAATCAAAACAAAAACAAAATTCAGC +AAGCGGGGGTGGACATATAGACCGGACTAGCTTTTACCAGAAAATGAACC +AGGCTGTTTTCATTAGGGAGAAAATCTCGAATGCCTTGGTTAACGGGGAC +GGAAACTTTCATGTTGTTCCGGTCACAAAACGGGATATATGTACATGAAA +CCAAGCTGCAGACCAAATATGAAGAACATTTCCGAGTTGTATCACAATAC +CTGAAAAGAAAACTAGAAAAAGCTACTACACTTACCAAGTAAAAAGAAGC +AAGGACCTGCAAGTGGTACTAAAAAAAAATCGAGCCCGACGTAATTGCCA +AGGAAGTTATCGATACTCTCAAGGAAAACGGGTTTTCTACAAGGAACGTC +AGTAACATTATTAACATGAAAAAGGAGCCGCACCTATTCTTCATGGTCGA +GCTGGAGCCAGACAGCAAAGTCTTGAAGAAAAATGAAGTGCACCCCATTT +ATAACCCGGTAATACTTATTGAACCGAAGAATTAACGTGAAAGAGTAAAA +TAAAAGGAACGTCCCAGTGCAATGCACAAATTGTCAGGACACACCAGGGG +ATACTGTTCACTTTGAACAGTCTGAAAATTCGGCTTACTGCCCTGCCCCC +AAACAAAAAAAGCGTTAACTGCCAAGGTAAGCACACTGCAAACGACAAGG +GCGATATACAAAGAGATGAAGGACCGCATGCGAAAAGTGACAGCAACGAA +TCATCAGAATACCCAAAATACGTACACTTCCTCGCATGCACCGCTGTATG +TATTTTTCGGCAAGGCTGCAAGATCCTCATTTGGTCAACTAAATACAGAA +GGGCTTCTCATACGCCGACGTCCTTCGATCAGGGACAGAAAACCCTTTCC +AGTTTAATCCAGGAAACGCTCAGCAGATCCAAGTACAGTCACAAAGCACT +CTGGAATCTATGGTGGTCACCAAGTAACAAAGTATGATGGAATTTATGTC +ATTCATGAAAACGACCATGAAAACACTGGTACAACATCCTCGTAGTAGAG +AGGGTGCTATCTGGCGGATTAAAAAAAAATTAACTGGACTACAAGGGTTT +GCTCTACATCTTCACTCTCAATCCGTACATATGACTCCCACATATGGGGA +ACACAAACATTATTCAGCGCTTTCAAATTAAAATCCTGAGAACTATCATT +GGGACACCATGGTATATTCGGAACCAAAACATCCACAGGGACCTCGGCAT +TCTTACCGAAAAAAAGAAATAGACAAACAAAAGCGTCCTACAATGAAAAA +CTCTCTGTGCACCTCAATCGCCTCGCAAGAGGCTTTACTTGGGTTTTCTG +TCAATCCCGTTTAAAACGCAACGATCTGCCAAGCCAGCAATAACTTTTGG +CCCCCTTTGGCACAATACCAGTAATATGACTGTTAATTAAATTAATTAGT +TTAAGATTTGATATACTTATTGCTAGTATCCAAAGGGAGAAGATTTAATA +AATAAATAGCATAACAAAATAGGTGCTTTTTTTTACAAATCTTTTTTTTT +TGATTATACACAAATCTAAAAACCGAACACAAATTTTTGATTTCGCTTCG +AAGGTTATAATTTTGTCCACAATAAATGGTCAGAAACGCCAGTCAAACAA +AAGTAATGCACATTTTCTCAAATTTTTCAGTCACTCCCAGTCGTAAGTTC +CGGAAGGTTTTTACAAAAAAAATAGTTCTGAGATGCAGTCTATTGCGGTG +CCCTCTAGATGTGTTTCTAATTAGTGCTTTCAGGTGTATTTTACTGGGAG +TTAAAAAAAAAATAAAATGAAAATCCGAAAGTGGCCAATCCCCTTTTTTT +CTACAATCGGTTTCGTTCGAAAAGGGTACATGCAGAGATGCGCGTGGCTT +TTATCGTCTCTTAGTTTTTCTAGTTAAATAAAAATTAAAACCACAAAGGC +ATATGTTCATAGGTGCGTAGTAAAAATTACGCAATACATTGTAATTCTTC +CAAAATAAATTATTTGCATATTCATAATTAATATATGTTTATCAAAGTTT +AACATTCGATATAAAGCTTTCAGAATCGCAAAAAAGAGATGAGCCCACCA +AGGACTGGACTGGAGCTTAGGAGGTAATATATTCAAATACACCAAAGGTA +TAATTTTTTCATATTATTTCCCCACCAATTATCCGATCGTTCCTTTGACA +GCTTTATGACATGGTTGTCCGATTATGTTAAAATTAAATTAAAAACTAAC +AAATGTTGTTTCGAAGTGTCAGAGGCTATTTATATGTTTAAAAACACAAA +AAAAACCTTTTTTATTCCTATTGTTCCCATGGGAGCTATAAGATATTGTT +GTCCGATCCGTCTGGTTCCGACTTATATACTACCCGAGAGTTTTAAAACT +GAGAGACTAGTTTGCGTAGAAACGGACGAAAAGAAGCATGGTGACGCGGC +GCATTTAGATAGCCCTATAGCATTCCGTTTTCGACTTCTGCATGTTGTTG +CTTTCCGCGTTTTTGGCATCTACATCTCTATAGTTCTGCTGTAGGCTCGG +AGTAACATCCCTTAAGTTCCGAAGTAGACGCGCAGTGACATGTCAGTTAC +TGGTAGAGTATTGTAGGATTTTTACCGAAATCTGTTTGCCAAAAATATTT +TGTTCCGTGCAGAACAAGTGGCAAAGGTCGCCACAATAAGTACAGAACAA +ATTGGGCTGCGGAGAAGTGAATACGCCATCATTTCTTTTCGTACTGATTT +TATTGAGCATGGATTTTATATACATGATTTGGGTTTACAAGGATATTTAT +TTAGGTCTAATTTAGATAAAATGGACAAAATGTTTTATTATAATAACCAT +AGCCTAAATAAGCAATTACATCTACCAGATGGTATGAAGGCACATCCGTC +GGTTGGGTGCATATTTATGACCTGATATAACATGCATATGTGCACAGACC +ATACCCAAAAATCTGTAGCGCGTACAGGTTTTTATGATGGAAACAAAACA +TTACCTGAAATGTGTTTGTCTCATCAATATCTATATCTATTTATCTCTTG +CTCCCTTTTTATACCGTTACAGAGGGTATAATAATTTTAGTCAGAAGTTT +GCAACGCAGTGAAGGGGACGTTTCCGACCCCATAAAGTATATATATTTTT +GAAACTAGTCTCTCAGTTTTGAAGCTATCGGGCTGAAACTTTCCCAAAAG +ATTTCTTTCTATTGCAGGTAGGAACCAGCCGGATCGGACCACTATATCTT +ATCCATAGAAACTATCGGGGAAAAAATTAAAAAACTAATTATATCTTCGG +TGTTCTTTAACATATAACCTTCTAAGCTTGGAAATAACATTCTTAAATTA +TTTCTGAATTTCGAATTATTTGATCAAAATCGGAAGACTATATCATATAG +CTGTCATAGGAACGATTTGAAAATTGGTGGAAAATAATATATAACAAATT +AAAGCTTTGGTGCTTTTTGACATATAACCTTCTCATCTTGGAAATAACAT +ATTTTAATTAGTTCTGAATTTGGAATTAAATTTTATCAAAATCGGACGAC +TATATCATTTAGCTGTCATAGAAACAATCGGGAAATTAGTGGGAAAATAA +TATGAAAAAATTATTTACTAAAGTTGTTTATTTCTATAACTGCAAGTGTA +TACAAACTTCGGCATGCCGAAGTTAACTTCCTTCATGATTCTCGAGACAC +TCTACTGTAGCGTTCTTCGTGCCGACGAACTTCGGAGATTTCACTCTCTT +TTTGTGTCTTATAATTGCCTATCCTCGGCGCTCGGAGAGACAACCTTCGG +CCGGTCCTTTTTTTGCGTCTCTCCGATATGTTCAGAAAGAAACCTCTGTT +TGAGTTATAAAAAGGGAAGCAGCAGGCTGCTTAAATTTTGCGCTGCGACA +CATTTTGATTTATTCATAAAGTGATACCTTTTAAAAATAATAAATTCAGT +GTAAGTTTTTAATCGTTGATAGAAGTTTAAAGTACTTTCTTTTTTAAGAT +GTTTTAAAGGTTTTACAACATAAGAGAAAATTCTGGTTCCGTTACCCGAA +GGTGGCATAGTGAAATGTTTTGTGCCAATGAAAATCCCTGAAATCCCTAA +ATATACAAGTAATATATACAAGTTGTCGCGGAACGGATTAGGGCTATCGA +TAGTTAAGTTTGAATTTAGCGACTCTAGAAGTCAGTATTATTTAAGTGAC +GATTTTTAGGGTTATATTATTGGGTCACACTAAATCGGGTGATGACGAGC +TTAAAATTGGAGGCACGGTATACACCGATTCGCTCCATCACATTGGAGAT +GATGCCGGCAAAGCACTCGCCCCGGCGGAGCCTCAGACTGGATGTCTCGG +GTACTCCCGCCACTGCGACCACCACAGCCACAGCAACTGGCAAGCAGGCC +AGCTCGGAGAGGGTGGCTGGTGATCGGCAGTGGCCACAGACTCCGAAGGA +AAGTGGAGTAGCCGCCAGGAAAGCGACAAGTAACGGGGCAGATTACGGAC +TCCACTACTGTAGAAGTGGCGACCCTAATGGAAAGGATCGCACATTTAGA +ATCGGAGCTGGTGAAGGCAAGGGCAAGTGAAGGACAAGCAGAGGCCGCCA +GGGATCCCGTTGAAAGTGGGGCACGCGTCGTTGGAGTGAACGGTGTAGCG +AATTTGAGTGCAGCCTGAAATAGGTTGTGTTCACCCTCCAAGGGAGCCGA +CACACAATAAGCGTCAATACCTAGATGGACGCCACGTAGATTGCCTGAAC +TTCCCGAGTTCAAGGGTCAGCCAGAGGAATGGCTAATATTCCTGTGCGCG +TTCACGGAAACAATGGCAGCTCACCAGTGTACAGAATTGGAGAATAACCA +GAGGCTAGTGAAAGCCTTTGAAGGGCGAGGCCCGAGCAGCAGTGAAGTCG +CTGCTCATCCACCCCAGCAATGCGCAAGCTGTTATGGAGCAGCTACGATT +CTGGTATGCACAACTGGAGAGCGTGCGCGTTGTGCAGCCAATTCAAGATG +CCAAGTGAAGGGTTCTGCATGCGAATACTGTTCGCTAGGAGGAACGGTAT +GCAGACCGCCCCAGATGTTGCCATATATGTGGAGGACGCTTCTTCAACCA +CGCTTCTACAATGTCGCGAATCGAGTCCGCCAGGTAGTTAAGTTTATGTT +TTTCATGTTTGGAGTATGGATGCCTATTCTACCTATCCCTGACGGTCGCC +AGTCGCAGATGGAGGCCGCAGGAGGGAACAGAAGAGCAGCTGTACAGAGA +CGGCAGCCGACAGATACGAATGCCACAGTCAGTGGATTCCAGCAAGAAGA +GCCTGCCTACGTCAGCCGCAGTTATAGACGCGGGACCCGATGAGGACGAG +GGGCGACATGCGAACGCCAGGAATTATCGCACCGAAACTTGAGTTGTGTT +GAATCGACTGGAGGTCACCTCCTATTCCGGATTCTTCCCGTGACGCTGTA +CGGAGAGAATTCGCAGGTCGACACCTGCGCTGGATGAAGGATCGTCTATC +ACGCGCATCGACGACGAACTCATCTGCAGTCTGAACCTGAAAGGCGAGAG +TAGACAACTGAATGTGCATTGGTTTGGCGGAAAATCTGCCAAAGAGCGCA +CGAGAATGGTTAGCCTGCAGATCAGTGCAGCGGGCAAGCCAAATCGCCAA +GTGGCCAATTTGAACCTTCCGATGCAGAGCTTGCGTCGACAGCCCTGCAA +GCATTTTTATCGACACTTCTAAGTGACTTCTAGGAGATGAAAACTATCGT +CCGCGATATTGCATTCGGGTCGCGGAAGTCACTCCCGTCGGGAAGAAATG +TGCCATTTTGGCGGCACTTCTTGGAGTCACTTCGGCGAAGAAATGTGCCA +CTTCGGCGGCACTTCTTGGAGTCATTTCGGCGACCCTTCGAGAAGTCAGT +TCGGCGACTCTTCTTGAAGTGTCTTCGGTGCCACTTCCAGGAACGACATC +TGAAAGTGTCGCCGAAGTGACTCCGAGAAGTGTCGCCGAAGTGGCACATT +TCTTCCCGACGGGAGTGACTTTCAAGATCCGAATGCGATATCGCCGAAGT +GACTTCTGAAAGTTACTTAGAAGTGAATCAGATAAAAACATTCCTAGGTC +TGCGGCTATAACAAAACCAATAAAGAGACAATTAAAAGGATAAAAGGATC +AAGAAGCAAAACCTTATAATGCAACAATACGATCTTACAGTTTCCCGATT +TTGTCAAACCATTCATTCTTACTACGGATGCAAGCAACTATGCGATTTGC +GCCGTATTATCGCAAGGAAATTTAGGAACGGACAGCCCGATAGCATACTA +ATTAACATAACTAAGAGACCATAGAAAGAGATATGCTGGTCATTATTTTT +TATACTCCAAACTCGTAAGGTGGCGACTCCAAATGTTGTGTATAAAAAGG +GCTTCCTCAATTCAATCTGAGCTCAACGTGTTAGAAGATGCCTCAGATAT +AGCGACAAATGGATTCCCAATATCAAAAAGACCACTAAATGAATATAATG +TTCAAGTGAATCTACAGGAAGAAGAAAATCAGGAGTAGTAAATAAATTCT +ATTCAGGACTAAATTACGAGTAATTTTGACGGAAAACAGTTTTGATGACG +AAACAATTGAATGCTAAACAATGGAATGCTAAAAGAAACTCTAAAACCTA +AAAGAATGGTGGCGTCGTTGATTCCGGAATACTTGGTGATAATAATCCAA +TACGAATATTGCAAATACTTTGCCAATAGTAAATTGTATAAGGCCATAAG +ATGAACAAGAAAAATGTACTAACCGTAATAAAAAAAATTTCGAAGTACGC +TTGGGGACTTACAATCCCAACAAATGACATTAACGTCAACCAGACCACAA +GAAGAAAACCAGAAAATTAACCAAACCAAACGATTAAATAATAACAGGTG +GTTAAGGACTACCTGCAGCAAGGAGCTTTGAGATTCGGCCGTTATCTCGG +CGAAGATAATACAGACGCACAAGACATTCATACACATAGTAAGGCTACAT +GAATACCAAGAAGCTGTAGAAGGCAAAAAGCAAACGCTCAGGGACATGGT +AAAAAATACAAAAACGAAGGATCTGGTGAGAGCACTTCAAAACAAACTAC +AAATGATGAAGGCAAGATTGGAAGCTATATTTCCAAAGAGTAGGAGAACG +AGAGGATTAATGAACGAATTAGGTTCAGGCATCAAATCGATAACTGGGAA +TCTAGATGCAGAAAGGCTAGTAGCAGAGATAAGGAGAATGCAGGAAGAAG +AAAATGGATTGAGAGAAGCCATAATCTCTCAGGAAAAAAAGGGTAGCAAG +ATCAATATAATGTTAAAAAATGTAACAAAATACATTAATAAAGAACCTTC +CTAGAGGAGGACAAGAGGATTAATAGGTTAGAGTACATAGACAGGAGTTC +GAAACGATAGATATTTTGGGATTAAATTTAAGTGATATAGTAGAAAGCTT +GTTGATTTGACAAACAGGAAGCAACAAAGGGTGTGCAAGAGTTAGAAGGG +CAAGGTATTCAATATAATGTCTGAAGAACATATGTACAGATATTTTCCAT +AAAAAGGGATCGTGGGATAGTATAATAGAGTTTGTAATAACACCGGAATA +TCTAGTAAGCAACTAGGAAGAAATATATTACTATAAGAACAAATATCAGA +GAGAAGATTTATAATTCTAAACCAAGAATTATAAAATTGTAAACCAATTT +AACGAGAATTGTGTTAGGAAGCAAATCAGAGGAAATAAAGGAGGTAACCT +CGTTAGCAGGATTTTCAAACCGGAAGAGGGTTACACCGCAATATTCAATA +GAGAGAATGTAAAATTACTAACAAATTGGGGACACAAAGGAACCATAAAT +GGATCAGAACTTATCATATTCAGTGAGTGCAGAGCCATGGTAAAAAACAT +CCAATACGAAACGATGAAAAAACTTGGTACAGCGCCAGAAAAACCGAACT +ACCCAAGAATTGGGAATTCTGGCACAGCACCAGAAAAACCGAACTACCCA +AGAATTGGGAATACATGAGCTGAAGATGGAGGACATCAAGACGAAATTAC +AGAATAGAATACAGAGAGAAGTTACCGCCTCTGCAATAACCGAAAACCTC +CGGCAGCCAAACATCTAGCAGCCAAATACTTTGTTCGCAATAAAGTTGCC +AACCAAACACACACATCGGGACTACTTCAGATCCAAACCGCACATATGCT +AGGTCAGCATAATTAGATGTAATCATTTAAGCATTAAAGACGAATTATAA +AAAAAAAATTTTTAAAACCACATCTTGGTACTGTGTATTATTGAGACGCT +CCCCGAACCAAAGTGGAATACCTTTCTCTCGAGCTTACCATATGAGTGAA +CGAGAGGCAAATACGCGGCTAACACTTTTCGTCTGGTATTTTTTTCAGCG +CTGTACTCAGATTAGCTAAAAAAATACCAGAAAAATACCACTTTTAGCAA +GTGAATTTCGATGAATGCCACGCCCACAAGAAATGTTATCTTTGGCTGTG +ATCGTACGGAAGCCAAGTGGAAACCACAATTTAAAAACTAGGAAGAACGC +TATAGCCGAGTGCCTCGACTGATAGTCGATACCCGTTACTAAGCTTAAGG +GAGCAAAAGCGAAATGGAGATATATAAGCAGCAAAGCGATTAGGGCGCCA +CCTACCGGCCTTTTTAGTAGATGTTATGTGGACGGCAGACAGTTTTAAGC +TTTATAACAGCTTGTAGGCGTTAGAGTGGGCGTGGCACTTTTTTTTAGTG +AGTCGATAGGTATTGATGAGACAAATACATTTCAGTTAAAATTTTGTTTC +TATCAAAAGAACTGTAGGCGCTACAGATTTTTGCTGATTGTGGGCGTTAG +AGTGGGCGTGGACCCGGTGAAACAAACTTGCGCTGCGCAGGAAGCCCAGG +AATTTGCATATTAAGTTCTATCTCTTATAATTTCCGAGATTTCAAAGTTC +ATACGGACAGACGGACGGACATGGCTAGATCGACTCGGCTAGCGATCCTG +ATCAAGAATATATATACTTAATAGGGTCGGATACGCTTTTTTCTACCTGT +TACATACATTCCGACGAATCTAGTACATCCTTTTCCCCAAGGAGTAACGG +ATACAATTAAAGAAAAAAAAACTACCCATTACGGTGAGATTTAACCAGAC +GAAAGGAATACCACAACTGGCGAATCCGCAGAATATTGGGGTCACGGAGA +TAATCCTACCGAGTAGGCCCTTTAGAAGGAGCATGACCAATGGGACTTCG +CTGCCTTTATTGACATCCTGCCGGGTGTGTTCACGCAAATGTTTGGATTT +GGATGACATACGTGAAACTTCAATTTCCACATCCACCATCTATCATCCGA +TAACGACTTATTTGAAGCCCTGTGTCTAATCAAACCAAACCTATTGCTTC +TGAGCGTCCAATTTTAAATGTTAAACTTCTATTTCCATAGGGCGCATTTA +CCATCTACCATCCGATAGTGGTCTAGCTAATCTTAGTGAATAATGGTAGC +GAATATTTCAATTTACACTGACAAAAGGTAAAATGAAAACCGGTGCGACA +TAATTATCTGGATTCACTTTTTTATTTGTTTATTTTGTACCCTTACAGAG +GAGATAATGATTTTAGATTTTAGAAGTTTGCAACAATACTAGACGAGTCG +ATCTAGACATGTCCGTCTGTCCATCCGCTTATACGTAAGCTAGTTTATGA +GTTTTAAAGCTATCAAGTTGAAACTTTCGCCAAAATTATTTTTGCACATC +GTACATCTATATCTTAAAGCTCTCATAGGTGGAATAGGAAAATTGGTGGG +AAAATAAATAAAATATTTTATACTATTTGGAACATACGAGGTGTGTTCAA +AAAGTAAGGTGACTTTTCAAATTTCGCGGGCAACATATTTTCGATTATCG +ATTTTTTTGTTTTGTTATGTTGGTACACTCTTCCCTAACATCTGTACCAA +GTTTCAATTGAATCCCCTTTTTTGTTTAGTTGTGAGAGGCGTAAAGGTAA +CAAGTTGTTTTGCGTGCTCAGCGATTTTTTGCTATCGAAAAATATGGATC +AAAGGATTTGCATCAAATTATGTTTAAAAAATAAAATAAGTGTTCCGAAA +CACTTGAAATGTTGACAGTGGCATACAGTGAAACTGTTCTGAGTAAAAAA +AAAATTTCAAGTGGTACAAACTCTTCCAAGATGGCCGGGAAGATGCCAAT +GACGAGCCTCGCTCTGGACGCCCAAGCACGTCAACAACTGATAAAAACGT +TCAAGCAGTGAAGAAAATTGTTTTGGAAAATCGTCGAATCACTATCAGAG +AAGTTGCTGAAGATGTCGGTATATCGCTTGGCTCGTGCCATGACATTTTA +TCAAATGTTTTGGGCATGAGTCGTGTGTCAACGAAGTTTGTTCCAAAATT +GCTGAATTTTGACCAAAGGAACCGTCGCATGAGCATCGCTCAAGAGCTGT +TGGATGACGTCAACGACGACCCAGATTTACTCAAAAGGGTCATAACTGGT +GACGAATCATGGGTATATGGTTATAATATCGAAACCAAAGCCCAATCGTC +ACAATGGAAGAGCCCAGGTGAGCCAAGACCGATAAAAAGCACGCCAAGTT +CGATCAAATGTCAAAGTTTTGATCACTGTATTCTTCGATTACCATGGCGT +GGTGCATCAGGAGTTCTTACCATATGGTCGTACGGTCAATAAACAGTATT +ATCTGGAAGATATGCGCCGTTTGCGAGAAGCAATACGAAAGAAACGTCCA +GAATTGTGGAAAAACAATTCATGGCTTTTGCATCACGATAATGCCCCTGC +TCACTCATCTTTGCTTGTGAGATAATGCCTCAGCCAGCATATTCACCGGA +TTTGGCCCCATGTGACTTTTTCTTGTTCCCAAAACTAAAGAGACCTATGA +AAGGACGGAGATTTGCAACGATTGAAGAGATAAAGGCTGCATCGCTGGAA +GATCTCAAGGCTATACCGAAAAGTGCTTATGGGAAGTGCTTTAAGGATTG +GAAAAACCGTTGGCATAAGTGTATTGTATCTGAGGGGGATTACTTTCAAG +GGGGCGACATTAATATTGATAAATAAATTAATAGTTTTTCTTGAAAATAC +AAAGTCACCTTAGTTTTTGAACACACCTCGTAGTTAGGACTTTCGAAATA +AATTTTAAAAATATGGGATGACTTTAAGGTATAACGGTCAGAGAACATTT +GAAATAATAATTTTAAAAAATGTTTGCTTTGTTGTTTTAATATCACTGAA +GCTAGCAACAATCCTTAAAAGTCTAGCATGGTGTTACTAACATTGATTAT +TGATTTCACATAAAATACACATGTTTCAAGAAATATTTTACACAAAGACT +CGATAAAAACATGGATTGAGCATTGAATAAATATCGGCTATTTTTTCAAC +CATTTTTATACCCTTGCAGAGGGTATAATGATTTCAGTCAGAAGTTTGCA +ACGCTGTGAAGGAGACGTTTCCGACCCTATATATATATTCTTGATCAGCG +TCACAAGACGAGTCGATCTAGCCATGTCCGTCTGTCCGTCCGTCTATAGG +AACTATCGGGGAAAAAATTAAAAAAAAATTATATATTTCGTGTTTTTAAC +ATATACCTTTCTAAGCTTGGATATAACATTTTTAAATTAGTTCTGAATTT +CAAATTAAATTTCATCAAAATCGGACGACTATATCATATAGCTCCCATAG +GAACAATCGTAAAATAAGTGGTAAAATAATATTGAATAATTATATCTTCC +GTGTTTTTTAACTTATAGCCTCCTACGCTTGCAAATAACATTTTTTATTT +GGTTTTTGATTTCGAATTAAATTTTATCAAAATCGGACGACTATATCATA +TAGTTGTCATAGGAACTATCGGAAAATTAGTAGGAAAACATGAAATAAAA +ATTATATCTTTTGTATTTTTTAACGTATAACCTTATAAGCTTGAAAATAA +CTTTCTTTAATTTGTTCTGAATTTCGAATTAAATTTTATTAAAATTGGAC +AACTATATCATATAGCTGTCATAGGAACGATGATAATAATTGGTTGGAAA +TAATGTGAAACAAATTATAGCTTTGGGCCTTTTTGACATATTATCTTATA +ATATTGGGAATATACATTTTTATATTTTTAAGAATTTCGAATTCAATTTA +ATAAAATTATTGATTATTTTTTATAACTGCAAGGGTATACAAACTTCGGC +TTGCCGAAGTTAACTTCCTTTCTTGTTTAATTGATTGTTAAAAAAAAAAT +TAATATGTTTAAAAAAAGTAGTTTCCAATGAGAGTTGACTCGGTCCGACA +AGTTCCGTAGTTAATGCTTGATCCCTGGCCCACAGGCCATTGTTACCGAA +CGTTATACACAATCACAGAATCTTACAAGAACAACGCACACTAGCAGGAT +CGAAAGTCCACATCGAAAATCAGCACCAAAAATATTGCTATACAGTCCGT +TTTATGGATGTTACTCATAAAAAAGTCTATATTATCTTTAGTGTGTCCGT +CTGCCCGTGTGAACTCTGGGATCTCGAAAACTATATGGTCCCCAGCTCTC +ATTTGGGTTTCTTATTGTCGTACGCAACGCCCAAAAACCTCAAAAAAATG +TGGCACCTACATGTAATCTTAAAAAAAAATGTCAACCGAAATATATTGAT +CTCGTTAATATCTATCGATTGAAAAATTATTTGCCACACCCACTGTAACG +CCCTTCAAGCTTAAATCTTTCTTCCGCCCGCATTATATTAAAAACGATTA +AAGGTTTTTTACAATCCCGTTTTGCTGAATGTATATCTTTATCTCCCTTT +TGTTCCTTTTATAACCCTCATATAAAAGGGTATCCGATAGTCGAGCACTG +TCCGTCCCACACAATGCCTACAATCTGACATTTTTTTGTCTCATCAATTC +CTATTGATTTACCTTAAAAAATTGTTTTCCATGGTCACTCTATCTTCTAC +AAACGGCCAAAACAATATCGCTTTGCTGCTTATATACCTACATTTCCCTT +TTGCACTTTAAGTGCACTGAAGCGGTGCGACGCGGAGCGGCGCGGCGCGG +CATGAGGTTGGTACATTCAACCGAAATCGTACGCTCGAGAAATGCAGGCA +AACGCAGGTCACAGTCTGTTCTCGGCTCTGAGTATTATCGATAGCAGCCG +AAACATCTCGAAAATAGCAAAAGTTCCGCAAAAATATGCCGCAGAGCACC +GCACCGCTCCTTTGCTCAGTGCTCGCACCTTTAAGATAAATAACGGGTAT +GTTACCTGTTATCGGTTGATTCGATGAAAGGATATATCCAAGTACTCATC +AATATTTTCCAAGTTCAATCAAGTTCAATTAAGAACACACCATAAGCATC +AAACCAACTGTTTACACAGGCCACAAAGCCCATACGACGCTATATGCTAA +TTGACCTATAAGCTAGGTGACGCTAGGTGGCGTTTTTATATTTAAACCGT +TTACACTTAAAGGTTAATTTGAATAAAAAACATATATGTTCATTAAAATA +TTTAATTACAAAGAAGGATTTTAAGGAATTTATGATTATTCGGAAGACAT +ATTTATTGCGCATAAATCATCTTGTATGGTGATTCTGAATTATGTTCGGG +CGAAATCATTTATATTATTAAGATTTTCGACCGAAATTTAAAAATTGCAG +TACAAAAATTATGTAAATTTTGACATGGTTTGCAATTCTGTTGGTAAATA +AATAGGGTTAATATTGTGACTGACTTTTGTATATAGATAGAATTCTTTTG +TTAGATTTTTCTACAGCATCATATGAAGATATCTATTCTCCTCCAACAAA +GAAGTCAGGGATGTTGTCATATCGTTGATTACCAAATTTGTCCCGGCATA +CGGATGTGTAGAACTGCTAACATCAGACCACAATGTATTATTTGATTGAA +TTTGATCGCCAGATGAGTTGTTTGTATCCACCCAGTTCTGACAACTTTGT +ACGTATTCCAAAGTGCGCTGGTATGTATCTGACACCATTGAGCTCGTATT +ACTCCCACCAACCGTCGTTTGTGTGTTCGGCTGACCAGAAAATTTTGAAT +AGGTTAAGGGTAGATTCTTTAAGGTGGAAGTTTCTCCATCGTTATTTATG +TTTATAGAAGGAGACATTTGAGACTGACTTACTATGCCGCATTGAATCTC +GCTATTTTGGTCTCTATGTAGTTTGGAAACATTTTCTGAGTTTATTTTTG +TAAATATTGGATTTAGCTCGGGCAAGCTTGTCATTGATGAGTCAATGATT +TCATTTTGATTTGATTTAGTTATCTGTGGTTGATAGGCTGATGATGGGTA +TGGTTGTTCCTTGAAACCAATATCAATATTTATAGTTTTGTCTATCTCTT +GGGGAAAGCTTCTGCATTTCGTTTTCTCATGCTGGTGTGGCACTATATTT +TGTTCCCTCTGGCTAGGTAAACCCCCAATCGTTGTCATTGTATGCTCTTC +TTGCGTTTGCAAGTTCGATGTATTTGGTTGTAAATTTATTGATACATCAA +AATTCGAAGTCGGTAGTATAATTTGTTTTTTTATTGGATTTAAATTTGAC +TTTGAAAGTAATAGGTTTTCGTTTGATTTTATGGTTTTAGGTACAGTTGA +CCTTATAGCAACATCATCTTTCTCCATATAATTTTGATCGTCCTTCACCA +AATTTAAATACTGAAGCATCTCATCGGGAAGTATAAGCTCTTCAACTTCA +TCCAAATTTATTCTCTCATTTGGATGCTGCTCGCTGGTCATTGTCATTTC +AGTCTTCATTGTAGCATGGCAAGGTCCCTTTCTTAAAGTATTCTCGTTAC +TAGACGATGTTATATTCACGTTCCTAGCCTTTCCAATGGGAAACTGCAAA +TTTTGCAGTGGGCCACTTAAAGGAGAAACATTTGTTAGTGTATCCAAACT +TATGTTTGGCATTGGCTCAGATTGACGTCGTAATATGTTATTCGGGATTT +CTTTATCAATTTCCTGCTCTCCAGCCGGTCCATTGTAGTCTAAATGTAGA +GATGGCGTACAATTGGGAATGGAAAATCGACCGCCAGTTGTGTTGTGATA +ACAACTCCTAGAGTCTGTGTCCTGCAGATGCTTCAAATTGGTGGCAATTA +AATGAGACGATGGAGGTGGAGGAAGACTGTTATTGTAAAAACCAAAGTAC +TGACCACCAAGACCCGGTTTATTAATAGAAGCATTTGGGCTGCTGTTTGC +ATTTAAGTCCTTGTTAATTGCAGTCAATCCTGATGTTGATGTAAGTGCGT +AGGAGTTGACTACATTAGACATTTGGCTAGAGCGTCGAGAGCATCCTGGG +GAAATTGGATCATAGAGGGAAGCTGTGGTTGTGTTGTACGATGGGCCTGG +ACGCATTGTAGATATAGAAGACACCTGAGATGATTGACTACTGCGGCGAC +TTTGCATGCTACCATAATATGTACTTGCAGTGGAGTTCTGGCTATCGCGA +CGAAAATGTCCTTGGAGAGAGCCGGAAGCGGTAAAGAAGCTTTGCTTATT +TAATGTTATATTTGATTGATTTTGTGATAAGTCTTCTGAAATCCTTTCCA +GCCCCGTATTCAATGGAACTGTAATATCACAAGCGGTACCAGGCTCCATC +TTAAGTTCTGTTATACGCTGGTTAAGTTCGCTTATTCCAATGGTGCGATT +GCTTTCGGGGATGTTGCCAAGCATAACCATACTAGAGTTTATTCCTTTAG +TTTGCAAACGACTTCTAAATCGCTGCCTCGCAACAACACCCCCTCCAATG +GTCGGGGCCATCGAATTTCCGCTGCCAACATTTACCATAGCACGCAAGAC +AATTGGTAAGTCGGCCACGTCAACGTCATCGTCACAATCCCAGCCGTCAT +CTAAAGTTATATGTTCGGCGGCACCATCTTGTGAATATGTTAAAAAACAG +TCTGAAGCTCGAACTCCACTTAACAACTGATGATGTGGTGAACTTTCATC +AGATTCAGATTTAATACTGGGACTAGACATGCCTATAAGTTTTCCCACCT +GAAGTTCTTCGCTGCAAGGGCTAGAGTCAATATTATGCTCTTGAAGATTA +TGCCGACCTTGGCCACTGTCTCGGTGGAGGCGAGAGTTCGCATCATTTAG +GGGCAATCCCTTGTGTTTTTTATTAGCATAAAACTCAGCACCATGAACTG +TTTTAACATGTTTACGCAAAGAACTTGGGTCGGTGTAACGTTTCGTGCAA +CCAGGAGCTTTACAAATGTACGGTTTCTAAAAGATTTTAATCATAAATTA +TTTTTATTGGAGGAGGGTTGTGCGCTTACCTCATTACTGTGAGTACGATT +TTGATGCTTTGCACGATCGCTTGCATTACTAAACGCCTTGCTGCATCCCG +GATACTCGCACATATAGGGTTTTTCACCTGTGTGTGACCGTAAATGTGTT +TTTAGGTTTTCCAAGCGTGAATATGCCTTAAAACAGCCTTCAAACTAAAA +ACAATCACAATCAATTAGGCCTGAAAATCAAATATTTTAAATAAAAGTAA +TCTTACTGTGCATTTATGTGGCTTTTCGCCGGTATGACGACGCATATGCA +CAACTAGCATATACTGCGCTTTGAAAGGTTTTTCACCACGGGTACAATTT +TCCCATCGACAGACAAAGGCCTTCTTATTGGTTTGGATATGGTCATTATT +GATATGTTTAACAAGCTCATCTTGCGTATTAAATTCAATACAACAACTTC +GCCAATGACAATTTGTTTCTATAAAATCTCCAGGTTCATCTTTAATATCC +GTCGTATCAGCGTTGGCACAATCATATTCATTTAATGGAGTCGAAGCTGA +TCCACTACTTATAAAGTCTTCACAGCGTCTGCTTGTTTTCACATCACCAA +CAATACTTTTGGTAGTACTTGCTATGTTGTTATAACAGCGATCAGACAAA +TGTGACGATGCGCTGTCCGCTTCTACTTGGGCCACGCTTCCTGATGTTGA +TGAGGGCTGCTCAGTGACAGTACTTTTCCTCTGACGATTTCTCTGGTTTC +CGTCATTAAAGTCCTTTTGCTAGAAACATCAAATAAATAAAATGTATGAC +TTTATTAAACAATTCTAAATTACCGAGAGTGCTGCCATTTTATGTTCATC +CGCTACTAGTCTTGCTGTTGAAGATGGTGTTATTTGGCCTGGTAAATCAT +TTAGATTACCATGAACGTCGTTGAGGCTTAAGGCTGCAGCGCTTGCAGCG +TGGCTTATAGAAAACCCGGCCGCAGCTGCTTGTTGTGTATTCATCGGATT +TAAAAGACCTGCACTTGCACGTAACAAATGCTGTAGACGTGGTGCCAATG +TTGAATGTGCATGAGATATAGGATTAATAGCACTAGCTGAAATATGACCA +TATGAACCACTTGCCGCGCTGCTTCCTCGAGAGCCATTCATAATTGTGGC +TAAGGAGTTTGGTGAAAATCGAATCATTGAGTTAATGTCAAACGAATCCG +AATAAGGCGATGAGGAAAGCGCTCGTTTTCTGCTGATGCTTGCACGAATA +CTTCCGCCGGGCGGCCGAGGACTACTTAATCGCCTGTTGCCATCAATGCT +GAAGTGAAAATCAGTGCTGGCTAGAGATCCTGCAGCCGCTGCTGCTACAG +CCGCATGATGGAGATCACCCAGTGAGCCCATTCCTCGGGTGCCCAAAAAA +TCTCCTGATCCCAACCCCAGTCCCGCAAGGTGAAAAGCTGACGCACAGTT +AACATAAGGATCTAGAAATTATAAATATTGATATGTAAATGTTTAGTAAG +GACACTATGTATAGTGACATAAAAAAACAATACCATGAAATGAAGTGGTT +GAACCATTTCTTTGAAGAGAATACAATTGCTCCATATATCCAGGGATTCT +ATAGGCTGGATGAAACTCATGTGCATGAGGCTGTCCAGTAACATTTAAGC +TATGAACGTGTTGGCCCTGATGATTCTGATGGTGGCCAGTAGAATTAGCA +AGAAGAGTGTTTCCATTACATATGGGTGGTTGAATAGTCGTTGCTGTTTT +AATTGAATCAGAAGCTTCAACCGTTTGTATCATGGATGGAACTGTAACTG +AGCTGGAAACGTCTGTTGTGTGTACGTGGTTAATGCATGGGGATACTGGT +AAGACTGTTGCAGCGGCAGCAACGGCAGCAGCTCGCCTGGATGCTAGAAA +CTGCAGTTCAGAATATCTACAAGAAAGTAATTTTAGTTTTTAAATTATTA +ATTTCCATTTGTAAATATTATTTTATTTACTTATAGCCTACTTCCTTTGT +CACACTTAAATGTTTTACTATTTTACAGTTTATAATAAAAACAAGAAGAA +CGCTATAATAAGTGCCTCGACTATCAGATACCTGTTACTCATCTATAGGG +AGATGAATATATACACGCGGCAAAGCCAAATGGAATACATTTCAGTTTCA +GTCAACTGTCGCCGCCACAGCGGGAATCCACATGACAAATTCCAAATGTG +CCAAAATATCTAGCATTTGTAGTTTCCGAGCTCTCAGCGTTCATACGGAC +GGCAGACAGAATGCCAAACGGACATTACTCGACTGGGCCAGTGATCCCAA +CATTTTCAGGGAATAGAATATTATAAAAGACTGGAAGAAAGGTCCATATA +CAATTTATCGTTCTCTTTGTTTATTTCGGATCTTGATAGCGGCAGATGAA +ACCGAAAAGTTTTCATATTTTAGATATTTGCAGGAATTCTAGAATCTGCA +TACCAGTTAACGCCATTGCGAAGATGCACGTCGGTTATAACTCTACTTTT +TAACTCACTCTTTTTAAATATTAGCGAATTTCGTATTCAATTTTGATAAG +ACTGACGACTATACCATATTGCTGCCATAGAAATCCGTAAAAATAATAAA +AACAATTATTCGTTATTTTTAATTATTTTTACTAATTCTCCGGTACATAT +CATTTTCTTTAATATTTTAGAATTACTAATCAAATTTTTAAAGAATCACA +ATTTTAATAGGAAGGATTTGATCAATAATGTAAAAAGACCTAAAGCTTCG +TCTTTTGTACACCCTTGCAGAGTTTGTAATGATTTGTAATGATTTTTTAA +ATGAATATGGTTCACTGAAATTAGTATTTAGTTTTTCTTTTATAAATTAG +TAAGCCCTATACATACAAAAATCCCTTAGAATCGACCTACAACATTTTTC +AAGGTTTCTGTATTATACGTATCTTCATTACTTGTCCAAAAGTACACACA +ATTTTATTAACTATAAAAAATTGTTTATATGGATATGTTTTTGCTATGCT +TAATATTTAAAATAACTTTCAACTAATGTGTGTATTTTGTTTTTGTTAAA +GAAAAGAATTGATTAATTATAAGAAATAGTTATCTTAACGTAAAGTTTTT +CAAACAAGAGTGTGCAACCATAACATTACAAAATTTCAATGCTAAACAAT +CAATGTGTTTTTTATAACTCCCAACTGGGTCTTGGGTCTTGTACAAGAAA +AACTCTGAAAAATAATGACTAAATCATATATTTTGGAAGTATCAATATTC +TGGATGCAAATTTCAAAGTAAATTTTCAAAACTCTTTTGTTGTTTCCAAG +CTTAGGAGAATTATGTTAGAAAACACCTAAGATATAATGCTTAAACATTT +TTTTGGAGAAAGTTTCAGCCCGATAGCTTTAAAACTGAGAGAAAAGTTTG +CGTAAAAACGGACGGAAAGATGGACTTGGATAGAACGAGTCATCTAGTGA +AGCTTAAGAAAAATATATATACTTTATGGGGTAGTTGCAAACTTCTGACT +GAAATCATAATACCTCTGCAAGCGTATAACAAAGAAGAACGCTATAGTCG +AGTGCTTCGACGATATGATAATGTTGGAGGCAGACAGTTTTAAGCGTTTT +GGCCATTTGTAGGCGTTAGAGTGGGCGCAACAAAATTTTTTAAGTCGGGA +AGCCCAGAAATCTGCATGCCGAGTCCCATTCCTCTAGCTTTAATAGTTTC +CGAAATCTCAGCGTTTGTACGGACGGGCAGACGGACAGACGGACGGACGG +ACAGACTAACATGGCTTGATCGAATCGGCTATCTTTTATATGATTGATGT +TTTAAACAAAAGCTATTATCACTGTGAACGGCACTCCACGTAGTCACGAA +GCGCACCAGGAGGGTGTGCAAAGGCGACTACTATATATACGAAGAAATGA +AAATCTACAGTAATAGTCCTATGGCATATACATCCATACAAAGGTATTTC +AAAGGTATTGATACGAGGATATATCATAATACAAATAATGCATATTGAAA +GGATTTAAAACAAAAAAGGAAGTTAACATCGGCAAGCCAAAGTTTGTATA +CCCTTGTAGTTATAGAAATAAACAACTTTAGTAAATAATTTTTTCATATT +ATTTTCCCACTAATTTCCCGATTGTTTCTATGACAGCTAATGATATAGTC +GTCCGATTTTGATTAAATTTAATTCGAAATTCAGAACTAATTAAAAAATC +TTACTTCCAAGCTGAGAAGGTTATATGTCAAAAAGCACCAAAGCTATAAT +TTGTTACATATTATTGTCCCACACCGATCGAATTTGAAATTCAGAACTAA +ATAAAAAATGTTATTTCTAAGATTAGAAGGTTATATGCTAAAAAACACCG +AAGATATAATTTTTTCATATTATTTGACTACAGCTATATGATACAGTCGT +CCGATTTTGATAACATTTAATTCGTAATTCAGAACTAATTAAAAAATGTT +ATATCCTCCGAAGATATCATTTTTTTTTAATTTTTTCCCCCTATGGAAGC +TATAAGACATAAGTGAAGGAGACGTTTCCGACCCCATAATGTACATATAT +TCTTGATCAGCGTCACTAGGCGAGTCGATCTATCCATGTCCGTCTGTCCG +TCGGTCCGTCTGTCCGTCCGCCTGTCCGTCTGTCTGTCCGTTTCTACGCA +AACTAGTCTCTCAGTTTTAACGCTATCGGGCAGAAACTGTCCCAATCTTC +TTTCTATTGCAGGTAGTATATAAGTTGGAAGCAGCCGGATCGGACAACTA +TATCTTATAGCTCTCATATGAACGATCGGGGAAAAAACTTTAGAAAAAAT +GTTATCTTTGGAAATAACATTTTTTGAATTAGTTTTGAATTAGGAATTAA +ATTCTATCAAAACAGGATATCATATAGCTGCCATAGGAACAATCGGAAAA +TTAGTGGTAAAATAACATGAAACAAGAAAGGAAGTTTACTTCGGCAAGCC +GAAGTTTGTATACCCTTGCAGTTATAAAAAATAATCAATAATTTTATTAA +ACTGAATTAGAAATTCTTAAAAATATAAAATTTTATATTCCCAACATTAT +AAGATAATATGTCAAAAAGCCCCAAAGCTATAATTTGTTTCACATTATTT +CCCACAAATTAATAAAAACTAAAGTTACTTATATTAGGATTAAACAAATT +TTAACCTAAAATAGAGTTTGGGTATCGAGAACAAATTGGAGTGCTAAGTT +ACTTTAGTATATAGCATTTTTAATACAATTAATTTCCAAAAACCAATGTT +TTATTTTTTAAATGAATATGGTTCACTGAAATTAGTATTTAGTTTTTCTT +TTACAAATTAGTAAGCTTTATATATACAAAAATCCCTTAGAATCGACCTA +CAACATTTTTCAAGGTTTCTGTATTATACGTATCTTCATTACTTATCCAA +AAGTACACACAATTTTATTAACTATAAAAAATTGTTTATATGGATATGTT +TTTGCTTTGCTTCATATTTAAAATAACTTTCACGTAATGTGTGTGTTTTG +TTTTTGTTAAAGAAAATAATTGATTAACTATAAAAAATAGTTCTCTTGTC +GTAAAGTCTTTCAAACAAGAGTGTGCAACCATAACATTACAAAATTTCAA +TCAATGTGTTGTTTATAATTCCCAACTGGGTCTTGGGTCTTGTACAAGAA +AAACTCTGAAAAATAATGACTAATTAATATATTTTGGAAGTATCAATATT +CTGGATGCAAACTTCAAAGTAAATTTTCACAAATAACATTTTTTTAATTA +GTTTTGAATTAGGAATTAAATTCTATCAAAACAGGATATCATATAGCTGC +CATAGGAACAATCGGAAAATTAGTGGTAAAATAATATGAAACAAGAAAGG +AAGCTTACTTCGGCAAGCCGAAGTTTGTATACCCTTACAGTTATAAAAAA +TAATCAATAATTTTATTAAATTGAATTAGAAATTCTTAAAAATATAAAAT +TTTATATTCCCAATATTATAAGATAATATGGTAAAAAGCCCCAAAGCTAT +AATTTGTTTCACATTATTTCCCACCAATTATCCGATCCTTCCTATGACAG +CTATATGATATAGTCGTCCGATCTTAATAAAATTTAATTAGAAATTCGGA +ACTAATTATAGAATGTTATTTTCAAGCTTATAAGGTTATATATTAAAAAA +TACAAAAGATATAATTTTTATTTCTTGTTTTCCTACTAATGTTCCGATCG +TTCCTATGACAGCTATATGAATAGTCGTCCGATTTTGATCAAGTTTTTGG +GAAAGTTTTAGCCCGATAGCTTTAAAACTGAGAGATTAGAGACGGACAGA +CGGACATGGCTAGATCGACTTGTCTTGTGACGCTAATCAAGAATATATAT +ACTTTATGGGGTCGGAAACGTCTCCTTCACTGCGTTGCAAACTTCTGACT +GAAATTATTATACCCTTTGCAAGGGTATAAAAATTATATCTTCGGTTTTA +TTTAACATATAACCTCCTACGCTTGAATATAACATTTTTAAATTGGTCTT +AAATTTCGAATTAAATTTTATTAAAATCGGACGACTATATCATTTAGCTG +GCATAGAAAGAATCGGAAAATTAGTCGGAAATATAAAACTTTGGTGTTCT +TTAACATATTACTTTTTAAGCTTAGCAATAATATTTTTTAATTAGTTCTG +AATTTCGAATTAAATTTTATCAAAATCGGACGACTATATAATATAGCTGT +CATAGGAAGGATCGGAAAATGGGTGGGAAAAAATATGACACAAATTATAG +CTTTGGGGCTTTTTGACATATTATCTTATAATATTGGGAATATCATTTTT +TATATTTTTAAGAATTTCGAATCAAATTTAATAAAAATCGGACGACTCTA +ACATATAGCTGCCAATGAAACGGTCAGAAAAATAATAAACTAAATTTTTT +TTAATATCACTGAAAGCAGCAACAATCCTTTAAAATTTCACAGTTGATTA +TTTCTTATTACTGCAAGGGTATACAACCTTCGACTTGACGAATTTATTTT +CCTTTTTTGTTATTTCAGTTATTTACCATTATATATTCAGTAAGCATCAA +AAGCCGCAATTTTGTAGGTGTCGTTGTAGTAGCCGTGGTAGGATAGATGT +AAATTGATATTGTTTTGTGTGTTTTTTGTCTTGGATATATATATCATAAA +AACTTTTTCGAAGTATTTATTAAAAATCAATTTAAAAATCGTATTACTCA +TATCTACCCTGATAAAGGTTGAAATTACCCCGATCCCCGACTTAAGATAG +CAAAAAACTATTGTTATTTTATTTAATGTTATTCCATTTATTCACAATTT +TGGTAACACTTACATTGTTTTGCATTGACTTCGTGTAGAACTTACACTGC +ACGTCCACATAAAAAATCCAATTTCAGCGATAAACGATTTTTGAGGTACA +TATATTTAATGTGGCATATTGATATTCAATTTATTTTCCTTTCAAATTTA +AGGTCCAACCACTTGCTTTATAAGGCAAATTTTTTGTAAAATATTTTTGA +ACCTTGCTTTAAACCTACCTTCGATATATAAGGTCTTTTTAATTGGGAAT +TTAAGCCTTGAGAAATTATTATTAAACTATCGCCCAAAGTAATAATTTTA +ATATAAATAATATAAACTTACGCAAGGGGAAAATATGTTGGTAAAGCGTA +GGCGTCCATTTTATTAAAATTTGTCTCCATATATTAAAGACCGTTTCGAT +TTTACGAGTAACTCAAATCCTTTTATTTTGGATTCTCCGTCGGGAAATCG +AACATTTTTAGGGGCACGTTTAATAGCACGTTTTATATAATATTTTAAAC +GAAATTTCACTTTTGATTGGAATCTTTTACAACTATTTTTAAAACTCTGG +TCAACATTGAAACTTTTAATATAAAAGTATATTTTCTAGTATCAACCGTT +TCTGTGCATGGGCTCGACTTTCCTCTTCACAATTTTTTTTTTATAAAATG +CTATCAGTCACATTAAAAGTCGCGTATTTATACTTTTTCAGAAAATTTTA +AGTTGCGAATAATAAAAATAATTTATCTATGATAAAGTCAATAATGTCTG +TATGCTGCGTCTTAATGCTGTGTTTCCTGCGAGTGGACTGAACGATATTA +ACACTAGTTCTTGCAATGCTTCGTTGGTTTAGATGGAGCAGCTCAGATCT +CCTCTCTTCTCACAAATATCTTTGTCCGAGCACAAATACTGGTATAGATG +CTAACATAGATACGTATTGAATTACATACACTATCATGAAAACAATACAG +TAACAAGTGTAATGCTGATTCCAGTGTCTGTGTGTACCTACAGATCACGA +ACAGTCGACGAAGGCGGGCAGATCGAAGATGGCTACACAATACATAAACA +TGAGCAAAGATACATTTCGGTAATAGTGTTGACAATTTAGCTATTTTCTA +GTTTTAGTATACTTAAGCAAAGCTTCTATTATTTTACAATTTTCCTTTGA +TCCTAACTCTTAGAAGAAGGGGTACATTTTTAAACTTGATTTCACCATAC +GACCATTTTTTGGTACGCAGAAAGCGTACAAGATATTAGCCGCACCTACA +TCTACAGTGAAACAACAAACAACACTTACGCTCTCAGTCGCTTACTCTTC +TCTTCTCTTATTTGGTATTTCAGTTCTCACTCTCCTCTGCCATTGTTTTT +GAGAGGGTTTGGAGGCTTATGTATTATGTGTATACACACAAATGTAAATA +GGTATATAAAAAAGTACTTGTATAGAGTTCGTCGGATTTCTTAATTATAC +CTTTGCGAAGGGGATACTTGATCACCACCGATAAAAGCAAGTCTTCCATA +GTCTCGCACTTTTGACTGGCTAACTTTTGCACATGTTTTCTTAAGTCAGG +ACAAAAGTAGAAACGGCTATAGGGCCGCATAGGTTTGACATATACTAGGA +GCCATGGTAGGTGGGTTGCGGGAATTTAGGAAAAGGTATTAGAAGTATTT +ACTTTTGCGGCTTCAGAGATACAAATTCTTTACATTTTTTTCCTTCTGAA +TTATGAAATATTAATATTGTAATTTTTCGTTCATTCCTATGGAAGCTATA +TGTTAAAGTAATCCGTTTTTTTTTAAGTTTTATTCGAAAAATTTTGACAT +ATTAATAGAATGACATTCCCAAGTGTATAGGAATATATATTATTATAAGT +CATTATTCGTATAGACGGGACGGTTTTTTACAGATTTAACGCTGGTAGAC +TAATTTGTGTAGAAACGACTGACATGGATAAATCGATTCGTCTAGTCAGA +GTAGAATATATACAATTATATATATATATATATATATATATATATATATA +TATATATATATATGTATAGTGTATTATTATTATAATATCGGAATTTAGTT +TTGTACCATTATCCCAATAATTATTCAATGCTTTCTATGACAACCATATT +ATATAGTCGTTTTAGTTTTAAGCCCGTTTATCTTAAATTAAAAAGGTTTC +ACTCTGAACGGCAGACCATGTGGTAACGAAGCGCACCAGGAGGGTGTGCA +AAAGCGACCACTTTATACCGAGACTTTAGGAAAATCAATTGGCTTGGAAA +CGGTAAAAGTGTAAAAGGAAAATTTGGAAAATTTATTCTGTTAAGGCCCA +CAGTCTACATACAATACAATATACAATCGGCCCTTTGCTTAATTGTTTGA +ATTTGATGAAGCGTCCTGGATGTAAAAATTGTAGAATGTATATTTATTTA +GTAATTCGTATTATACGCTTTCGTCACAATAGTTGATATCAAAACTTTTG +TTTGTTGAAGATGCGATCTTCACTACATTTATTCCCATAAAGTATATCAG +CATCACTAGACGATTCGATCTAGCCATGTCCGTCTATCCGCTCGTTTCTA +CGCAAACTAGTCACTCATTTTTAAAGCTATCGTGCGGAATGTTTCCCAAA +GGTTTTCTTTCTTTTTCTGGTAGTATATAAGTCGAAGCCCGACGTATCAC +AAAACTATGTTTTATAGCTCCCATAGAAATCGTAACATTTTTTTTCAAAA +ATTACGCTTGGAATAACAAGCTATCTTCCTTTTTTGTTGATAATGAATGT +ATACGTGATTAGGTTATTAAGAAAATATTATAATATTGAAAAAAAAACCT +TATGATCTAAGCCAAATAAAAAAAATTAAGTTAATAAATCCAATTGTACA +GAGCCACCCTTTATCAGTCATATTTTATACGACTTTCTGAAAGATCGAAA +AATGAGGTGTCATATTCAAGGAACTGAACGATGCATACAGCTTTTAACTA +GTGCTTCTGGACGGCACACTGAAAAACATTGGGAGAGTAATGACTGTTAT +CAAAGAAAGCAGAAGGAATTTTCGTCGTGTGGAAAATAAATAGCATTTAA +AAATGGAATACTAAAGATTTATAAAAAAAACAAACTTGAAAGTGACCTTT +TATCAAAAAAATAGCAGTTTCCAAAATTAAATTTTTTTCTATATGTGTCG +ACTAATATGATATTTGTCAAAAAAAAAGTATTTTTCGGCAATGTTGCTTC +GAAACTTCTTCTTCATAAGATACCGTTCCCCCTACGAGTTTTAGGCGCCC +AATACAGATTTACTAGCCGAGTCGATCTAGGCATAGTGACAGTGAACGAT +TTATATTTTCAACTTCTTTCTTTTGCTTGGCATTGAGGATACCAAAACAA +AATATTTAATAGCCTTAAAAAGTTTACAAAAAAGTTCAACCCAATTTACA +GTCTGAGTTACTTACACATATATGTATGTACCTGTTATATCGTCTGTAAA +ATTTGTCAAAATAGGGGCGGTCATGATGTGTATAATAAAAGAACCTCTGG +TAGCCTGGGGCAAACCGATTCTATAAGTCGAAAGCAACTGCATGCATACG +TTAGCCGGCCTGAAAACAAGCAAAATACCTTTTTTGCCTGCAAGTGCACA +GCAGGATTGAATCTGGGATCTGAAACTTTTATCTTGCTGTGCGCTTCTAC +GTTCGTATTTTGTATGTGCCCTTCGTAATTTAACGTCTTACTCAAGTCTT +CTTTCTATGAAAGGAGCGAGCACATGCTGTGCGGCTGTAGTTGATACATA +CAAACATACCCATGTCTGTATGTTGGTATTCGTGCATTTGTGTGAATACG +TTCAGACCTCTGTATGTATCCGCACATACTCCCACAAATATACAAACGTG +GCTGTACGCACATGGTTATACCCATTCCTTTTTATGAGAAACGTTTTGTC +GTTTCTCAGAAACAACCAAACCAGATTTTTTATAATGTGTATATATAGAT +GTGTGTACATATATGTACGTATGTATTCATAAATTTATATGTACTTCATT +CCATAAATACCTATGTATACTTCTCAACA diff -r 000000000000 -r ec6f7c1ae81b test-data/Dbia3.fa.nhr Binary file test-data/Dbia3.fa.nhr has changed diff -r 000000000000 -r ec6f7c1ae81b test-data/Dbia3.fa.nin Binary file test-data/Dbia3.fa.nin has changed diff -r 000000000000 -r ec6f7c1ae81b test-data/Dbia3.fa.nsq Binary file test-data/Dbia3.fa.nsq has changed diff -r 000000000000 -r ec6f7c1ae81b test-data/README.html --- /dev/null Thu Jan 01 00:00:00 1970 +0000 +++ b/test-data/README.html Fri Apr 29 21:09:31 2016 -0400 @@ -0,0 +1,36 @@ +

Conversion of NCBI BLAST+ tblastn results to PSL format

+

Wilson Leung

+

Last Update: 04/24/2016

+

Version information

+ +

Data sources

+

For testing purposes, the database consists of only contig1 in the Dbia3 assembly while the protein sequences correspond to the three isoforms of the D. melanogaster ci gene in contig1. The protein sequences are available through FlyBase.

+ +

Conversion protocol

+
    +
  1. Create BLAST database for the assembly

    +
    makeblastdb -in Dbia3.fa -dbtype nucl
  2. +
  3. Perform tblastn search and output results in XML format

    +
    tblastn -outfmt 5 -db Dbia3.fa -query ci.pep -out tblastn_Dbia3_ci.xml -evalue 1e-2
  4. +
  5. Convert results into PSL format

    +
    blastXmlToPsl -convertToNucCoords tblastn_Dbia3_ci.xml tblastn_Dbia3_ci.xml.psl
  6. +
  7. Convert PSL output into BED format

    +
    pslToBed tblastn_Dbia3_ci.xml.psl tblastn_Dbia3_ci.xml.bed
  8. +
+

Output files

+ diff -r 000000000000 -r ec6f7c1ae81b test-data/README.md --- /dev/null Thu Jan 01 00:00:00 1970 +0000 +++ b/test-data/README.md Fri Apr 29 21:09:31 2016 -0400 @@ -0,0 +1,48 @@ +Conversion of NCBI BLAST+ tblastn results to PSL format +======================================================= +Wilson Leung + +Last Update: 04/24/2016 + + +Version information +------------------- +* Kent source tree: v324 +* NCBI BLAST+: BLAST 2.2.30+ + +Data sources +------------------- +For testing purposes, the database consists of only contig1 in the Dbia3 assembly while the protein sequences correspond to the three isoforms of the *D. melanogaster* *ci* gene in contig1. The protein sequences are available through [FlyBase](http://flybase.org/cgi-bin/getseq.html?source=dmel&id=FBgn0004859&chr=4&dump=PrecompiledFasta&targetset=translation). + +* Dbia3.fa = contig1 sequence in the Dbia3 asssembly +* ci.pep = Protein sequences for the three isoforms of the *ci* gene in *D. melanogaster* + +Conversion protocol +----------------------- +1. Create BLAST database for the assembly +``` +makeblastdb -in Dbia3.fa -dbtype nucl +``` + +2. Perform tblastn search and output results in XML format +``` +tblastn -outfmt 5 -db Dbia3.fa -query ci.pep -out tblastn_Dbia3_ci.xml -evalue 1e-2 +``` + +3. Convert results into PSL format +``` +blastXmlToPsl -convertToNucCoords tblastn_Dbia3_ci.xml tblastn_Dbia3_ci.xml.psl +``` + +4. Convert PSL output into BED format +``` +pslToBed tblastn_Dbia3_ci.xml.psl tblastn_Dbia3_ci.xml.bed +``` + +Output files +----------------------- +* tblastn_Dbia3_ci.xml = tblastn results in XML format +* tblastn_Dbia3_ci.xml.psl = tblastn results in PSL format +* tblastn_Dbia3_ci.xml.bed = tblastn results in BED format + + diff -r 000000000000 -r ec6f7c1ae81b test-data/ci.pep --- /dev/null Thu Jan 01 00:00:00 1970 +0000 +++ b/test-data/ci.pep Fri Apr 29 21:09:31 2016 -0400 @@ -0,0 +1,45 @@ +>ci-PA FBpp0088245 +MDAYALPTYFPLAYSELQFLASRRAAAVAAAATVLPGSPCINQHHPTDVSSSVTVPSIIPTGGTSDSIKTSIQPQICNEN +TLLGNAGHQHNHQPQHVHNINVTGQPHDFHPAYRIPGYMEQLYSLQRTNSASSFHDPYVNCASAFHLAGLGLGSADFLGS +RGLSSLGELHNAAVAAAAAGSLASTDFHFSVDGNRRLGSPRPPGGSIRASISRKRALSSSPYSDSFDINSMIRFSPNSLA +TIMNGSRGSSAASGSYGHISATALNPMSHVHSTRLQQIQAHLLRASAGLLNPMTPQQVAASGFSIGHMPTSASLRVNDVH +PNLSDSHIQITTSPTVTKDVSQVPAAAFSLKNLDDAREKKGPFKDVVPEQPSSTSGGVAQVEADSASSQLSDRCYNNVVN +NITGIPGDVKVNSRLDEYINCGSISIPSNEYDCANADTTDIKDEPGDFIETNCHWRSCRIEFITQDELVKHINNDHIQTN +KKAFVCRWEDCTRGEKPFKAQYMLVVHMRRHTGEKPHKCTFEGCFKAYSRLENLKTHLRSHTGEKPYTCEYPGCSKAFSN +ASDRAKHQNRTHSNEKPYICKAPGCTKRYTDPSSLRKHVKTVHGAEFYANKKHKGLPLNDANSRLQQNNSRHNLQEHNID +SSPCSEDSHLGKMLGTSSPSIKSESDISSSNHHLVNGVRASDSLLTYSPDDLAENLNLDDGWNCDDDVDVADLPIVLRAM +VNIGNGNASASTIGGSVLARQRFRGRLQTKGINSSTIMLCNIPESNRTFGISELNQRITELKMEPGTDAEIKIPKLPNTT +IGGYTEDPLQNQTSFRNTVSNKQGTVSGSIQGQFRRDSQNSTASTYYGSMQSRRSSQSSQVSSIPTMRPNPSCNSTASFY +DPISPGCSRRSSQMSNGANCNSFTSTSGLPVLNKESNKSLNACINKPNIGVQGVGIYNSSLPPPPSSHLIATNLKRLQRK +DSEYHNFTSGRFSVPSYMHSLHIKNNKPVGENEFDKAIASNARRQTDPVPNINLDPLTNISRFSTTPHSFDINVGKTNNI +ASSINKDNLRKDLFTVSIKADMAMTSDQHPNERINLDEVEELILPDEMLQYLNLVKDDTNHLEKEHQAVPVGSNVSETIA +SNHYREQSNIYYTNKQILTPPSNVDIQPNTTKFTVQDKFAMTAVGGSFSQRELSTLAVPNEHGHAKCESFHHQSQKYMNT +DIGSKQQSALPSAHQRQTEKSNYNQIIDSSMTSLPELNVDSIYPRNETENIFKVHGDHDNEIQCGIISQSQMSPSTNLNN +DGQFSTVNMQPITTSKLFPPEPQKIVCDTQASNTSVMHLDTYQRTLEYVQSCQNWMETNNTSTNQIQSLPGMPVNNTLFP +DVSSSTHPYHGTNMVINDMTTSLTSLLEENRYLQMMQ +>ci-PC FBpp0300417 +MDAYALPTYFPLAYSELQFLASRRAAAVAAAATVLPGSPCINQHHPTDVSSSVTVPSIIPTGGTSDSIKTSIQPQICNEN +TLLGNAGHQHNHQPQHVHNINVTGQPHDFHPAYRIPGYMEQLYSLQRTNSASSFHDPYVNCASAFHLAGLGLGSADFLGS +RGLSSLGELHNAAVAAAAAGSLASTDFHFSVDGNRRLGSPRPPGGSIRASISRKRALSSSPYSDSFDINSMIRFSPNSLA +TIMNGSRGSSAASGSYGHISATALNPMSHVHSTRLQQIQAHLLRASAGLLNPMTPQQVAASGFSIGHMPTSASLRVNDVH +PNLSDSHIQITTSPTVTKDVSQVPAAAFSLKNLDDAREKKGPFKDVVPEQPSSTSGGVAQVEADSASSQLSDRCYNNVVN +NITGIPGDVKVNSRLDEYINCGSISIPSNEYDCANADTTDIKDEPGDFIETNCHWRSCRIEFITQDELVKHINNDHIQTN +KKAFVCRWEDCTRGEKPFKAQYMLVVHMRRHTGEKPHKCTEKNHTLASIRDVAKPLVMLVIAQSIKIEHTVMRNRTFVKH +LDAQNVTPTRAL +>ci-PB FBpp0297298 +MEQLYSLQRTNSASSFHDPYVNCASAFHLAGLGLGSADFLGSRGLSSLGELHNAAVAAAAAGSLASTDFHFSVDGNRRLG +SPRPPGGSIRASISRKRALSSSPYSDSFDINSMIRFSPNSLATIMNGSRGSSAASGSYGHISATALNPMSHVHSTRLQQI +QAHLLRASAGLLNPMTPQQVAASGFSIGHMPTSASLRVNDVHPNLSDSHIQITTSPTVTKDVSQVPAAAFSLKNLDDARE +KKGPFKDVVPEQPSSTSGGVAQVEADSASSQLSDRCYNNVVNNITGIPGDVKVNSRLDEYINCGSISIPSNEYDCANADT +TDIKDEPGDFIETNCHWRSCRIEFITQDELVKHINNDHIQTNKKAFVCRWEDCTRGEKPFKAQYMLVVHMRRHTGEKPHK +CTFEGCFKAYSRLENLKTHLRSHTGEKPYTCEYPGCSKAFSNASDRAKHQNRTHSNEKPYICKAPGCTKRYTDPSSLRKH +VKTVHGAEFYANKKHKGLPLNDANSRLQQNNSRHNLQEHNIDSSPCSEDSHLGKMLGTSSPSIKSESDISSSNHHLVNGV +RASDSLLTYSPDDLAENLNLDDGWNCDDDVDVADLPIVLRAMVNIGNGNASASTIGGSVLARQRFRGRLQTKGINSSTIM +LCNIPESNRTFGISELNQRITELKMEPGTDAEIKIPKLPNTTIGGYTEDPLQNQTSFRNTVSNKQGTVSGSIQGQFRRDS +QNSTASTYYGSMQSRRSSQSSQVSSIPTMRPNPSCNSTASFYDPISPGCSRRSSQMSNGANCNSFTSTSGLPVLNKESNK +SLNACINKPNIGVQGVGIYNSSLPPPPSSHLIATNLKRLQRKDSEYHNFTSGRFSVPSYMHSLHIKNNKPVGENEFDKAI +ASNARRQTDPVPNINLDPLTNISRFSTTPHSFDINVGKTNNIASSINKDNLRKDLFTVSIKADMAMTSDQHPNERINLDE +VEELILPDEMLQYLNLVKDDTNHLEKEHQAVPVGSNVSETIASNHYREQSNIYYTNKQILTPPSNVDIQPNTTKFTVQDK +FAMTAVGGSFSQRELSTLAVPNEHGHAKCESFHHQSQKYMNTDIGSKQQSALPSAHQRQTEKSNYNQIIDSSMTSLPELN +VDSIYPRNETENIFKVHGDHDNEIQCGIISQSQMSPSTNLNNDGQFSTVNMQPITTSKLFPPEPQKIVCDTQASNTSVMH +LDTYQRTLEYVQSCQNWMETNNTSTNQIQSLPGMPVNNTLFPDVSSSTHPYHGTNMVINDMTTSLTSLLEENRYLQMMQ diff -r 000000000000 -r ec6f7c1ae81b test-data/tblastn_Dbia3_ci.xml --- /dev/null Thu Jan 01 00:00:00 1970 +0000 +++ b/test-data/tblastn_Dbia3_ci.xml Fri Apr 29 21:09:31 2016 -0400 @@ -0,0 +1,297 @@ + + + + tblastn + TBLASTN 2.2.30+ + Stephen F. Altschul, Thomas L. Madden, Alejandro A. Schäffer, Jinghui Zhang, Zheng Zhang, Webb Miller, and David J. Lipman (1997), "Gapped BLAST and PSI-BLAST: a new generation of protein database search programs", Nucleic Acids Res. 25:3389-3402. + Dbia3.fa + Query_1 + ci-PA FBpp0088245 + 1397 + + + BLOSUM62 + 0.01 + 11 + 1 + L; + + + + + 1 + Query_1 + ci-PA FBpp0088245 + 1397 + + + 1 + gnl|BL_ORD_ID|0 + contig1 + 0 + 45179 + + + 1 + 852.818 + 2202 + 0 + 576 + 1396 + 31367 + 33826 + 0 + -2 + 540 + 627 + 39 + 840 + KPYICKAPGCTKRYTDPSSLRKHVKTVHGAEFYANKKHKGLPLNDANSRLQQNNS--RHNLQEHNIDSSPCSEDSHLGKMLGTXXXXXXXXXXXXXXNHHLVNGVRASDSLLTYSPDDLAEXXXXXXXXXXXXXXXXXXXXXXXRAMVNIGNGNASASTIGGSVLARQRFRGRLQTKGINSSTIMLCNIPESNRTFGISELNQRITELKMEPGTDAEIKIPKLPNTTIGGYTEDPLQNQTSFRNTVSNKQG--TVSGSIQGQFRRDSQNSTASTYYGXXXXXXXXXXXXXXXIPTMRPNPSCN-STASFYDPISPGCSRRSSQMSNGANCNSFTSTSGLPVLNKE--SNKSLNACINKPNIGVQGVGIYNXXXXXXXXXHLIATNLKRLQRKDSE--YHNFTSGRFSVPSYMHSLHIKNNKPVGENEFDKAIASNA-RRQTDPVPNINLDPLTNISRFSTTPHSFDINVGKTN--NIASSINKDNLRKDLFTVSIKADMAMTSDQHPNERINLDEVEELILPDEMLQYLNLVKDDTNHLEKEHQAVPVGSNVSETIASNH--YREQSNIYYTNKQILTPPSNVDI----QPNTTKFTVQDKFAMTAVGGSFSQRELSTLAVPNEHGHAKCESFHHQSQKYMNTDIGSKQQSALPSAHQRQTEKSNYNQIIDSSMTSLPELNVDSIYPRNETENIFKVHGDHDNEIQCGIISQSQMSPSTNLNNDGQFSTVNMQPITTSKLF-PPEPQKIVCDTQASNTSVMHLDTYQRTLEYVQSCQNWMETNNTSTNQIQSLPGMPVNNTLFPDVSSSTHPYHGTNMVINDMTTSLTSLLEENRYLQMM + KPYICKAPGCTKRYTDPSSLRKHVKTVHGAEFYANKKHKGLPLNDANSRLHRDSGQGRHNLQEHNIDSSPCSEELQVGKLIGMSSPSIKSESDESSPHHQLLSGVRASDCFLTYSQDGAAEHITLDDGWDCDDDVDVADLPIVLRAMVNVGSGNSMAPTIGGGVVARQRFRSRLQTKGINSSMVMLGNIPESNRTIGISELNQRITELKMEPGTACDITVPL--NTGLERISEDLSQNQS---NITLNKQSFFTASGSLQGHFRRDSQNSTASTYYGSMQSRRSSQSSQVSSISTMRPGPSYNTTTASLYDPISPGCSRRSSQMSNVVNSYALTSTSGLTAINKDLNANSSPNASINKPGLGGQYFGFYNNSLPPPPSSHLIATNLKHLQDTDSRSCYHNTTGGRFSIPNCTPSLHLDYNGPAGEQEIDKEIPNNILRRQSEPMPNISLDTLTNVSPLSGPLQNLQFPIGKARNVNITSSSNENTLRKGPCHATMKTEMTMTSEQHPNERINLDEVEELILPDEMLQYLNLVKDDQNYMEKDD--VAIRSTVPKTIKSNENLLLSKSNLNPIKKQIILPTSNFDVSINLQPNTSNLQTQEEHTMTTIGGLPSQREQN--IVPHQHEKTKCRSFPQEIDKTINIDIGFKEQPYPSSAYQPQITKSNQNEIIDSSMTSLPELN--PIFTKINSENVSKLHRDQNSEIQCGIVSQSQMSPSININNDGETSTLKNLPLTYSKFSGQPNTQTTVG---GSNTSSMVSDTYQRTLEYVQSCQNWVDTNNSSGDQIQS------NNTLWSDVSSSTHPYAGTNLVINDMTTSLTSLLEENRYLHMM + KPYICKAPGCTKRYTDPSSLRKHVKTVHGAEFYANKKHKGLPLNDANSRL +++ RHNLQEHNIDSSPCSE+ +GK++G SSPSIKSESD SS +H L++GVRASD LTYS D AE++ LDDGW+CDDDVDVADLPIVLRAMVN+G+GN+ A TIGG V+ARQRFR RLQTKGINSS +ML NIPESNRT GISELNQRITELKMEPGT +I +P NT + +ED QNQ+ N NKQ T SGS+QG FRRDSQNSTASTYYGSMQSRRSSQSSQVSSI TMRP PS N +TAS YDPISPGCSRRSSQMSN N + TSTSGL +NK+ +N S NA INKP +G Q G YN+SLPPPPSSHLIATNLK LQ DS YHN T GRFS+P+ SLH+ N P GE E DK I +N RRQ++P+PNI+LD LTN+S S + +GK NI SS N++ LRK ++K +M MTS+QHPNERINLDEVEELILPDEMLQYLNLVKDD N++EK+ V + S V +TI SN +SN+ KQI+ P SN D+ QPNT+ Q++ MT +GG SQRE + VP++H KC SF + K +N DIG K+Q SA+Q Q KSN N+IIDSSMTSLPELN I+ + +EN+ K+H D ++EIQCGI+SQSQMSPS N+NNDG+ ST+ P+T SK P Q V SNTS M DTYQRTLEYVQSCQNW++TNN+S +QIQS NNTL+ DVSSSTHPY GTN+VINDMTTSLTSLLEENRYL MM + + + 2 + 604.749 + 1558 + 0 + 14 + 520 + 34107 + 35765 + 0 + -1 + 395 + 432 + 48 + 554 + YSELQFLXXXXXXXXXXXXTVLPGSPCINQHHXXXXXXXXXXXXXXXXGGTSDSIKTS--IQPQICNENTLLGNA-GXXXXXXXXXXXXXXVTGQPH--DFHPAYRIPGYMEQLYSLQRTNSASSFH------------------------DPYVNCASAFHLAGLGLGSADFXXXXXXXXXXELHNXXXXXXXXGSLASTDFHFSVDGNRRLGSPRPPGGSIRASISRKRALSSSPYSDSFDINSMIRFSPNSLATIMNXXXXXXXXXXXXXXXXXTALNPMSHVHSTRLQQIQAHLLRASAGLLNPMTPQQVAASGFSIGHMPTSASLRVNDVHPNLSDSHIQITTSPTVTKDVSQVPAAAFSL------------------KNLDDAREKKGPFKDVVPEQPSSTSGGVAQVEADSASSQLSDRCYNNVVNNITGIPGDVKVNSRLDEYINCGSISIPSNEYDCANADTTDIKDEPGDFIETNCHWRSCRIEFITQDELVKHINNDHIQTNKKAFVCRWEDCTRGEKPFKAQYMLVVHMRRHTGEKPHKCT + YSELQFLASRRAAAVAAAATVLPVSPCINHVHTTDVSSSVTVPSMIQTVEASDSIKTATTIQPPICNGNTLLANSTGHHQNHQGQHVHSLNVTGQPHAHEFHPAYRIPGYMEQLYSLQRNGSTTSFHGIVFLCHYT*CPY*TFTYQYL*FLDPYVNCASAFHLAGLGLGSGDFLGTRGMGSLGDLHHAAVAAAAAGSLASTDFHFSIDGNRRLSSPRPPGGSIRASISRKRALSSSPYSDSFDINSMIRFSPNSLATIMNGSRGSSAASGSYGHISASAINPISHAHSTLAPRLQ-HLLRASAGLLNPMNTQQAAAAGFSISHAASAAALSLNDVHGNLNDLPGQITPSSTARLVADEHKMAALSVI*NCLIKSYILFI*CF*QKDFNDGNQRNRQRKSTVTEQPSSTSGSVAQVEADSASSHLSDRCYNNIASTTKSIVGDVKTSRRCEDFISSGSASTPLNEYDCANADTTDIKDEPGDFIETNCHWRSCCIEFNTQDELVKHINNDHIQTNKKAFVCRWENCTRGEKPFKAQYMLVVHMRRHTGEKPHKCT + YSELQFLASRRAAAVAAAATVLP SPCIN H TDVSSSVTVPS+I T SDSIKT+ IQP ICN NTLL N+ GH NHQ QHVH++NVTGQPH +FHPAYRIPGYMEQLYSLQR S +SFH DPYVNCASAFHLAGLGLGS DFLG+RG+ SLG+LH+AAVAAAAAGSLASTDFHFS+DGNRRL SPRPPGGSIRASISRKRALSSSPYSDSFDINSMIRFSPNSLATIMNGSRGSSAASGSYGHISA+A+NP+SH HST ++Q HLLRASAGLLNPM QQ AA+GFSI H ++A+L +NDVH NL+D QIT S T + AA S+ K+ +D ++ K V EQPSSTSG VAQVEADSASS LSDRCYNN+ + I GDVK + R +++I+ GS S P NEYDCANADTTDIKDEPGDFIETNCHWRSC IEF TQDELVKHINNDHIQTNKKAFVCRWE+CTRGEKPFKAQYMLVVHMRRHTGEKPHKCT + + + 3 + 119.398 + 298 + 0 + 521 + 575 + 33880 + 34044 + 0 + -3 + 54 + 54 + 0 + 55 + FEGCFKAYSRLENLKTHLRSHTGEKPYTCEYPGCSKAFSNASDRAKHQNRTHSNE + FEGCFKAYSRLENLKTHLRSHTGEKPYMCEYPGCSKAFSNASDRAKHQNRTHSNE + FEGCFKAYSRLENLKTHLRSHTGEKPY CEYPGCSKAFSNASDRAKHQNRTHSNE + + + 4 + 33.4982 + 75 + 0.0015721 + 1 + 13 + 41471 + 41509 + 0 + -2 + 13 + 13 + 0 + 13 + MDAYALPTYFPLA + MDAYALPTYFPLA + MDAYALPTYFPLA + + + + + + + 1 + 45179 + 66 + 19955683 + 0.041 + 0.267 + 0.14 + + + + + 2 + Query_2 + ci-PC FBpp0300417 + 572 + + + 1 + gnl|BL_ORD_ID|0 + contig1 + 0 + 45179 + + + 1 + 616.69 + 1589 + 0 + 14 + 553 + 33879 + 35765 + 0 + -1 + 416 + 454 + 91 + 630 + YSELQFLXXXXXXXXXXXXTVLPGSPCINQHHXXXXXXXXXXXXXXXXGGTSDSIKT--SIQPQICNENTLLGNA-GXXXXXXXXXXXXXXVTGQPH--DFHPAYRIPGYMEQLYSLQRTNSASSFH------------------------DPYVNCASAFHLAGLGLGSADFXXXXXXXXXXELHNXXXXXXXXGSLASTDFHFSVDGNRRLGSPRPPGGSIRASISRKRALSSSPYSDSFDINSMIRFSPNSLATIMNXXXXXXXXXXXXXXXXXTALNPMSHVHSTRLQQIQAHLLRASAGLLNPMTPQQVAASGFSIGHMPTSASLRVNDVHPNLSDSHIQITTSPTVTKDVSQVPAAAFSL------------------KNLDDAREKKGPFKDVVPEQPSSTSGGVAQVEADSASSQLSDRCYNNVVNNITGIPGDVKVNSRLDEYINCGSISIPSNEYDCANADTTDIKDEPGDFIETNCHWRSCRIEFITQDELVKHINNDHIQTNKKAFVCRWEDCTRGEKPFKAQYMLVVHMRRHTGEKPHKCT-------------------------------------------EKNHTLASIRDVAKPLVMLVIAQSIKIEHTVMR + YSELQFLASRRAAAVAAAATVLPVSPCINHVHTTDVSSSVTVPSMIQTVEASDSIKTATTIQPPICNGNTLLANSTGHHQNHQGQHVHSLNVTGQPHAHEFHPAYRIPGYMEQLYSLQRNGSTTSFHGIVFLCHYT*CPY*TFTYQYL*FLDPYVNCASAFHLAGLGLGSGDFLGTRGMGSLGDLHHAAVAAAAAGSLASTDFHFSIDGNRRLSSPRPPGGSIRASISRKRALSSSPYSDSFDINSMIRFSPNSLATIMNGSRGSSAASGSYGHISASAINPISHAHSTLAPRLQ-HLLRASAGLLNPMNTQQAAAAGFSISHAASAAALSLNDVHGNLNDLPGQITPSSTARLVADEHKMAALSVI*NCLIKSYILFI*CF*QKDFNDGNQRNRQRKSTVTEQPSSTSGSVAQVEADSASSHLSDRCYNNIASTTKSIVGDVKTSRRCEDFISSGSASTPLNEYDCANADTTDIKDEPGDFIETNCHWRSCCIEFNTQDELVKHINNDHIQTNKKAFVCRWENCTRGEKPFKAQYMLVVHMRRHTGEKPHKCTVRLLLFKIFDFQA*LIVIVFSLKAVLRHIHAWKT*KHIYGHTQVKNPICASIRDAARRLVMQAIVQSIKIVLTVMR + YSELQFLASRRAAAVAAAATVLP SPCIN H TDVSSSVTVPS+I T SDSIKT +IQP ICN NTLL N+ GH NHQ QHVH++NVTGQPH +FHPAYRIPGYMEQLYSLQR S +SFH DPYVNCASAFHLAGLGLGS DFLG+RG+ SLG+LH+AAVAAAAAGSLASTDFHFS+DGNRRL SPRPPGGSIRASISRKRALSSSPYSDSFDINSMIRFSPNSLATIMNGSRGSSAASGSYGHISA+A+NP+SH HST ++Q HLLRASAGLLNPM QQ AA+GFSI H ++A+L +NDVH NL+D QIT S T + AA S+ K+ +D ++ K V EQPSSTSG VAQVEADSASS LSDRCYNN+ + I GDVK + R +++I+ GS S P NEYDCANADTTDIKDEPGDFIETNCHWRSC IEF TQDELVKHINNDHIQTNKKAFVCRWE+CTRGEKPFKAQYMLVVHMRRHTGEKPHKCT KN ASIRD A+ LVM I QSIKI TVMR + + + 2 + 42.3578 + 98 + 1.2328e-06 + 490 + 572 + 33769 + 34056 + 0 + -3 + 37 + 47 + 13 + 96 + DCTRGEKPFKAQYML---VVHMRRHTGEKPHKCTEK--NHTLASIRDVAKPLVML----VIAQSIKIEHTV----MRNRTFVKHLDAQNVTPTRAL + DCF*FEGCFKAYSRLENLKTHLRSHTGEKPYMCEYPGCSKAFSNASDRAKHQNRTHSNEVSAQPSSNKNNL*LKSFRNRTFVKLLVARNVTPTQVL + DC E FKA L H+R HTGEKP+ C + ++ D AK V AQ ++ + RNRTFVK L A+NVTPT+ L + + + 3 + 30.8018 + 68 + 0.00386248 + 1 + 13 + 41471 + 41509 + 0 + -2 + 13 + 13 + 0 + 13 + MDAYALPTYFPLA + MDAYALPTYFPLA + MDAYALPTYFPLA + + + + + + + 1 + 45179 + 60 + 7679488 + 0.041 + 0.267 + 0.14 + + + + + 3 + Query_3 + ci-PB FBpp0297298 + 1279 + + + 1 + gnl|BL_ORD_ID|0 + contig1 + 0 + 45179 + + + 1 + 855.514 + 2209 + 0 + 458 + 1278 + 31367 + 33826 + 0 + -2 + 540 + 627 + 39 + 840 + KPYICKAPGCTKRYTDPSSLRKHVKTVHGAEFYANKKHKGLPLNDANSRLQQNNS--RHNLQEHNIDSSPCSEDSHLGKMLGTXXXXXXXXXXXXXXNHHLVNGVRASDSLLTYSPDDLAEXXXXXXXXXXXXXXXXXXXXXXXRAMVNIGNGNASASTIGGSVLARQRFRGRLQTKGINSSTIMLCNIPESNRTFGISELNQRITELKMEPGTDAEIKIPKLPNTTIGGYTEDPLQNQTSFRNTVSNKQG--TVSGSIQGQFRRDSQNSTASTYYGXXXXXXXXXXXXXXXIPTMRPNPSCN-STASFYDPISPGCSRRSSQMSNGANCNSFTSTSGLPVLNKE--SNKSLNACINKPNIGVQGVGIYNXXXXXXXXXHLIATNLKRLQRKDSE--YHNFTSGRFSVPSYMHSLHIKNNKPVGENEFDKAIASNA-RRQTDPVPNINLDPLTNISRFSTTPHSFDINVGKTN--NIASSINKDNLRKDLFTVSIKADMAMTSDQHPNERINLDEVEELILPDEMLQYLNLVKDDTNHLEKEHQAVPVGSNVSETIASNH--YREQSNIYYTNKQILTPPSNVDI----QPNTTKFTVQDKFAMTAVGGSFSQRELSTLAVPNEHGHAKCESFHHQSQKYMNTDIGSKQQSALPSAHQRQTEKSNYNQIIDSSMTSLPELNVDSIYPRNETENIFKVHGDHDNEIQCGIISQSQMSPSTNLNNDGQFSTVNMQPITTSKLF-PPEPQKIVCDTQASNTSVMHLDTYQRTLEYVQSCQNWMETNNTSTNQIQSLPGMPVNNTLFPDVSSSTHPYHGTNMVINDMTTSLTSLLEENRYLQMM + KPYICKAPGCTKRYTDPSSLRKHVKTVHGAEFYANKKHKGLPLNDANSRLHRDSGQGRHNLQEHNIDSSPCSEELQVGKLIGMSSPSIKSESDESSPHHQLLSGVRASDCFLTYSQDGAAEHITLDDGWDCDDDVDVADLPIVLRAMVNVGSGNSMAPTIGGGVVARQRFRSRLQTKGINSSMVMLGNIPESNRTIGISELNQRITELKMEPGTACDITVPL--NTGLERISEDLSQNQS---NITLNKQSFFTASGSLQGHFRRDSQNSTASTYYGSMQSRRSSQSSQVSSISTMRPGPSYNTTTASLYDPISPGCSRRSSQMSNVVNSYALTSTSGLTAINKDLNANSSPNASINKPGLGGQYFGFYNNSLPPPPSSHLIATNLKHLQDTDSRSCYHNTTGGRFSIPNCTPSLHLDYNGPAGEQEIDKEIPNNILRRQSEPMPNISLDTLTNVSPLSGPLQNLQFPIGKARNVNITSSSNENTLRKGPCHATMKTEMTMTSEQHPNERINLDEVEELILPDEMLQYLNLVKDDQNYMEKDD--VAIRSTVPKTIKSNENLLLSKSNLNPIKKQIILPTSNFDVSINLQPNTSNLQTQEEHTMTTIGGLPSQREQN--IVPHQHEKTKCRSFPQEIDKTINIDIGFKEQPYPSSAYQPQITKSNQNEIIDSSMTSLPELN--PIFTKINSENVSKLHRDQNSEIQCGIVSQSQMSPSININNDGETSTLKNLPLTYSKFSGQPNTQTTVG---GSNTSSMVSDTYQRTLEYVQSCQNWVDTNNSSGDQIQS------NNTLWSDVSSSTHPYAGTNLVINDMTTSLTSLLEENRYLHMM + KPYICKAPGCTKRYTDPSSLRKHVKTVHGAEFYANKKHKGLPLNDANSRL +++ RHNLQEHNIDSSPCSE+ +GK++G SSPSIKSESD SS +H L++GVRASD LTYS D AE++ LDDGW+CDDDVDVADLPIVLRAMVN+G+GN+ A TIGG V+ARQRFR RLQTKGINSS +ML NIPESNRT GISELNQRITELKMEPGT +I +P NT + +ED QNQ+ N NKQ T SGS+QG FRRDSQNSTASTYYGSMQSRRSSQSSQVSSI TMRP PS N +TAS YDPISPGCSRRSSQMSN N + TSTSGL +NK+ +N S NA INKP +G Q G YN+SLPPPPSSHLIATNLK LQ DS YHN T GRFS+P+ SLH+ N P GE E DK I +N RRQ++P+PNI+LD LTN+S S + +GK NI SS N++ LRK ++K +M MTS+QHPNERINLDEVEELILPDEMLQYLNLVKDD N++EK+ V + S V +TI SN +SN+ KQI+ P SN D+ QPNT+ Q++ MT +GG SQRE + VP++H KC SF + K +N DIG K+Q SA+Q Q KSN N+IIDSSMTSLPELN I+ + +EN+ K+H D ++EIQCGI+SQSQMSPS N+NNDG+ ST+ P+T SK P Q V SNTS M DTYQRTLEYVQSCQNW++TNN+S +QIQS NNTL+ DVSSSTHPY GTN+VINDMTTSLTSLLEENRYL MM + + + 2 + 529.25 + 1362 + 0 + 1 + 402 + 34107 + 35435 + 0 + -1 + 310 + 341 + 43 + 444 + MEQLYSLQRTNSASSFH------------------------DPYVNCASAFHLAGLGLGSADFXXXXXXXXXXELHNXXXXXXXXGSLASTDFHFSVDGNRRLGSPRPPGGSIRASISRKRALSSSPYSDSFDINSMIRFSPNSLATIMNXXXXXXXXXXXXXXXXXTALNPMSHVHSTRLQQIQAHLLRASAGLLNPMTPQQVAASGFSIGHMPTSASLRVNDVHPNLSDSHIQITTSPTVTKDVSQVPAAAFSL------------------KNLDDAREKKGPFKDVVPEQPSSTSGGVAQVEADSASSQLSDRCYNNVVNNITGIPGDVKVNSRLDEYINCGSISIPSNEYDCANADTTDIKDEPGDFIETNCHWRSCRIEFITQDELVKHINNDHIQTNKKAFVCRWEDCTRGEKPFKAQYMLVVHMRRHTGEKPHKCT + MEQLYSLQRNGSTTSFHGIVFLCHYT*CPY*TFTYQYL*FLDPYVNCASAFHLAGLGLGSGDFLGTRGMGSLGDLHHAAVAAAAAGSLASTDFHFSIDGNRRLSSPRPPGGSIRASISRKRALSSSPYSDSFDINSMIRFSPNSLATIMNGSRGSSAASGSYGHISASAINPISHAHSTLAPRLQ-HLLRASAGLLNPMNTQQAAAAGFSISHAASAAALSLNDVHGNLNDLPGQITPSSTARLVADEHKMAALSVI*NCLIKSYILFI*CF*QKDFNDGNQRNRQRKSTVTEQPSSTSGSVAQVEADSASSHLSDRCYNNIASTTKSIVGDVKTSRRCEDFISSGSASTPLNEYDCANADTTDIKDEPGDFIETNCHWRSCCIEFNTQDELVKHINNDHIQTNKKAFVCRWENCTRGEKPFKAQYMLVVHMRRHTGEKPHKCT + MEQLYSLQR S +SFH DPYVNCASAFHLAGLGLGS DFLG+RG+ SLG+LH+AAVAAAAAGSLASTDFHFS+DGNRRL SPRPPGGSIRASISRKRALSSSPYSDSFDINSMIRFSPNSLATIMNGSRGSSAASGSYGHISA+A+NP+SH HST ++Q HLLRASAGLLNPM QQ AA+GFSI H ++A+L +NDVH NL+D QIT S T + AA S+ K+ +D ++ K V EQPSSTSG VAQVEADSASS LSDRCYNN+ + I GDVK + R +++I+ GS S P NEYDCANADTTDIKDEPGDFIETNCHWRSC IEF TQDELVKHINNDHIQTNKKAFVCRWE+CTRGEKPFKAQYMLVVHMRRHTGEKPHKCT + + + 3 + 119.398 + 298 + 0 + 403 + 457 + 33880 + 34044 + 0 + -3 + 54 + 54 + 0 + 55 + FEGCFKAYSRLENLKTHLRSHTGEKPYTCEYPGCSKAFSNASDRAKHQNRTHSNE + FEGCFKAYSRLENLKTHLRSHTGEKPYMCEYPGCSKAFSNASDRAKHQNRTHSNE + FEGCFKAYSRLENLKTHLRSHTGEKPY CEYPGCSKAFSNASDRAKHQNRTHSNE + + + + + + + 1 + 45179 + 66 + 18186509 + 0.041 + 0.267 + 0.14 + + + + + + diff -r 000000000000 -r ec6f7c1ae81b test-data/tblastn_Dbia3_ci.xml.bed --- /dev/null Thu Jan 01 00:00:00 1970 +0000 +++ b/test-data/tblastn_Dbia3_ci.xml.bed Fri Apr 29 21:09:31 2016 -0400 @@ -0,0 +1,10 @@ +contig1 31366 33826 ci-PA 358 - 31366 33826 0 18 126,114,27,174,186,84,69,45,204,108,117,144,123,150,24,48,495,165, 0,126,240,270,444,630,726,801,846,1056,1167,1290,1440,1566,1722,1746,1794,2295, +contig1 34106 35765 ci-PA 604 - 34106 35765 0 7 510,210,432,84,63,45,174, 0,564,774,1278,1368,1434,1485, +contig1 33879 34044 ci-PA 964 - 33879 34044 0 1 165, 0, +contig1 41470 41509 ci-PA 1000 - 41470 41509 0 1 39, 0, +contig1 33878 35765 ci-PC 584 - 33878 35765 0 8 99,510,210,432,84,63,48,171, 0,228,792,1002,1506,1596,1662,1716, +contig1 33768 34056 ci-PC 0 - 33768 34056 0 5 63,36,51,54,45, 0,75,123,180,243, +contig1 41470 41509 ci-PC 1000 - 41470 41509 0 1 39, 0, +contig1 31366 33826 ci-PB 358 - 31366 33826 0 18 126,114,27,174,186,84,69,45,204,108,117,144,123,150,24,48,495,165, 0,126,240,270,444,630,726,801,846,1056,1167,1290,1440,1566,1722,1746,1794,2295, +contig1 34106 35435 ci-PB 560 - 34106 35435 0 4 510,210,432,51, 0,564,774,1278, +contig1 33879 34044 ci-PB 964 - 33879 34044 0 1 165, 0, diff -r 000000000000 -r ec6f7c1ae81b test-data/tblastn_Dbia3_ci.xml.psl --- /dev/null Thu Jan 01 00:00:00 1970 +0000 +++ b/test-data/tblastn_Dbia3_ci.xml.psl Fri Apr 29 21:09:31 2016 -0400 @@ -0,0 +1,10 @@ +1458 762 183 0 7 60 10 57 +- ci-PA 4191 1725 4188 contig1 45179 31366 33826 18 165,495,48,24,150,123,144,117,108,204,45,69,84,186,174,27,114,126, 1725,1890,2391,2448,2472,2622,2745,2889,3006,3114,3324,3369,3438,3528,3720,3894,3930,4062, 11353,11524,12019,12067,12097,12250,12379,12529,12649,12763,12967,13018,13099,13183,13369,13546,13573,13687, +987 300 231 0 1 3 5 141 +- ci-PA 4191 39 1560 contig1 45179 34106 35765 7 174,45,63,84,432,210,510, 39,213,258,321,405,840,1050, 9414,9594,9642,9711,9867,10299,10563, +162 3 0 0 0 0 0 0 +- ci-PA 4191 1560 1725 contig1 45179 33879 34044 1 165, 1560, 11135, +39 0 0 0 0 0 0 0 +- ci-PA 4191 0 39 contig1 45179 41470 41509 1 39, 0, 3670, +1050 336 231 0 1 3 6 270 +- ci-PC 1716 39 1659 contig1 45179 33878 35765 8 171,48,63,84,432,210,510,99, 39,210,258,321,405,840,1050,1560, 9414,9591,9642,9711,9867,10299,10563,11202, +111 138 0 0 0 0 4 39 +- ci-PC 1716 1467 1716 contig1 45179 33768 34056 5 45,54,51,36,63, 1467,1512,1566,1617,1653, 11123,11177,11237,11300,11348, +39 0 0 0 0 0 0 0 +- ci-PC 1716 0 39 contig1 45179 41470 41509 1 39, 0, 3670, +1458 762 183 0 7 60 10 57 +- ci-PB 3837 1371 3834 contig1 45179 31366 33826 18 165,495,48,24,150,123,144,117,108,204,45,69,84,186,174,27,114,126, 1371,1536,2037,2094,2118,2268,2391,2535,2652,2760,2970,3015,3084,3174,3366,3540,3576,3708, 11353,11524,12019,12067,12097,12250,12379,12529,12649,12763,12967,13018,13099,13183,13369,13546,13573,13687, +834 264 105 0 1 3 2 126 +- ci-PB 3837 0 1206 contig1 45179 34106 35435 4 51,432,210,510, 0,51,486,696, 9744,9867,10299,10563, +162 3 0 0 0 0 0 0 +- ci-PB 3837 1206 1371 contig1 45179 33879 34044 1 165, 1206, 11135,