# HG changeset patch # User sanbi-uwc # Date 1602592239 0 # Node ID 7297f56d2d03a076371ba1af3a38de782957a6d8 lukasa 0.0.6 diff -r 000000000000 -r 7297f56d2d03 lukasa.xml --- /dev/null Thu Jan 01 00:00:00 1970 +0000 +++ b/lukasa.xml Tue Oct 13 12:30:39 2020 +0000 @@ -0,0 +1,53 @@ + + Align protein evidence against genomic contigs using metaeuk and spaln + + 0.0.6 + + 10.5281/zenodo.4084863 + + + lukasa + + + + + + + + + + + + + + + + + + + + + + + + + + @DOI@ + + \ No newline at end of file diff -r 000000000000 -r 7297f56d2d03 test-data/contig.fasta --- /dev/null Thu Jan 01 00:00:00 1970 +0000 +++ b/test-data/contig.fasta Tue Oct 13 12:30:39 2020 +0000 @@ -0,0 +1,678 @@ +>NW_017366533.1 +CTCAGTCTACCCTGATTTGATTAAAAGACAAGGTAACAAATCCAAACAGAAATATGTCAA +GGACAGTTTTGTATGCAAGATATGCCACTAAGTAATGGATGACATGGAAAATATGTGCAA +TATCACAGACGAAAAGGTGAATTTCCCAGATAATTAGTACCTGTAGCTCTTCTGTGAATA +TTCTCATTCATCCAGGTCATAGTTATCCAAAGAAAGGTTTAATCGAAAGCAACTGGACTT +AGTTATAGTCTGGAAAGACTATAACCAGACTATAACTAAGTCCAGTTGCTTTCGATTAAA +CCTTTCTTTGGATACCTGTAGCTCCTGACCTCACTCTTGGATTTAAGTTTGGTTTGAGTT +CCAGTCTTTATATTTTACAGAATTTCATTTATTAATATTGGCTGTTGACTGTAAGCAAGG +GGTTAAGTGATAGACAGGAACCGTGGCCTTGGTTGCAGCTGCTTGTTACATTTTAAATGT +TTCATATCAGAGACTGTTGCTCTGTTTTACTGGGCGTTCAACTCTACATGTATCTTTTCA +TTTTCCGCTTCTAGCTCAGTATGTCTTGATAGCTTGCATGTGGTTACCTGAGATTATAAT +CACCAGAAAATAGTCCACAATGGCTCTCCATATACCAGGTCTGATCATGATGGTCGTCTT +CTACTTGTTGGTGTTGGGAATCGGCATCTGGGCGTCTGTAAAATCCAAGAAGATGGAGAA +AAACACACTCAGTGGACAGATAGAAGTTTCTCTTCTGGCTAACCGGAGGGTCAGCTTGGC +AGTGGGAGTCTTCACAATGACGGGTGAGTTTTGGTCAGGTAGATACGTTAAGGGTAATTT +AATTTACACAGCCTTCTTGAATGATGATACATTGATGTGTATTCTGTATGTTTACTTCCT +GCTGCAGCCACATGGGTTGGTGGTGCGTTTATCATTGGAGTTGCAGAGTCAGTTTATGAC +CCCACAAAAGGATTAATCTGGGCTCTTATTCCCCTACAAATGTCACTTTCATTTATTATT +GGTAAGATCCTCTTACAAAAAAAGCATAGAAGCTATGAGATACAGTTTGTAACAAAAGTA +AAACACAAGAAAATAAAACACAGAGAAATAAAATCTAACTTGATTCTCTCTTAAAGGTGG +ACTGTTCTTTGCAAAACCAATGCGAGACAAAAACTACGTCACTATGATGGATCCGTTCCA +GAGGAAGTATGGAAAAATACTGACTGGTTTTCTTGCCATTGTTCCATTTATAAGTGAAGT +GATGTGGGTTCCTGTCACACTGATTTCCTTGGGTAATTTTTCACATTATTCTCCAGAGGT +GTTAGAATAAATGTTAGTGATTAGGAGCTTTATTTACATGGCAACTTATGTGTTTCTGTA +TATTGTGTACTCTTCCAACAGGAGTTACCGTTAGCATCTTTTCCGATTTGCCCTTAAGTC +TTTGCATCTGGATCTCTGCTGTGGTGGCCATCTTCTACACTGTCCTCGGTGGTCTCTACT +CAGTCGCTTTCACTGACGTCATCCAGTTGTCACTGGTGTTTTGTAGCTTGGTGAGTTTAA +TATAAAAAAACACAAGACACGTCTCTGAACAGATAAACATCACCATGTATTTATTTCTGG +ATAAAATGTCAATGAATAATTTTCCCTGTGTTTATAGTGGCTGTGTGCCCCTTTTGTTCT +GGCAAGTGATGTTTACACTGACCTCAGTAAAACAGCATTCAACCACACGTATCAGGCCCC +CTGGCTCGGTCGCCTTGAGTCGCATGAAGTGTGGAGATGGATTGATAATTTCCTGGCAAT +GGTAAGATGAAACACATGGAAGATTTAAAATGCCTGAATAAACAATACACATATATGCAT +TTTTCTTTAAATGAAAAACATGTTAAATGAGTTTAATGAGCTTTTTCTTTGTGGAGATGC +CAAAATGAAAAACAATTTTGATTGTAATGTGGCAAAACAATCATTAATGAAAACAAAAAA +CTTAATAATTATCATTTTAATATGTTTTTCATTTCATTATGACACAACAAATGTGAACTT +TGCCTTTTTTGTTTTCCAGAGTGTTGGAAATTTGGCATTTCAGGATTTCCATCAAAGGAC +GCTCTCCTCCAGCTCCACATCTACAGCCAGAATGATCTGTTTCATAGCAGCAGGTGTGGT +GATTGTTCTTGGGATTCCACCTGTGCTGATTGGTGCCACTGCAGCCTCAACAGGTACGCA +CTGATTAAGAGGGCAGAGCTTAAAGAACAGAAGAAAAGATAGAAGAAACTGATTTTTTCA +TTAACTACATGAGCTAAGTTCACCTTCCATTCATTCTGGTTCTACTCTCTCTGTCAACTA +CTCTCTCAGTGCTGAATTTCAAAATGTCAGCACTTTTAATTAGGTAAAACTGAGACTGAA +ATTGAACTAAATTAAACCAAGCTGCAGTAAACTACTAAGCCACCTCAGACTGAGCAGCAT +CCAGCAGCTTCCTGTTGTGTTTCAGACTGGAATTTGACCTCATATGGGTCTCCATCTCCG +TATGAGCGAGGAGAGGCGGCTATGGTGTTGCCCATCATGCTCCTGCATCTCACCCCGACT +GCCATTTTCGTCGTCGGCATGGGAGCCATCGCCGGTGCTGCCATGTCGTCCACTGACTCT +TGCCTGCTGGCAGCGACCTCCATCTTCACAACCAATATCTACAAGCTCATTAGACACCAG +GTACGAAAAGAAGGTGGTTTAAAAAACAGCTGAGGGTCATTGTGACATTTTAACTGAAAT +ACAGTTTGTTCTTTTCTCTAGGCATCAGATAAAGAGCTGCAGTGGGTGATACGTCTCTCC +ATCGTGGTCGTAGGGCTTGTAGGAACATCCCTCACCTACCTGGACAGCAGCATCTTGGCG +TTCTGGATCCTGAGCTCAGACCTGACTTACACCATAATGCTCCCCCAGCTGATCTGCATC +CTCTTCATCAGGGTTTCCAATGGTTACGGGGCAATTGCAGGCTATATTGTTGCTTTTGTG +ATGAGAGTGTTGTGTGGAGAGCCAGTGTTCAGCCTTCCCGTCATCCTCCATTTCCCAGGA +TGCACTTTGGAGGATGGTGTCTACATCCAGCGCTCACCTTTCAAGAGCATTTGCATGCTC +TCCGCCCTGGTCTCCATCCTGTTGTTTTCATATGTGGCTTCACTCCTGTTCAACAAGGAG +ATCCTTCCTGAGAGGTGGGACGTGTTCAATGTGAAATCACAGGCAGCACCATCACCAGCA +GGTGGCACCAGAGAGGATGAAGGTGAAGAGGCTGATGTTAAACGTGAAAATGAACCAATG +CTTGATACAGACTGCTAATTCAGTTTCTATTGACTTTATTTTTCTTTTTGTGACATAAAC +ACATTTATGATAAAGATCAAAATCTCATGGAAACAGAATGAGTTGATGGAATCCTTACAG +TTAAATATCTTTACGTGCATTTCTATCTGTTCAATGCTTCTGTTTTTCCAAATGTGATCA +TCAAAGCAGCACATGACATATAGATAATCATTCTAATACTGATGTGTTTGATGTGTGAAT +TGTTTTTATTGGATTTTGTTATTATGTAAAATAAAGCATAAAATTATAACAGATGTTATC +ACTTTTTTCAGAAACTGTCTGCAGTCACAAAATGTGCATTAATCACATAATAATCAGTCT +TTTCTAATAAGATTTATATTTAGTATTACTAGTAATAGTTTACTTTTATTCTTTGAGAGT +CAAAAAATTTGAAATATTTTTGATAAGGCTAGTATGAACTCTGAGAATTGCATCAAAAAA +TCATCATAAAAAATGTGAATTTTCTTCAGTTCATAATGACTGCTTTATAATTGAGATGTA +TGTAAATGGATGATAAAGGAAATTAGTGCCACATACCACAGCATTTATAACCTTCTCATC +CCTGAGAGGGTCTATTATTTATGAACAAAGATACGATGAAGTGACCAAAAAGCTCAATGA +CAAGCACTATATCATTCATGGCTACTTGAATGATCCCTCTATAATAGTCCCAGTGTTATA +AAGAAAGATATACCTGAGAGCTATTTACAGTTGTTTCCATATTAGAAAATGCACATGCAT +ATCAATCAAACTCATATTGATTAGCATCTTGTATCGAGCATTGGTGCAGAGGTGTCTTTG +CCACTTTGCAAGTCATCCTCTCTGGCGCCACCTGCTGGTGATGGTGCTGCCTGTGATTTC +ACCTTGAACACGTCCCACCTCTCAGGAAGGATCTCCTTGTTGAACAGGAGTGAAGCCACA +TATGAAAAGAACAGGATGGAGACCAGGGCGGAGAGCATGCAGGTGGTCTTAACATGGAGA +CAGTCCGACAGCAGGAGAGTATCAAAGGTTTCACCAGTCTGACCTGTAACATGGTTGAGA +TCGAGGGACAAGGACGCTGTTTGTTCATTAATCCACTCTCTCATACTGAGTTACCTCGGC +CCCTCGTGGGAATCAGTTTCTGCCCGTCACAGACTGACTGTGAGATCTGACACACAACTC +AATCACACAGCTGCAAACACAGGAGTGAATATCAGCTTGGGGATGAGCTCCCATTTCAGA +AAACTGATCGTGTACAATATTCTGCAGGTGAAGATTAAAGGATAAAACAGGCTGAAAGCT +TTCATTTGTGATCACAAGATGCACCATCTTCATCCATCACTAACAAAGCAATGTGATGTG +CACAGTGCGCCCCCTTGTGACAAAATTGATCAATACAGGATGTTAATTTAGATTATTCAG +AAATAAAACAAAGAGTTTCCAATATCTTAGGAATTGATTTTATTGAGAAATCAACTCCAC +ATAAAGATAAAAAAGAAGATCTTTAGTTTTCATTGTGAGATTGTAAACACTATCATGTAG +TGAAATGAAAGTCAGACAAACAGTATTGTGTTTATGTGCCACCATAAAGAAATCATGACA +TTTTATGGCAATTACTGCAAGAATGCAAGTGGCGTGGTCTGCCTTAGATAGAGTTTTATA +CCTGCCACTGATGAAAAATTATTTTTACAGCTTATTTAGTATCATTTCATTGATATCTTT +AACTTCCCTGCACAAGAGCCAAATGAATATTACAGGACTTGCAAAATAAGAGCTAATTCA +ATAAAATGAATTGCTTTTGAAGCTAAGAAAATAGAGGCTCCATTATTAAATGTCACCAGG +CAAAAATAATCTCAAATAAAAAGTGCCATTGGTTGTATTTGCCTTCTTGTGTTGTGCGTT +TCTGTCTCATGAACCTCTTTCACCCTCTAGTGATGGTAGGTTGTTAGTGAAGGAGCAGCA +GCAGCGAACGTGTCTGCAGACTGGTCGCGTTACATGTGCTCTGGATGGTTCTGCAGACAG +GTGATGAACTCTTTCACCTCTTTTCCCTCAAAGCAGATCTGGTAGACTGCTGCAAACAAA +GGAAACCTGCAGGAGAGAATAGATATGGTTTAATATCAGCCTAAAATATCCAGCACTGAT +CGGGTACTGAACTAACAAAAGGGTGAAGATGTCATCCAGTCTTCAGAGGGGTCTAATCAG +GCGGCGTGAGTGAAAAGACAGAGACGACCACAGCTGTGTAAAGTGTAATGCTGCGTTCAT +GTCACGTTGGAAAGTCAATAAAATTAAAACCACAATCACGGCATCCTCTGTCATGACTAG +TAGAGACAGACACTTACTTCTGCATGTTATATATTTATATTTCTAATATATTAGTGAAGT +TACCAGCGTTTCAGTTTTTGCAAAGATATTTGTAATAATTGATTTACATAAACACTTTCT +ATTTACTACAGACATCCATCTTTTCTATCGTTTTGAACGCAGCATAACTGTTTCATTTTA +TTAATATAAATGATGCAGATTAATTCATTCCTGTGTGCTGGCAGAAAAAAATATTAAGTA +AACTTTTTATTGTGGTTGACTGTGTTGATCAGAATATATAAGGACAAAATCAACATCACT +ATTTAAGCCTCTGAATCCACTTTACTAGGTACACCTGTACAATCTAATCAAGTCCAATAT +ATCTCTTCTGCCATAAAGTCAGCTTTTATTATGGCTGCAATGTTCAGTTTTTGTTGACAC +TGTTATAAATGTGTTCATGTCTGTGTTTTAGCTCTGAGGTCATAGTTTGAACAGGGCTGC +ATTATATTGAAGTGTGCTGAATATTCTGCCCTGCTCATGTGTGCGAATAGAATGGACAAT +AGGATGTAGTCCAGTAAACACCGCCTTTAATTATAACCTCAGCAATAAACACCTAATTAA +ATGCTGACGAACAGAAACTTTGTAGAATTCATGGCTGTGGACTCACTTGTTGATCATGTC +ATTCTTCTGTAGGATCTTGTAGACCTCAGCTGAAGTCTGTGGACCCTGCAGCTTCTGGCC +GTTGAGCATTTCTGCCTCCAGTTCAGCGATGGACTGAAGAACCAAACACACAGAAACCAT +GTGGATGTTGTTTAGTGACATATGTGTTAGTCCTTTAGCATGCAGTAAAAGGTAGACAAC +TAAAGGTTTTAAATTTAAAGGTTTTTAATTTTGAGGTTGTGTCTTGCTTGAACTATTGTG +TTCCATTTCATTAATTTCCCTAAGCTTTCAGAAAGCATCTGTATTACACTCACCTTGGAC +GTTCTGACAAAGGCCTCAGCAACTTTGCGGTTTCGGCCTCCGTAGCAGGTGGTGATGAGG +TCGGCCACGCCACAGCTTTCCAGGAATGTGGAGGAGCTCACTTCACCTTTGCAGAACAGC +TTGGCGAAGGCGACCATTTCCATCAGACCCAGCCTGATCACCGCTGCTTTGGTGTTGTCG +CCAAAGCCGAGGCCGTCGCAGAACCCAGCTCCTACTGCCACAATATTCTGGCAGGGCAAA +AATTAAAGGACACACAATAATTTTGCACCAATTTCTGCTTTAATGCAGACAAACTACTCA +TAATTCACAATAGGCAACTGTCTTTACCTTTAAGGCTCCACACAGCTCCACTGTATCACT +CTCTTGTACGACAGTGATGCGAAAGTTGGGAGTCTGAAGCAGCTCTTTGAAGATCTGGCC +ATTTGCCTCACTTTTTGCCCCTTTATTAAACACAAGCGTAACATCATTCAACACTGGTGC +AGAAGGGGAAGCAGAAGGGGAACACTGTGTTTTCTTGTCATTGCCTGGCGACCACACTGC +ACCCTCTGCAGCGTCAGGAAAATTTTGTGCAGCAGAAGCTGAAATAACTTTGACAGTAAC +AAAAAACAGCGGCTAACCAATGGTGGTTTCGCAGAACTTCTCATCTGCCACCTCGTTCGC +GATGTTGGCCCCCATCAGGACGCTGACCTCGATCTCTAGTTTCTCCCGGATGATGTCTGA +GATGAGCTTCAGTCCATCTGGTCCTGCATCAACACCCTGCACGACAATGACAGAGAGAGT +TTCTGTACTGTACTCAGAGCCATAACCTCTGGCCTGGAGTGGTTGTGGCTTTGAGGGAAG +ATTTCCTCCACGTTGCTCAACTGCAACGTCTTGTGATGTGTCAAATATGAAGAAAGGTCA +GGTGACTGTTTCCCCTTTTTTGCTGTCAGGAAATGTGAACTGAAGAACAATGACAGGATC +TTACTTTGATGAGTGATATCCCAATGGTTCCCTCTGTGATGTGAGGCTTCATCTGATCGC +AGAGTTTGCCAATGAACTGGTGTGGGATCACAAAGACGAGGATCTTTGCTCCTTTGACGG +CGTCTGTGATGTCTGGGACAGCGACCTAAGAGAGGCATCAGAACAGAGTGTGTCAACAGA +GATAGCTGATGCCAAACAAGATCTTTTTAGCCTTTTATCTGGGAAGACACTGATCTTTCT +GCAGCTTCTGCTGCTGCTTTCTCTTGATTTTACATTTATTATGTATCAAGACAAACCTTT +TATGATGTGCCATCTTGTTTTTTAGCTAACTTATTGCCTTTTCATTGCTATTCTATAATA +TTTTATAGCAGATGCAGAGATAAAGGTAATACACATCAATAACAACAACAAGAAACACAA +TGCACAAAAAAACTGACATTAAAAACAGTTATGAAGAAGCATTTGCCCTCTCTACCCAAT +ATTCACTGAGTAAAATTCTGCTATTTAACCTGCAGTCTCACTGTTGTGGAGGTGGAGGTG +TATCAAGGTCTCTGTCTTGCTTTCAGATTCATTACACCCCTGGTATTCACAAATATAAAT +ATGTATTTTGAAAAAGCAGTTTATCTTTCCAGAGTTAATTTATTTTAACCAGGCTAATAA +ATGTGGTGGTTCATAGGGGAAAACTGTCTCTTTTGAAGTTATTTGTCTCTTACACCACTT +GACTTTGTGCCATTAAATGGTTCTTTTCTGTAGCTCTTGATGGCTGTGTAGTTGATGTGA +GCGTACAGTTAATGAAAGACACAAGGAAACAGATTAAGTAGATGATACATAAGACATATG +GGTCAACGTTAAGTATTCTTATCAGGGTAGATGTCTTACAATCAAAGCCTGTTTCAAGAT +TGCAGTGAATTGCATAACCTGAAGGGCGGTGTGATTGACAGATAATGCTGCCTATAATAA +ACATACCACATTCCTGGGCAGCTTGTGACCTGGCAGATATTTGACATTTTCATGCTCCGT +ATTGATGATCTCTGTGAGCTTCCTCCCGTCGATCATTTCCTCATACACCCACATGTTCAC +CATGGGGTCGAAGCGGTTGGATGCTTTGACATTGTGGCCGATGATTTTGGCAATGGAGGA +GCCCCTGGAGACGAGAGGAAAGGGGCATGTGAGGGGATGGCGTTGAAGTTAAATTTCACC +AGAAATCCTGAATGTCTCAAGAAATCCCAAAACACCACCAACCCAGAAGCATGGGAAACT +AAAAATCAAGCATTTATTTTAAATTCAGGCTTTAACATTTGCATAAAGGTAAAAAAAACA +AAACAAAAAAAAACAGTATACGTTGTAAGTAATAATGCACAGTTATCAATGTGCAGTGGA +CAATCTACTCCATAAAGACACATTCACACTGTATAGAGCTATAGTGACCTAATGCTGGTA +TAACTTTACATAAAGTACTCAAGGGTCGTTTTTAGTCAATGGGACTAAAAGGTTCCAGAG +TAAACAGGCCTCCATTAGTCTTTTATCCGAGTTATTTCATGTTGCAGCTTGCAGCCGGAT +TCCTCAGGTTGCTCTAAGATAAAGGCTGCGGTCCAAAGAAAGTCGGTTTTGAACGAGAAC +AGCTGAGTGTTTTCCTAACCCTAACCCATTTGATGCGATTTGATTTTAACTTAAGATAAT +GCAAGAATTACACGTAGCCGGTCTCCGGTGTTTGTCTCAATCTGCAGACTGTCGAATTCC +GTGTTGAGTTGAGCGTTAAATGCATAATACTAAGGACATTTATGAACAAAATGTTCCTGT +TTCTGAAAGATGCATCTGTAATAAGAAGTTACCAGTTTCCAGATCCAACGATGCAGACTT +TCTTTCCAGGCATTTTGAGGTTGGTTCGGCTGCAGTGAAGACCCTGTTCTTTTGTTTTCC +CTCCGTCTATAAAAACTTCCTCATACGCCCTGTAAAATGCTGCTGGGTTCACTCCTCCCC +TCGCTCTCCACGGACAGCCTACACCTCCTGCCTTTAGAAAACTGGAAATCATATTAATCC +AAAGCATCTTAGACGTCTTAACACATATATCCCCCCTCTTTGTCTGTTTACACACGCATC +ACAAGCTTTATAATTCACCAATGGGCTTATTTTACAAAGATAATTGATCCTCCTTTGTTA +GAGTCATACTTTATTGTAAAGTGTATCTATCATTAGTAGAAGTGTTCATATATCTGTGTC +TAATCACATTAAACACTGACAACTAACATGAACAGAGGAATGTAATAAATAAAATGCAAC +AATAACAAAGAATGGGAAGATAGTTAAAGTTAAAACAGTCTGTGGGAGAGGCCTCAGGGC +TGATGTGCATTATTCATGTTAGTTTATTCATCTTTAATGTATTTAATTTGCCTGAGAGAG +ATTAAGGTTGCAATCTTTTCTAATTTTCCTCAGGAGAAGAAACTGATTTTTGATGCCGTG +ATGTTAAGATTTGACATTTCTTTTTGGTGAAACTGTGAATAATGAAGTGGAACTAATTAA +AATTTTGATCCAACTGGTTTTGTATTCAAATACGTTTTACTGGCAGCCTGTTTTCATGGC +TTTCATGACAGGTCATTTTAATGCTTCAGGAAACTGATATTTTTGCCAGCGTTGTTGCAT +CCGTTTGGAAAGACCCTTCCCTGTTTCAACAAAACAAAGGCTGCTATTTTGTCTTGGTTT +TTTTTTTTTTTTTCATTTTTGTGTGGAAGAACTTGGCTCAATCCCAGTGACTCACCAACT +CACAGAAGCACATTCCTGTTAAGTCCTTGAGAGCTCATGGTTGCCCCACTGTGAAATCAT +CAAATGCATGATGACTCTCTGGCAGACATTTTGAGCCAGGGAATTACCCACAGATCATAG +CGTTGTGACGTTAAACAGGGGGAAGCCTGAGCACATTAAAAAAAAGAAAAAAAATGCCAA +CAAACTTTGACACAAAGAGACAAAATAATGGACAGTGTTGGACCAGATATTTTTGGCCAC +TTTGTGTATCATGTGTCTTATTTTGAAATCCTTTGCTGCAGCAGGACGAGCGCACTCTGC +AAACTAGACACGTGTTCTCCAAAGTTTTTTTTCACCGACCGTCCCTAACAACTAATATAC +AAATGTGTGTGTGTGTGTGTGTTTTAACAGCTGTGCCAGCAGCCCCGGTGAACGTATCAG +TGACCCAGCTGAGGGCGCACTCGGCCATGGTGACCTGGAACGTCCCTCAGGGAGATACTG +TCATTGGATACGCCATCTCACAGCAGGTACAGTGCAGCAGCAGCCCTGTTACGTGTGGGT +GGCAATCGAGCTCAAAGATTGATTTTTCTTAATTGGTTTAATCCTCAAAAAGCTTGGAAA +AATAATTCCTCAGTCTTCTCATTAAACTCAGTCAATCTGTCTCACGTCAAATTTACCCTG +ATCTAACCTTTTCTCCCTCTGCGCTCTCATTTGGTTGAAGGCCAATTAATTTTCCAGGGA +TACAAATTGAAAGGATATAAATTATGAATCAAATGCCCAGAAAACTTGGCTCGCTGCCAC +GTTCTGCGTCTGAAAGGAGCCTTTTTTCAAAGTTGAATTATGTATTTTTTTTTTTTGTGT +GATCCATCTTTATCTCTTGAGGAGTGGATTCTTGTCCACAGGGCTTTTTAAAACCGCTGC +GTCATTCATGAGGCCAGTAGACAAAGTCAGCATTTTGCTCCAAGACGCTTTCACTCACGA +GGGGTTGAACGTGTCTCTTTAAAAAAGAAGTCTGGAAATATAAACATTTAACTTGAAGAG +CTTGTGAATGTCGAGGCTGGCTGCTGGTTGATGTAGGTACTTGGAGCAATAATGAAGGAA +CAAATCTTGTGATTGCAAAATTTTCCAGCCAAAAAAGAAGGCGTGGAACTTTATAAGCAT +CCGATCAGCGAGAAAAAGTCTGAAAATATTGGTTGAATTTGAAAATAATTCTTAGAAAGC +GGTGGAAATCATGCAACAGACCAACCCACCAGGCATCCTGCTCCATGTTTTCATTGTAAC +CATAATTTAGGTTTCACCTGCTTTAACAATTGGCCAAGATCCTGTTCACACCTGGTGATC +CGATCACAGGTGCACAGCTGTAAGTGAAGGTGTGAATGAACCCAAGACGGACTGAGTTTC +CATCTGACAACAAAACAGATACTAATAGAAATAAAAAGAAAGGAACAGGATTGAAAAGCT +GAGGGTTAAGTAGAGAAAATACATTTTTTAGTTCAGTCCACAGGAGCTCTGTTGTGTCTA +CATGTGAAACTGTGACGGTGCGACGCTTTAAATGCTGCTGCTGCAAGGAATTATGGGACA +GCATTCTCTTCATAAATGATTTGCTGTGGTCAAATAGTTGTTTTTGCTTAGGAAGGTTCC +TAAATGACCCAGAAGTATCTCACTGGCAGCCATGATCAGAGCTGGTCCAGGTCTCTAAAT +GTTAAGGAAAGGAGCTTCAGTGTTTCCTATCTTTAGCAGAGGAGACACTGGACCTTCCTT +TACGAAAGGAAAGGAGAGAATGCCATCCCACAATTCCAGTCGTAGTTTCAGATCCACAAA +TATGTGGGCACATCAGAGCTCCTGTTTCATGTTTGTGACACAATCCAAAACTTCTGAAAA +TCTCCTGCAGGTTATAAATAACAACACATTTTATCTTTGCAAACAGAAATGATGATCAGG +GAAATGAGATCACCTCCAGGTAGACCTCTATCCTCGCTCGCTAACTGCTCTTCATACACT +CTCCAGCTCACTCAACGTGTCGATATTTTTCTCTGATCAAAACCTAATTCTTTATTTTGC +TAATTAACTGAGCGACTCTACGATCTCTCCCTGGAGTCCACGTGGCCCCGGTTGCATCAC +AGTAATAGACATTTCACATTAACCCCTCGCTCGTATTTCACCACATTACGTTACATCTCC +TGAAACCTCGGCGCTGCAAACTCAGCTCGGCTCACTCTCTAATCAGTTTTTACCACCCAC +AGTTTGGCAAAAAGCAGAATCAGACATTAGCTGAGCTTCTGAGTGGGAGTTGTCTCCATT +AGTGGAAATTATTTGGCCGGGACTCGTCTCACAGGAGGAACATCCACAGCAGCAACGATG +CCAAACAACTCTTGTATTTATTTATTTTATTTTTTTCCTTTTAAAGTCGCCTCACGTCTG +ACTCAGAATCCATCAACCTTGTGGCATTTTCTAGAAAACAGAGGATGGAGGGGGGATGTA +CGACATCTCCTCCTCCTGCCATAACCTCAGAAAGCACTTATGTAAAAACCTTACTCAAAT +ATTAATAAGGGAGGTGATGGGAGCAGGTAGATGTAGGTTTTATCTATTGACTTCTTTTTT +TGAAGCAGAGGAAATGCAGTTATATAAAGGCAGCTGCTTCTTGTCAATCACATTTTTGTC +TTAGAGACCAACTTCTTAATAGATAATAAAACAAGCAACAATTGTTCAGCTGCGTGCGTG +TGTGGTTTGAATCCTCGTACACAAGCCGCTTTATGGAGGATTATTCCACATACAGTATCT +TTTCTGGCGAACAAGCCAAGCCTTCTGTTTGTGAAGGAGAAACAGGACGAGTGAATCTGC +TCTAGACAAAGAGTTTTCGAGCTTCACTCATCTGAAGTCTTTCCAAATCCCAGAGCGCCG +GCTGCCGAGATTCACACATTACGCAACAGCACTCACTCGCTTGCAGAGGAAGTAACCCAA +TTTAAGATTTTATATCTGAAACTCACAACAATCCTGATTCATAAATCCCAACCTATGACA +GACACAAGGTTAATTGATGATTATATGAATATGTGGGTAAAATAAATCCATGCTGGCTCT +TTCAGATAGCATCTGTTGTCAACAACAGAGCGGAGATTTGTTCCTGCTGACTTCCTCTCT +GACCTAAAAATAGTTACACAACCAAACTTTATCTTCACCTGTGGAGTCATCAAAGAGGGA +ACATTTTACCGAGGTTACCTGGAGCATGACAGTCGTAGCTCCTCTGCCCCCGCTGAAGCT +TTTTAGAAGGGATCTGAGGGGGTTTGTTTGATGGGTTTGTCTCAGCTGAACCATAACAAA +CCTCACTACAACAAATCTGTCCAACGGAAAAGAAAAACTCAGGGTGAATTCTTGTTTTGA +TCTTTTCTTTTACAGCAATGGAAATGGAGCAAAACTGCAAATCCTCTCATCTAATAAGTT +TAGTCCTTCTTTTAGAGTAATGCTGCTAGAATAAAATAATTTAATGATCTCAATACACTT +CACCTTCCTAGGATGCTGTTTATCACTGGTCAGATCTATTTTGCCTCCTCTACTTGTGCA +GTTTCAGTTTGATATAATCACTACATCTTGTTTGGCTCTGGAAAACTTTAAAGGGAATGT +TGAAGAAGCAAAAAGGTGCAAAAATGTAACATTTATTACCAAAAAATCCAAATTAAAGTC +TTTTTTTGCTTCTCAGGTAATTTACAGTGGTATGGTGGTGATATTTTGTGTCCACTATGG +GGTGTTATAACTCTCACTATACATTCAGACAGCACCACAAAGTGGTGAACTCACTTTGTA +CTAATTATACAGTAGTTATTCCTGTAATAGTTACTGTACAGAAGCATGGGGATGTGAAGT +GCACATTTAAATAGCATGCTGCGTTCAGGGACATTTTGCATGTCATGTCGAGACATTAAG +CTTTTAGCGTGAGTGAAGACACGTTTAATTACTTTAGGACACTGGTGTTTTCAGAAGCCT +TTTCGCCTGAATGAGCCATTTGGTTTTTTGTTGTCCTGCCAGTTGCTTCAGCTGCGTTTT +TTCTTTAAATTCTGTACATTTGTCCAGAATCGGAGAAACTTGCATAATCACCGTTGAGTC +ACCAGTGCTGATTAACAACCCTTTTAACCCCTGAGAAGACGTCGTGTAGTCTCCACAATA +AAATCCCTCCTTGCTGACCCGTCGCTTGCGGCGCTGCCAGAGGAGCAGGAGACACGGCTC +TGACTCTGCTGAGTCTCTGATGCAGACATCTGGAGGGCCTCGAGCGTCCTGCCAGCCTCC +TAATTATTGACTCTTCCTCAGCTTTGAGTGCTTTACAGCCACATTTACTCACTGAGAGAC +TTGTGTCTCGTTCTGAACCCAGACTTTAACGCCCACCACCGGCTGCATCATAGTAGACTT +TAATCCAAAAAAAACTATTAATGGAGTTCTTACCGAACACTTTTCCAGCTTAAGTCACAA +AAAAAAACACACAGCTGTTGATTATGCAAATGTTAGCTTCTCATGAACATGAAAATAAGC +AATTTATTATGTTTTTATGAAGTTTTGTGAGTGGTTTTTTGCACTTAAAACAACATGAAA +ACAAACAAACCTCAAAGAAAAAAGTAGGAAGTTCATGAAAAATGTTTATTTTTCAAATAA +CAACAGATCAGATAACTACTTGTACACAGACAGTTTTGCTGTGTCCCCTCAACTTTATGG +AGTTTCATATTATTGTTTTTGTTTTAATGCCTCAAACTCGACTGTTTTGGTTCATTTTTA +TTGCTCTCACAGTGTTTTTCAGGTGACAGACAAATGAAGTAGCTAGCTAAATGTAGCATT +TACCAGCTAAAGAGACAAATATTGCCTTCAGAGTTGGTACAGACCAAAAGCAAGCTAAAA +AGCTGAAGCTAAAAGAGAGGGAATACTGGCTAAAAAGGACACAGAAACAAGCTAAAATGC +TAATGTTGCTCCTTATCTACAGCCAACAAATCAACCTTATTAATTTGTCAGTGTTGTGTG +TTTCTGCTGCCCCCATGTGGCCAAAAAGAGCTCAACAACTTACATTTACAGAATATTTTC +TGACTCCAGCTTGTTACAGAGTGATATGATCTCTAAAATAAGAATACATTCACTCTGAAT +TACCCTGAGCAACCTCTGCACAGTGACTTTGAACTGATGCCATCAAGATAAAAGTCAACT +ATTTCTTTTCATCGGGTCAAAATCAGTTCATGCATAAACTGGTTTTGGAGATATTTCTGC +ACAGGCTCTGTATTAGCCGAGTATCTGTGCCTGCATGTGGATTATTTCTGTGTTTCTTCC +AAATGATGATTTGCTGGTGTTACCTTGCCTGCAGACCTAATTTCCCCCGGTGGGACAGGA +AGTGTTTGAGCTGAATTCATATGAGGTGAAGCTGCTTTGTTACAGTGAGAACTGTATTTG +TCTTGAAGTGGTGAAACAATGCAACAGATGAGTTATACTGTGAAATTAGACCGCAGTGCC +CTCGTGTGTCTCGTCTCCAGAGGCAGGACGGCCTGATGCAGCGCTCCATCCGAGAGGTGA +ACACGTCCAGCCGCTGGTGTGTGCTCTGGGACCTGGACGAGGACACGCACTACAGCGTCC +AGGTGAGACGGTTTCTGGGTTTTCTGTCGTGTTTGCAGACGAACCAAACATTTTTGATAT +AGGGAATAATTCAGACATATTTCTCTTTCTTCTGCTGATGAAACTGTTTATTATTCTGTT +GCTTTAACCCTTAATGTGACAAATATTTTTGAAAGAACTTTGGTGCAGCAGCTCATCGAG +TCTGTGGGCAGCAAACTGGATACTTACCAGCTCGTATATGAAAGAAACCGTAGCACAGGA +GGATATAGTTGTTTCTGTTTTTGATTATTTTGTGTCTCTTCTTGTAGTTTTGCATCTCTG +TACTCGTTCTGCATCATTTTGTGGTTCTTTTGTCTAAAGCCTAAAACTACAGCTAGTGCT +CTCATCTTAGATTTTACATCTGAAGACTAGACTAGACGTTAATCTTCAAACAACAAATGG +TTAGGTTGTCACAAGGAAAGCAGCAAATTAAAATCTGCAGGGAAACTTAAATCAAGGAAC +TTCATTGATAATAAATTTTCATATATAGAAATGAACTCTTATTTTTATTAACCTCCTCTC +AGTGTTTAATTAACACACTGACAACACTTTCTTTATGGCACATTTAATCATTATTACAGC +TCAGACCAGCTTAAATCAAAAGCCAGCACAAAACTGCAGCTCCTCTCTGAAGGAGGAGCG +TCTAATGTGTTTCCATTATCACGACTCTATTAAACTTTTTATAATCCATTATAGCTTAAT +AGACGGATACAGATTGTCCTTCACTCTGAGGGCTCGGTTAAATATGCTCCTCAGCCAGTG +GATGTCCTGCAGAAGTGTCATTGAGCAAAGCACTGAAGCGATGCCAAGACGGGGGGGGCT +GAGATTTGACCTCTGACCTCCCTGAGGAGGCGAGGAAAGTGAAAAAAGAGATTTTCTCTA +TGTTTTGGTTTCAGCTCTTTTTTTTACTCATTTTGTTTTATGAGATTTTCTCTGTGGAGT +CAGGTGAAGAGTTTATCATTAACCAGACTTTTTTCCTCAAGGACAGATATCAAACTTGCA +ACTTGCCAATTAGAGAAGTCTTTTGGATACTTTCACATGAATTCAAGGACTCATTTTGAA +ATGTTTTGTGCCGTACCCACCTCTGCTAGTTATTTTCCCACAATGACTTGCAACTACCTC +CACAGAAAGCTCTCTGCGTTCAACCTCCGGGTTCAGCGTGTGGGTGGAGGCAGCAGTGTC +TGCAGCACTGTGGGACCTCTTGTGGATGTAATTGTGGTGGATATCTCTCTTTGTGTGATT +GTTGAACTTGCTGTTATCACAGCTGCTAGAAATATCTCTGTGTCCTGTTTGAGTCAGAAC +TACGCCATTAAACTCAATGTCTTCATTTTTAATGGTTTTTCGCTTTCTTTAGTTGCTGAA +AACCTCCCGAAAAAGTCCCTAAATGAGCTGTGGCTCTAATCTGTGTTCCCTCTTATTATC +TCTCATGCTCTCTCTCTGCTTCTACATTTACAGTGCCATTTGTCCTCCAGTGATCACTCA +GGATCCCGGCCAAAAACCAGAGCGCCATTTGCTCGCTAAATACACCCTCGCGAGCCAGCT +TCTTCTCATCGTTACATAATGTCATCCTCTGTTAATGACAGGCTGGGTTTTAAAGTGTGC +TCTGATTATATGGCTCCATCTTAGCTTCAGTATTTCCTTGAAAATGTGAGTTTTCACCTC +TTTTATTTTCACTTTTTTTCAGGTGCAGTCCGTCGGGCCGCACGGCGACAGCCAGCCCAG +CCGTGCCATCCACTTCAGGACTCTGGAGAGAAGCGACCACTATCCAGCCGGAGTCCTGGA +CCACCGTAAATAATCACAAATACACGTGTACAGACACACAAAGTCAGGAAATAACAAAAT +ATAAATGTGTAAATGTGGATTTGTCCTCAGACGAACCAGCGATGGAGGGACTCGGGATGA +CTCCTCACCTACAGACAGGAGAGCTGCTCATTATCACCACTGTGCTGCTGCTGTGGGCAG +GTCAGCCTTGATATATATGTGTGTGTGTGTGTGTGTGTGTGGGTGTGTGGATGTGTCTGC +TTCACTGTGTGCAGATAAGGATGTTCTGGGAGAACACTCACAGATGGATTATGAGAGTGT +GTCCCTGGGCTCACACATGTAAAAAGTCTCCCATCCCTCTCTACATGAGGGCAAGACTCA +CACATTCAGAGACTCTGTGTTTGTTGTTTTGTGTCTCTTTATGGTTGTTTTGTTTCTGGT +CGTTCTGTTTGTTTACTGTTGTTTTGTGTCTCTTAATCATTCATTTGGGTCTCTTTGGTT +GTTGTTCCTCTCTGTACTCATTCTGCATTTGTTTGCCACTTTCATTGGTTGTTGTGTGTC +TTTTGTGGTCATTTGTAATGTTTTGTGACAATTTGTGGTCATATTTCTGCCACACACAAA +TGACAACACCCTTTTCTTCTCTCTCTTGCATTTGACTTTGTCTCCACTTCCTCAACTGTA +ATCGTCCTCCCCAGCCGTCATCGCCCTGTTCTGCCGACAGTACGACATCATCAAGGACAA +TGACTCCAACGGCACCAAGGAGAAAGCCAAGAGGCCGCTGGTCCGCGCCACCTCCTCCTA +CTACAACGCCTCGGCCGGAAGCTCGCCCATCTACCACAACGGAGCCGTGCGCAGCAGCAG +GGTGAACATTTAGAAAACTTCTCCTCCTTCCCCGACTCTTCTCCCGAGCTTTTGTGTTGT +TTGCTGCACCTCTCTATAATGCATGATCATTCTTGGCTGCCAGGAATATTTTGTTTTCCT +CTGAAGGGCCTTTGTAGTTGCATCAGAGATCTCCTAGCAACCAGAGCTGCTGCCATCATG +GCTAAATATAAAACTTCCAGGCTGGAAAACAGAGAGCTAGCTGCAGAAGCTCGTTGGGCT +TGTTGCTGTGCATCTCTTCAGAGACGTGCTCGGCAAAAGTGAAACATCTGACGAGGAAGG +TTTATAATGATAAACTGGAGTTAGAGGCGAGACTGTCCTCACTGTCACAGCCAGCTAGCT +AGAACATTTAAAACAGCTCAATTTTACATTGTTTTTGGTGGTGGTCAGTGAGTTTTACAC +AAATATATCTTGTATAAAACTCATTAATAATTAAATATAACCCGAGGCTGCTTTGCTAGA +CATTTATTTTCCTGACTGCGTAGTCCTGCTCACTGAACTGAAACACGGTATATTTTACCC +ATGATCCCTGGCTCCTGGAGCAGGAAGTGCTGTCACTCTAACAAATGCACCAACCTCCAT +TCAAATTTTTGATATTTTTAAAGTTTCCTGGCTGGATATCAGAGATGAACACGGGTTTTC +AATGACTTCTGAGTCTTTTTAACTGACCTACAGTTCGGCATTGCTCTTGAACTTGTTGGG +CTGCTGACTATCACTCAGTTAGAGGGAGATTGTACCTGTTCATCATCAACAACAGGTGCT +CAGGAAGCAGAGTGGACCATCACAATGATTCAGAAATTGGTATTTTATGGTAAAATAGTT +ATGTTAGTTATAATAGTTAGTTATGTTGCTTGGAATAATATCAACCAAAATTTGGCAGCA +CAGGATGAATTTATAATTGAAAATGATCAACTCGGGGTAAACATATGTTTTTGGTTCAGT +TTTGGAGCCAAAACTCCAGAGCAGAGATAAGTCAAAAGCAACAACAAGACACAATGTCCT +TTCACGTCTGGTTGCCTTGATAACAAGGACGTGCCTCTCCATCCTCCCTGCAGTCAGACT +TATTTTCCATTTTCTGTCATTTTTTTTTCCACCAAACCCGAACCCAAACGCAATTAAGTG +AGAAGTGCATCCGAGCCCATTGGGACGCATTAGATTTGTGCTTTAAATGTCAAGCTGTCT +CACATGAGTGGAACAGTTCATTGATTAGCTAATAAATCTTTGACAGACGTTTTATATATA +TATATGTGTGTATATATATAAATATATATATATATACACATATATATATATATATATAAT +GTATTACAGCACGTGGCGGCGCATGTGAATCTGACCCACACACTGTCGTCCTGAGCTGTA +TGAGTCATGTTTATATATGCGACCCTCTCCATCTCTTTCTGTTTATGACTCATGTGTTTA +TGCACACAGCTTCTATCTCACTGTTTCCTCTTCTTTCAGCTCCACAGAGCTTCCTCCTCC +ATCAGCATCATTAGAGTCTGAGTCCGGACGGTTTGGTTTAAAGACTCTCTGCCGTGCTGT +GCAGGACGGGGCGGAGCTGAGGATGTGTGGTGGCAAACTTGGGGAATTTATAGACCTAAT +TTATTGTAAAATATGGACAAAGTGAGAAACACAAAGTGAGAAATGCAAATCTAATTCAAA +TCAAACTAAGGAGTCGCACTGTGGATGACTGCTGCCCTCTAGTGGCAGAAGACGGCAGCA +TTAAAACATCACAGCTGTTTGGAGCTTTCCCAGCAAAAAGAAGATGTATTTTCAACTAAT +ATCCTGTTGTATAAAGACGTTTTCTTCTCTCTGATGTCAAAGACTAAAATGTGAATAACC +GCCAGCATGTCGGCCAAGTCCTCTCCGCCTCAATTTAATTGATTCTCCAACACATCTGTG +TGTGTGTGTGACTGTTTGTGTGATTTATACATTTTTAAATTTCCAATCAGTAATTAGATG +TACAGTACTAACATCAAAAGCAGTGTATTATATGTAATTAGAATATGTACATAGATAACT +TGAAGGCAGGTAAGTTGAAGTAATTGAAACAAATATTTGAATGTATATGATGATGGTGTT +GGAGGCTGAAAAACACGCAGACTTCACACTGTAAGCTTTCATCAACAGTTTAATTAAATC +ATTAACTCAGTGTAATTAGATCTGAACATTAATCTAAGTTGTTTAGCAGACTTCCCTTGA +ATTTTCTGCAGTTGAAAACTAGGCAGCAAATCCTGTCAATTTAAGAAAACTTAAATTTAA +CTTGTTTTTCTTAAGTTGACCTCACACTGTCAAGTCTTGTGTTTACACGTGTCTAACAAA +GCTTTAATTATCACATTTAATATTGTTCGACTTCAGCCCCTCATCTCCTCTAATTAGTTT +GATTGAGATTGACAGGGACACAGACTTTATCTCAACATGCAATAACTGTAAAAACTGTGT +TTAAATATATGAGATAATAGATTTAAAATCAAGTATTTCCTTGTGTTAATCAGTAATTTT +TGGCCCATTATGTTCTCCATATTTTAATGGATAACTAACCCTAACCCTTCTCCAACCAGG +ACCACAATGTTTTTGTGATGTCCACTTAGTGAGAGCAGAGATTTGAGGATGCAGAGCTGA +AACCATGGCCAAAGTACCACATACAGGCTGAACAGGGTCAAGTGGGTCTTGTTGAGTAGC +TCAATAGTGGTTTGCCTGGGGAACATGTCCGTCAGTTCCAGCTGTATTTCTTGCACTCAG +GATGAAAAGAGCTAAAGAAAACAGAGTAAGAATGCTGACATAGATGGAGCAGGAAATTAG +AAGCGTGTTCCAGGTCTGTGCTGGCTTTGTTCCTGAGCCAATACAGTAATTACTCAGGAA +CACACAATAATAAAAGATATTGGTTTTATTGTTGGAAAGTTGTCAGTGATTTAAAACACA +TGTTTTGGTGTCAGAGCAGGAGGATACATGCATTTATTTTTTCCCTCTTGAGATTTATTA +TATAAAAGAGATCAAGCGCTTAAAAGTTTAATTATACATTTCTTTTTGGGTGTAAAACCG +AATTAAACAAATAAAACAAAAGATCACTGGTGTTGTCCAAATCAATGTTATATCATGATA +TTTAAATCAGGTACATCATCCTTTTGCTCGTACTCTTTTAGTTGTTTAAAAGTAATTTAA +CCAACACTGTGCTGTTATATTATGAGAAAATTACAAGAAAACTATCTCATAATTCTAAAA +AAAAGAATAATAACAAAAACACAATCAAGATCAGATCAGGATGTCATAAATTTGAGAAAA +ATATTGCATAATTTTGAGAAAACTATCTCATACTTAGAATTATTTTATATTTATGAGATC +AGGATCTCATAAAACTGCCATTATTATGGGAAACTATCTCACAATTAAGAGGTAATTTGT +TTGAAACCGTTGCTTGTTATTAGGAGATGCAGAAATTATGAAAATGCTGACTTGATTGCA +CTTTTCTCTCACACTTTTCCAGGAGAATTGCACTGATGTTGGGAAACAAGGCCTTGACAA +CTTGGCCTACGAGTATGGGAGTCAGAGTGAGCTCTACCGTCCACCCAAAGCTGCCTTCAG +GGTGACCTTTAGACTCCTGGGACTCACCACTGAGCACCAGGCCCGAGCCATCGAAGCCAA +AATCTCCATCCTGAAGGGAGTAGCCAGTGTCAGCTTGTCTTTACCCCGACGATTAGCCAA +AGTGGACTATGATACCTCACTTCTCTCAACCAAAGAGATCGCCCTGGAGCTCCAGAGGCT +GGGGTACAGTGTGGAGTTGGCGGTGCAGGTCAGGGTGGATGGTATGCACTGCCAGTCCTG +TGTGCAGTCCATTGAGGGACAGATCGGGGAGCTACCTGGGGTTTCATATATTCAGGTGTC +TCTTCAAGACAGGGCAGCACTGATTGTGTTTCAGCCTCTTCTGGTTACACAACAGGAACT +GAGAGACAAGATCGAGGACATGGGGTTTGATGCCACTTTATTATCCCAGGACCCACCAGT +GGAAGATATAAGCTACTGGCAGACTGACATATCGACTTCATCCTTGTCATCGTCAACCCG +GACTGTAACTGTTTGGATCGTAGGGATGACTTGCAACTCTTGTGTGCAGTCAATAGAAGG +GAGGATCTCTCAGATGTCAGGAGTACAGTCCATCGCGGTGTCGCTGAAGGATGAAAAGGG +AACAATAACCTTTGACCCCTGTCTGACAGAGCCGGAGCAGCTCAGGGCGGCTATCGAGGA +CATGGGCTTTGATGCGTCACTTCAAGGTAGACACTGACGAGGAAAGGTTTACTGATAATA +TCAGAATATTTAATATCTTCGGCTTGTTTCTCTTTCCCAGAAGAGGAGTTGGTTTTGGAA +CTCAAATAACATTGAACTGGTTTTTCAGCTTGCCATGCTCAAGGTAGAAAAACACCCATT +GTTAGATGCCCTTAGAAGGACTTATATTGTTCTTCAAGCAACCACCCCACCCACAAATTC +CTGTACATGATATTAGGAGGAGGACTATGTTATTAATAACCTCATGAGTGTAATAAAAGA +GGCAAAGAAATCTAGTAATAGCACCTGTTCGTTAAGCTCTTGCATGTATAATCTGAAGGG +TCACTAAGCAACAAGACACCCCATAGTCACCTCAACTCAGTTTCCACCAGTTACTGTGGA +AACCAGCCAAGTATGCTCTGCAGTGCAGCTCAGAGAGGGCCCTTTACGGTGGCCAGGGGA +TTTCTTGTCGGATTTAATGACAAAAAAAAAAAAAAAAAAAACAGCGTGCCAAGACATGGA +ATTAACTCAGGGAGATTATGAGCAGATTCTTTCATCTACCTTTTTCCAATTTCAGCTGTT +ATGGTCGAGTTGAAGTTGACGTTTTCAGCTTTTAAAGCTGCACTGCTGGCCTGGACTTGC +GATTAATTCAGAGCTACAACTCAGCATAGAAGTTGTATATATTGGTATCATTGTGATGTG +AAGGAGTCTGCAGAATAATAAATGGTCCAGTTATACCTATTACAACCACCGTTTTCTGAG +TAAGATTTCATTGCTTGCAGATCACCAACATTAAGGCTGAGGTAATGGAGGCAGAAACTG +TCTTCTGCTATGACTCTTTGTTTAGTCCAGTAGGTTTTCGAGGTTTGGTGCTTTGGCATC +TTCCACTGCAGGATATACTCACAGTTAGCAGTTTATTAGGTACACCAACCTAGAAGTAAT +CCAGTTTAAAGAGGTGTCGATTCAACCTCCCTTTAAACATCTTTGGCCACTGACTTTGCT +CTCTTTTCTCTTCAGAACCTGCACAGAGCATCCAGGGTCATGAACAGTCCAGGCCTGTTA +TCTCTGGACCCTCTCACCTCCCTGACTTGCAGTCACCCAGTAAGGCTGGAGTCAGCAATG +GCACCGGATCACAGGCGAACACTGCGAGTCATCACCCCAACCCTCCTGACATTAAAGTAC +AAAAATGCTTCATTTGCGTAATGGGAATGACCTGTGCCTCCTGCGTGGCCAACATTGAGA +GGAACCTGCTCAAACACAAGGGTATGTTTGATTTAAATAGTCAGTTTATCACCCAGTTTT +CCAGTATATGAGAGAAGGGTTATTGATTAAGTAAACTACTCAAGTATGAGTCGCTGATAA +AAAATAATGAGGAAAACACAGTGTTTCACAATCGCTTTGACTTCCAGGAATCATTTCGGT +GTTGGTGTCACTAATGGCGGGAAAGGCAGAGGTGAAATATGACACAGAAATCATAGATGC +TGCTGCTGTAACTCAGCTCATAGAAGACTTAGGCTTTGGGGCCAAATTAATGGAGGACAA +TGCAGTAACGCATGGGAAACTGGACCTCTCAGTAAGTCCTCAGAACGTAACGTGATACAG +CATTCCTAAATACCAAGAACAGTTAAGAATTTTCACCAAATCTCTCACTGTTAGATAACA +GGAATGACATGTGCGTCATGTGTCCACAACATTGAGTCCAAGCTCACCACAACCAAAGGA +ATCCTCGGGGCCTCTGTCGCTCTGGCCACCAATAAAGCACAGATCCAATTTGACCCAGAA +GTGCTCGGAGCTCGAGATATCATCAAGATCATTCAGGTAGCCATCACTTATTTTTTACAC +TGTCTATTATAAGCCTCGTCTTTGATTTTGTGTCATGCTGTTGTTTCTCGCTGTAGAGCC +TTGGATTCGGGGCCAGTCTGGTGAAGGCGGGCTTCAAAAACACCCTCGACCACTCAGAGG +AAATTAGACAGCAAGTATCTGTTTAATGTTCCTCATTATCAGAATAAACGTTTATTTAAT +CTGTTTAAAGTTTAAATACATTTATAGATTTAAATAAAACCTCAAACATAATCTAATGGA +CAGACCCACCAACATAAAGATGAGTTTCTAGCAGAGGATGGTTAAGATCCATCGACCTCT +GGGTTATGGGCCCAGCACGCTTCCGCTGCGCCACTCTGCTGGAAACCACCCCAGATGGGA +CTCGAACCCACAATCCCTGGCTTAGGAGGCCAGTGCCTTATCCATTAGGCCACTGGGGCT +ACACAAGTGCCAGTCTACACATGATGACCAGACTACACAAATCCAGCCCAGTTCTGAAAT +GACAAATTTCAAGCGTCAGGCGTCTGGAACAACTAACAGGTCTTGTAGTGGGACATAACA +GCAATGTGGCATCTGGGACGCCCCACGGCACCTCAAAGAAATGTCACGTCTCTTAGGGTT +GTATTGCCATCTGTTGGTTTGACATTCGTGACCCTCCTCCCAGACGCATGGACGTGAACA +ATGACTGATCGAGGTCAAAGTTGCAGTTTTTTGCCAGTCTCCTCTATCAAGATGTGGCAA +GAATTTATGGCGCTATGATTGCTGTATTTGACACAGTGACTCTTGTGAAAGACAAAAAAA +TATCACGACTGTTTCTCTCACTGCAAGATAAAAGAACGACTTTCTAGCAGAGGATGGTTT +CGATCCATCGACCTCTGGGTTATGGGCCCAGCACGCTTCCGCTGCGCCACTCTGCTGGAA +ACCACCCCAGATGGGACTCGAACCCACAATCCCTGGCTTAGGAGGCCAGTGCCTTATCCA +TTAGGCCACTGGGGCTACAACACACCCCTCACTCCATATACAATATCACTTTCTTAAAAC +ACAAATCCCCCTAGTGACAATAGCTGGAAGGATTTGTCCCCATGAGGCCCTTTGTGTAGC +CTGCACAGACCACAATGGACACCATCAGACAATGACTACAGCTGTCAGTGCTAGTCAAGT +GTTGTGTTAGGTTGCTGTTGCCTTTCATACATCTGGAAATCAGCAGAAAAACAGGCAAAA +GGTGAGAGACAAAATCACTACAGTGTCTCATTTCTGTGAATGTTGCAGGTGGAAGAACTC +CTTCCTGCTCAGCCTTGTTTTTGGCTTGCCTGTCATGGGCCTCATGATTTACATGATGGT +AATGGACAGTCAGCACCATGAACATGGAGGCTCCATGCCTGAGGAGCAGAACCTGTTGCC +GGGCCTCTCCCTCCTCAACCTGGCCTTTTTTGTGCTGTGTACACCTGTGCAGGTAAGAGA +ACAGGTGACCTTGTTGGTTCTTTTTTAAGAGTTTGTTATTGCTAAATTCACATTGTGCAT +CAGAAATGGTTACGTGTTTCCTCTCTGCAAGAATGTACATGTGATTGGTTTTGTCTTTTG +TGATTCTACAGGTCAATAAATTGATAATAAATATACCTTATATGTTTGATTGGCGGCCAT +TTTTCCTGTCTTCACTCCCTGCAGATCTTCGGAGGTCGGTACTTCTACATCCAGGCATAT +CGCTCGTTAAAACACCGCACAGCCAACATGGATGTCCTGATTGTGTTGGCCACCTCTATT +GCCTACATCTACTCCTGTGTTGTCCTCATCGTAGCCATGGGCGAGCGAGCGAGCCAGAGC +CCCGTCACCTTTTTTGACACTCCACCCATGCTGTTTGTGTTCATCGCTCTGGGGCGATGG +TTGGAGCATGTTGCAAAGGTAAAAATAAGGCTCTTTCCAGCTGTTGCCAGTCTTTGTGCT +AGGCTAAGCTAACCAAGGAGCTTCATATTGTATTTGCTCTGTAGACATGAGTGATATTGA +TTCTCTAATCTAACTCTTGGCTGGAAATAATTAAGCATATTTCACTGAATGATGTACTAT +TCTTTTGCTGAAAAAAATAAGTGATGTTAGGAGTGTGTTAAATTGTGGAAGATCAGCATT +AACACTGACTGACTGAAATCACCTTCTGTTTTTTCCATTATAATTCTATGTAAGCTTCCA +TGTCACCACAAAGGCATAACTTCAATTATTCATTATACAAATCTGCATCAACTGAGCCTT +TATTGTAATGTTTTGATGACTCATCAGTGGACATTTTAACAGCCTGGGATATGGGTCATG +TCATGAGTTTTTGTAGATTATTAACTGTACATCAGCTGCTGTAACACAATCATAAGACCG +GATTAAATTTTATCATGAGACTTGCTAGTGACCTTGCTGTACCAACAACTGACCAGATAG +CATCTTGAATCACCCTTAAATACAAGCTATAATTCACAACCGCTGACAAGTCTGAATTCA +GCATATATAATGTACAACAAAGCAAAAAGTACTACAAAGCTACTACAGGTTTTAAGTACT +TTGTTTTGTCGCCATTTCTGCAGAGTAAAACCTCAGAGGCCTTGGCAAAGCTAATGTCAC +TTCAAGCCACTGATGCCACTGTGGTCACTCTGGGATCTGACCACTCCATTATCAGGTGGG +ACAAAAGATACAGTAAATAAAAACACAACACAATAGATGGACACCAGAGAGTGTAACTGT +AGATACATTTGTTGACTTCAGTGAGGAGCAGGTGGTGGTGGAGCTGGTCCAGCGAGGCGA +CATTGTGAAGGTTGTCCCTGGAGGAAAGTTCCCCGTTGATGGGAAAGTGATTGAGGGAAG +CTCCATGGCAGATGAGTCTTTGATCACAGGTAGGAGGATGTAACAGTTGTAAAACATTAA +CACAAAGGCCTGTAATTTTTGCTAACTTTATTTTTCCTGCCGTCTGTGTCTCCTATCTCT +ACCAGGTGAGCCGATGCCTGTTAGTAAGAAGGTGGGCAGTTTGGTGATCGCCGGCTCCAT +CAACGCTCATGGCTCTCTTCTGGTGGAGGCTACTCATGTTGGTGCAGACACAACTCTGTC +TCAGATAGTCAAACTGGTGGAAGAAGCCCAGACCTCCAAGGTAGGGAGGCAGATTCTGAC +AATTTAAACATAAAAGCATAAAATGTTAATGACAGGTGCATTGGATCTTTGGAATACAAC +AGTGTATTTGGGTCATTGTAGGTAAATTTACTGCTTTAATCCCAGAGAATATCCACATTT +TTACATAAATATACGACTTTAATCTTGGAAATTCTGAGTTTTTTTCTAAGTATATAAAAC +CCTTTTTATATTTAAGTCAAGATTTTCACAAATGAAAACACAGTTTTTGCTGCTTGGACT +ACAAAAACATTCACTTTAGACCTTTAATATCTAATATATTCCACATTCAATCCTGTTTTT +TTTCATAAAACGAGAAAATAAGCAAATTCTTAAATCTCTTAATGCAGTTTCAGATATTTC +CTAGAGATCAGTGTCTTGAGATAAAGATTAAATAAGAGGAAATAAGGAAAATCCATGCAC +CTATATTAGGAAGATGACAATTGACACTGAACATTCACAAAAAAAAGTTTCTTAGAATTT +TTTTCACTTGTTTCAAAGGCAAAAAATATAATAAAGAAAGTGGTTAAGTTTAGTTAGTTT +AGTTCTGATAAGAGCTGACAGTTCACTCTCCTTCACTCTTGTGTTTGCTCAGGCCCCCAT +CCAGCAGTTTGCAGACAGGCTCAGTGGGTACTTTGTGCCCTTCATAGTTATCGTTTCTCT +GCTCACACTGGTGGCCTGGATGGCGGTCGGGTTTGTCGACTTTGATATTGTGAAGGAAAA +CTTCCCGGTAGGTGCGCACAAAAATGTTTTCACACGTGGACAAAAGCGTATGACACAGAG +AGAGAGAGGTTATTTTTATTTTCATATCACTTTCACAACTTCCTCCTCGCAGGGTTATAA +CCAGAACATATCCAAGGCGGAAGTTATCGTCCGCTTTGCCTTCCAGGCGTCCATTACTGT +TCTGTCCATCGCCTGCCCCTGCTCTCTGGGGCTGGCAACCCCAACAGCCGTCATGGTGGG +AACAGGTGTCGGAGCTCAGAACGGAATCCTGATCAAAGGAGGCGAGCCGCTGGAGATGGC +CCATAAGGCAACGCACTTTCATTTACTTAACTGTTGTTGTTAGCAATTTAACATTTAATA +ATTTGTTAATAATTAATAATGAATTCTTAGTTTTGTTTTATACTGACTGAAACTCAGGAT +GTTTGTAGTGTTACATAATGAGCATGAACAGAAAAGTTAGAGGAAGAGGGCAAAATGATT +CCATTTTCCAAATAAAAGTTGAATTAGATTTATTTATTTTACAACAGCAAACAACAAGAT +TATCAGGTGCATAACTCAAGCTTTTGTCATATTTATTCTTTGATTTACTTGTGCAGAAAC +AAGAAGAGAACAACACCAATATTGTTGTAAGTTACATGAGATATAAGTGACTCACTCGTA +AAAACATCAAACTAATGTGGCAGCTGTGTTATTTTAACTTAGGCAAATATTTGATGGGTG +AATTGATTCATTCATGGCATCAATGTTGCCATTAAAGGTAGAAAAACAAAGTGGCTGCAG +TTTGTCCTGGTATGTAGATGTGCAGCATACCATCCTCCTGGTGTAATTGATTCTTGTTGA +TCTTCTCACTTACTGCATGATCAATGAGAACAAAGTGTATTTTCCCACACACTGAGGTCA +GGAGTCTGGAGTTCTGGATATTTTAACATCTAATCTATCTCTGTTCTAATTAACTAGCGC +CACTGTGTGGCGTCAGAAGTTACTGCTTCATTACAGGCACACTCTCTTCTCCTGTGTAAC +TGCTTCCACCTATGTTTGTGTTCTTTAGTTTTACAATACTGTGATATTGTTACATTTAAT +TTGTCTTTGCTGCTTGCTCAGATCGGTGTGGTGATGTTCGATAAGACCGGCACGATTACA +AATGGCGTGCCTCGGGTGACTCGTGTTTTGGTGTTGTGGGAGATGGCCCGCATGCCCCTG +AGAAAGATCCTGGCGGTGGTAGGCACGGCTGAGGCCAGCAGCGAGCACCCGCTGGGCATG +GCGGTCGCTAAACACTGCAAAGAGGTGGGAGAGGAAGCCATTTAGCTTCATTAACTGTTT +GTATCCAGGTAAAATTAGCAGTACTGTCGTCTGTGTGCATGTACCAGGAGCTGGGCTGTG +ACGTCCTGGGCTACTGCCAGGACTTCCAGGCGGTGCCTGGCTGTGGGATCAGCTGCCGGG +TGTCCAATGTAGATCATCTGCTGCAGCAGCAGAGTGAAGAGCGTTTCCTGCTTCCAGGAG +CAACCACAGACGAAAGCAGCCTGCTCTCTGCTGTCGAGGCCCCGTCTGCAGGTCTGATGG +TTTTCACTTTCCTGGGGTTCAACTCAGAGTCATACACAGTGTTTACTTGTTGATTTTAAA +TCTGGAGGGTTTATTTAACTGATTCCCACTTTGTTTGAATGTAATCACTGTCTGCCTTCA +GTCAATGAGGAGCCTTTATCTTTCCTGTGGTGAATACATTAAAGTACAGCCTCTTAGCTG +AACAATCAAAGTTTTACTACCCCTGAAAACACAGCACACACTTCAAACTAAATCTAGGTT +GTTAACAAGCCCTAAATTTGTCCATTAATTTGAAAAGAAAACAAACAATCACAAATTTTA +AAAGCCCCTGATTAAAAGATTAAGTAGAGCTTAGGTGGTACATGACATTAGCCTTAATTT +TAATTTTAAAGATTTGACAATCTCATCAATTGTCAGTTTAATTTAAGATTATATTGAGGT +CGATATTTTGGTTTCAGTTGTCTGAAATACTTTAATGTGCAAATTAATTATATTTTAGGA +AATTCTCATACAGTATTTAGGTATTTAATAGGCTCACTGAGGGATTCAAAGGGGTAAAAC +CATTAATCTACACCTTCATTTATAACTTAAGACATTTTTAAATGGATTATAATATATTAA +GGGGTTTAATGGGTTTAATGGTCTAATATGGATGTAGCCGCTTTAAGGTGTGAATTAACT +GGATGTCATCTCCTTGTCCTAGATCATTTTTACTCATGTAATTTTCACTTCTGTGATCCT +AAAATGTAGGTGAAGGCTTGTCTTACTCAGTCCTGATTGGAAACAGAGAGTGGATGAGGA +GGAACGGTCACCACATTGGAGCAGATGTTGATGCCGCCATGAGCAGCCATGAGACCAAAG +GGCAGACGGCCATCCTGGTGGCAATAGACGGTGAGGATAAAACTATTTTCTCGTTCTCCG +ATCTTTTATAGATTTTACTGCTGCAGTCATCGTCTGTTACGTGTGTTGTCTGCAGGTGTG +CTCTGCGCCATGATAGCTATCGCAGACACAGTGAAAGCAGAGTCAGCGTTAGCGGTGTAC +ACGCTCAACAGCATGGGCATTGAGGTGGTTATGATAACAGGCGACAACAGACGCACAGCC +AAAGCTATCGCCGCACAGGTAAAATCTTTTTTTTTTTAAATACTGAGAGAAAAGCACCTG +AATTAATGAAATAAAAAGCCTGGAAGTTTGGTTGAACTCAGGTGGGGATCAGGAAGGTGT +TCGCTGAGGTGCTGCCGTCACATAAGGTGGCTAAAGTTCAAGAGCTGCAGGAGCAAGGCC +GGCGAGTTGCCATGGTGGGAGACGGCGTTAATGACTCACCCGCTCTCGCCCGTGCTGACG +TCGGCATCGCTATCGGCACGGGGACAGATGTGGCTATTGAGGCAGCGGATATTGTCCTGA +TCAGAGTAGGTGACCCACTGTAACTGCCAGTCTGTGCAGAGATATAACAACACGTTTACA +CCACCTGACCTGAAGGTTTTCACACCGTCTAGAATGACCTGCTGGATGTGGTGGCGAGTA +TCGAGCTGTCAAAGAAGACGGTGCGGAGGATAAGGATCAACTTTGTCTTCGCTCTCATCT +ACAACCTTGTAGGAATACCAATCGCTGCAGGTACAGGCTGATCATACACTGACTCACTCC +TGAGGAATCAGATCTATAACAGCAACAAGATACTGTATCACCAACACAGCAGATCACCTT +TTTTATTAATCAGGCAGGGAGATAAAACTCAGCAGTAAAACTTCCCAAATATCAAATTGG +AGGACACATAGCAAAGCTGCAGCCAGAGTTGTGTTTGTTCATTTGGAAGCTGTTCAGTCT +GTCTTTTTTAAAACTTAAATCCTAGTCATGAACGCAAACTCCACAAGCACAACCTCAAGA +AAACTTTGACAAGCCAACAAAAAATGTTATAAGTTATATTTTTGTCTTTTCCACACTTAA +TTCTAGCAGACTATTCAATTTGCTGTCTTCTCACATTAAAATATAAATAATCAAAGCATT +AAAACATGTGATCTGTGCCTCAACACATGGTTAAAAATCTTGTGAAAAGTGATGTCAGTG +TTTACAAAGAAAGGAAATGATTTGTCCATACTGGTACCATGTGGACACAGAGCAAACTTA +GACTTTGTTACGTAAACTTTAAAAAACTACATTGAAACACACCACAGCTGCACAAATTAC +ACAAAGCTTTAACTTCTCTGTTGTGTTGTAGGTGTGTTCATGCCTGTCGGTCTGGTACTG +CAACCCTGGATGGGTTCAGCTGCAATGGCCGCCTCGTCCGTCTCTGTGGTTCTGTCGTCC +TTACTGCTGAGAATGTGAGTCCCTGGTATATCCTGTGACTTCTCTCTCCCCTTCATTAGA +GTCGACTGACTTTCATGATACGTTTTCATCTTATTATACCTCACTTGCACTCAGAGGAGA +AGGTAATAACCGTCTGTTTCCTCCAGGTACAAGAAAACCTCTGTGGAGCTGTACGAGGTG +CGCGCACAGGGTCAAATGAGGAGCCTTCGATCGTCTCAGATCAGCACATATCTGGGGCTG +GATGGCCGTCGGCGGAGCCCGGCTCTCCCCGCCAGAGCTCGGGAACAGCTAAGTCAAAGC +AGCTCGGCAACCCCGCCCTCCCTCTCCAGCCAGGGGCCGTCCATTAACTCTGTCCAGGAG +CAGCAGGACCGCTGCTCCCTCCTGGACCACCAGACTACAGAGGACCTTCATGTGTAGTAA +AGGGAAAAGGGAAGAAAGACCTGGTTGTTTACAAATTCAGTGACGCTCTTTGATATTAAT +ATCTCTAAGTATTTATATAAACAGATGAGGTTAATTGTGCACGGAAACTTTTAAAGTTCT +CTTTTATTTCGCCTCATTCATCTTTAGCTCATAAATCCTGATCCTCTGAGGACCCTGAGT +CAACACTGATCCTTCACTTTCTCATTGAAAATATCTGAAAATCAATTTGCTAACACTCAC +AAAGTGACGTTTGACCGTGCTTCTGAAGCATTTTCTATATTTTTTTTCCTTTTTCATGCC +AGATCACAGGTGCTACACGAATTAAAATTGACGTGTATATAAAGGTGCACTTTTACAGTG +AACTCAAAGTAAAACTACACATTGTTTGTTTGGATAAGACTGTGCTGGTGTGAGTGTTGG +TCTCAGGTTATAAACAACTAATACACAGGTTGATGGAGGAAAATTAGCATTTTTATCAGT +ACGTGGGTTTATATTTGCACTTGATGCTCCTGTCTTTTGCATTCAGCTGCTCAGGTTTGT +GCAGAACTGTCACTTCATCCAAGAGAATAATATTTGTTCTTGTTGATATGTTTTAAACTC +TTGCAGTTCACAAGTATAGAGTTCTTGTGTTAAATATATAAATGAGGGAGAAGAAATGGA +GCTCAGACCTTCTGGACTTTCCTTCATGTGTATTTCGAGCTGTGCCAGAGATAATTAATG +CAGTAAATTAATCAAATCATCTCATCCATGGGCTCTATAGTTAACCAGAAAAGATCAGTC +ACATATATCGGCTTCAGAGATAGTAATGACTCTTGTGTTGCACTCAGCCTATATGATAGA +TAATAATAATAACTCATTGATGCTTTTAGTATGATGATCTTTTATTGCTTTATTTTGTCA +CTTTGCAAACACAGCATTGTTATATGGGGTATCCTTTGCTTGCTCAGCTATGCATCCGTA +ATTGTGCCAAGTTTTAAGGCTGATAGACTCGGGGCTCTTTGTTACTTTCTTGCTGGATGT +AAGACTAACATTTCATTGCTTTGAGTCTGTTTTTAACCAGATTTCCTTTTGGTGTGCAGG +TCAGGAGCCATACTGCCTACCCTCCAGGCGCTGCAGAAGAGCATCCAGAGACACTTTGAC +AACCTGTCCAAACTGTGAGTCTCAACGTTTTTGCAACTTCAACCTCCGTACACAAGAAAT +GACACAAACTTCAGGAGCTGTAAATGTGTATTTTCTCTGTGCAGGTGCGACTTTAACATG +TACAACATTCGTTATGCCAAGGCCCTGTCGAAGCAGAGGGGTGTGAAGAGGGCGGCTGAG +GAGGTCCAGGAGGAGGAGGAGGAGGAGGAGGAGGAGGAGGAGGAGGAGGACGAAGGGCTG +TCTGAGGGCATGAGTGAAGCCTCTGCAGAAGATGCAGCAGAAATGATTCTTTAGGCTTAT +TTAGGTGTCCTGAAGCCCTGCAGAGATGATAATGATGTTGGATTGTAAAAACAAACAGAT +TTCTGTGATAAAACTTTGTTATTGTAAACTGTTTTTTATTAAATTCTTATGTAAATGTAA +ATGTGGATGTTTTTATGTTTTATTATTTATACCTCCCTGTCCAAAAAATGGAGAGGACCA +GCTACTATGTGTACCTGAACAACCCCAGCTCCATCCCCCACTGTTTTGATGCTTAAGTCA +ACAAAATATGGGATGCTGGTTATGATTATGTTGTTTACCACATGGTGAATCCTAACACAC +TAATTTATTTAACTTTCAATTTAACACTTTTAATGCATATATGAGCTGCATTAAACTCAT +TTAGTTTGCCTATGCCTATAAAAAAATACAATGGTCCACAGTTAGAATTACATTTAAAGG +ATAAGAGCACCTGAAACCAGCAAATATGTGGTATTTTTCCATCAGTTTGAATGAAATGCA +CCAGAACTACATCGAACTACGTTACCCAGCAGTCCTTGCGGCGGAGCGGAAAAGGCGGAG +TTTGAGCCAAAATGAGGGAAAATAAGAACATGTCCGAGTCCCCTTCTCAAGCGGGAAAAG +AAATACCGGCGAAAAAACAAAAACTAAGCAGTGACGAGAACAGTAACCCCGATTTATCAG +GAGACGAGAATGTAAGAAGCTAAACTGTGTTTGTTCTTCGTCGATAAATGACCCATAATT +AGCTTCTAGCGGGTTAGCATTGCTGCTAAAGTAGCCGAATAGCTAAAGCGGCTAGCTAGC +AGCTTTGTCCACCTGTACCGGCTGAATTCAGACAGCTGTTCCAAATTTATACCTGCTTTA +AACCTGTTTAATATCTCCTAAATGTGTTGCACAGAGAGAGTTTTGTCTTCACCGTCTCTG +TCTTTTATGCACACCCTCAAATGTCGCTATCTTTGGGCTCTGATCGCAGCTATTCACGTG +TAAACTGAAGTTAGCTTTAGTGCTAGCAGCTAACTGAAATGTGCATTGTGGCAGTTATTG +GAAATTATCTGTTAAATTAAGGGTCGATGGAGATGGATAAAGCTTGAGATATGATAATGG +AGGATGGCTTGTTATCACCAGCATAATAGGCAGTTAGTATGAGAGCCACGTTGATTTATA +GGTATTACTATTTATCACACTGAGCAAATATAAACTGTTATAATTTAATTGTTTACTGTG +GAGCCACTTGTGCATGAAGTGCTTGAAGGTTAGTGCCCATTGACTTTAAGTGACTTTTCT +GACGAAACTGTTATGCAGATTATTAAGAATATTATTGATCAAAATAACATATTTCTATTT +TAAAACAGCAACAGTCACCAGGCAGATACTGGCAAGAAATGACTGTTGTGTCTGTCAGTG +TAATGTCAAAGCATTCAGCAAGTTTAGAGCCTCGGGAGCATCTGTGAATTAAGTTATTTG +TACTTTGTCTTTAAGGAAGTCTGTAAGATTTACTTTAAACACACACATACATCACTTGTA +CCTGTGTTTTGCTTTCATAGGATGATGCTGTCAGTGTTGAGAGCGGGACCAACGCAGAGC +GCCCAGACACACCCACCAACACCGCCAACGCCCCGGGCAGAAAGAGCTGGGGCAAGGGCA +AGTGGAAGTCCAAGAAGTGCAGATACTCTTTTAAATGTGTCAACAGTCTAAGGGTATGTA +CCTCCACCAGGTGTTTTCCTTCCGCAAAACAGGCAGCATATGTCTGGTGTCGTGGGCTCA +CTTCACCCTCTGAATGTTCATGAATCGTGTAATGGTTTTCACAGGAAGACCATGGCCAGC +CGCTGTTCGGAGTCCAGTTTAACTGGCACAGTAAGGAGGGAGACCCGCTGGTGTTCGCCA +CAGTCGGGAGTAACAGAGTAAGTGACGACGAGCCAGTTCTCACATGCTGTTGTGCTGATG +CTGTGATGTTGCCCTCTTGGCTCTACATAACCTTTTTTTTTAGTAATTTGTTGTTTGTAC +TGTTCCATAACTAACCCCCTGTTTCTTTTCTTCCCCAGGTAACTTTGTATGAATGTCACT +CTCAGGGAGAAATAAGACTCCTGCAGTCTTATGTCGATGCAGATGTATCCTTTACTTACT +TAAAATGTCTTTTTAAATTGGCTCCTTCCTTGTTCTTGTTGTCATTCTTCACAGTTTCCA +GTCCACATAGCAGTTGCTTTTGTTCTCAATCGCTATTATATAACTTGTCACTTGAGCTAA +ACAGAAACACAACAACTGGAGGTCATACTTGAAATGTTTGCACAGAAATGTGAAAATCTT +ATCTCCTAGAAACCTTTTGAACATAATTAAAACAAACATACAGTGATAGTTGACAGCAGA +AATAAATGGCAGAGTAAAAACAGGGTATTTTAAGTAGTATAGACAGAACCACCTTTCTGT +CATCCCATGAAGCTCTTGAATTGAGGTGAAATTCTCTCACAGCTGAGAGGTTGGAGCATC +TGAGACTTCTTGTATCGATTTCTTTGACTAAACTTGTGCAAAAGGCTGATGAGAACTTTT +ACACGTGTGCCTGGACCTACGACACCAACACGAGTCATCCCCTGCTGGCTGTAGCCGGAT +CCCGCGGTATTATCAGGGTGATCAACCACATCACAATGCAGTGCATCAAGGTACATTTAA +GCCATTCTCGCTCAATATTCGGTGGCTGGAAGGCACAGAGGACTGTGTTTTCACAGTTCA +GTGCTCCAGACTGATATAATTTTATATCCTATACATCATACACTGGATAAGGATGCATTT +ACTGAGAAGGAGATGCTGTTTCCTGCCTTTGCTTATCACCATTTGGTGTTTACTTTTCTA +AGTTTTCTGACTGTGCCACAGATGGGATCAGATTGACATCCACCAAACCTGTTCACTCAA +ATACTTTAAATTGCATTTTCAAATCACAGAATGAATAAATTAAGACCACATCTATAATAA +CAGTGTTTTTCTTTTCATATCCAGCACTATGTAGGTCATGGAAATGCCATCAATGAGCTC +AAGTTTCACCCGAGGGATCCCAATCTCCTCCTGTCTGTCAGCAAAGGTAAAAAGTTCTAA +AATTCTTCACAAACAGCTAACAAGAGTTATATGTCCTGCTTTATTGAGCACTGAAAATGT +TTTCTCACCCATGATTTGTTGCCACTGTCTTTGTGACACAGCAGAGAAGTAGGTTACTGT +AGGTCAGGGGTAGGGATAGACAGTAGGGATAGTTAAAGTGTTTTTATTACCATGATTGTC +AGGTGGTTCCTTAATCTGAGCAAAAACAGATTACTTCTCTGATAAGGGCCTAGTTTAATC +TTAATAATGTTTTCTCAGTTACAACCTTCTTTAAATTTGCATATGTGAAACATCTGCTTC +GCCTTGCTGAAGGGCAAAGGATTTTCTTCCATTATGAGCACATAATCCATCTGAAGTAGC +TGTAATAATCTCTAAACTCTTGTTTTAATTGGTTATTTCATGCCAATTTCCTCAGATCAT +GCCCTTCGTCTATGGAACATACAGACAGACACATTAGTGGCGATATTTGGTGGCGTGGAA +GGTCATCGAGATGAAGTCCTGAGCGCCGTGAGTGTTGCCAAATCACACCTCACATCAACG +ACTCTGTCCCATCAATAGATACAGTTAAATAAGTAGTTTATATGAAGGACTTCTAATCTG +TTTTTTGTACATTTTATTTCAGGATTTTGATCTGCTGGGTGAAAAGATTATGTCATGTGG +GATGGACCACTCCCTCAAACTGTGGCGGATCAATTCAGAGAGGATGCAGAAAGCCATTCG +TGGATCTTATGAGTACAACCCCTCAAAGACCAATAGGTAAAAACAAATACAAAATAATTA +TTCTTTACTTGATAAGCCTCTTGGACCTTTGGGGGCAGTGTTTCTCATGTTTTTGTGTTT +TCTTCAGGCCTTTTGTCTCACAGAAAATTCATTTCCCCGACTTCTCAACACGAGACATCC +ACAGAAACTATGTGGACTGTGTGCGGTGGCTCGGAGATCTTATTCTTTCCAAGGCAAGTT +CTTACAGAGAGTGCAATGTTTGTAATGTTTTCAAACCTCTGGACTTCTTGCAAGCTTAAT +CAGGTCAGAAGGGACACATGGAAAAACCGAATGCTGCTTCTCCAGGTCAATATAGGTTGT +TATGAGTAGAATTTTATCCATTTAACATTAAGTTTAACACAAGAAAGTGTAAAAACATTA +TGGTCTGATACTTTCTAAATCCACTAAATGTGGGAAATGTGGATAAAAATTGGATTTTAA +ATATGATATATTTGTCTGATGAGAAATGTAACATGGCTTTTATCCAATTTATCGTTCTCG +TTTCCTCTTCCTGTCTCATTGCAGTCCTGTGAAAATGCCATAGTGTGCTGGAAGCCAGGA +AAGATGGAGGACGACATCGATCACATTAAGCCCAACGAGTCAAACGTGACGATTCTGGGA +CGCTTTGATTACAGTCAGTGTGACATCTGGTACATGCGCTTCTCCATGGACTTCTGGCAG +AAGGTCAGACAATTTAAACATTTCTGTCCACTTGTATCTCCATCTATAGTCAGGACATAA +CCTGTTGCTGATGCTCTGTGTGGTCTGATGGTGGTTTACAGATGCTGGCTCTGGGAAACC +AGGTGGGGAAACTTTATGTGTGGGACCTTGAAGTGGAAGATCCTCATAAAGCAAAGTAAG +TCCACAACGCAAACTGATAAGTCACAGTTTTAATCCTCTGTGACTCTGAGCCAGGACACT +CCTCCTGTCATAGATAATGTCTGTCAGCTAAATCCCTCTACATATGACTATAATGTTTCA +CACCAGCCAGACGTGTTGTGAAACAAAACACGCGTGCTGCCAAAGTAAACTGTAGAGCAA +TGCTAGATGCTAATCCAGGCCAGAAAAATAAAGAGTGTCATAGCTTCGTCTGACAGCTGA +AGTTTCACTTAAGTTTTATTTTTATCAGTAGAGTGTAGAGAAAATAATACATAGAAACAC +AAAACTGCTGCACATAAAATTACCATTTGGAGAAGATCCAGCTGTTGACTTATGTTGAGC +TGTAACCCTCTTGTTTAGAGTAGGGATCTGTATGATTAGCACCAGAAAAACTGGTTGGTT +AAACTTATTGATATATGCTAATGTGCAGATGTCAAAGTGGAAAGTGGGACAGTAGATGTG +TCGTAAAACTACTCCACTCAAAGCTGATTTCTTCATGCTGAATATAGAATAAAATATACC +AATGTTACAGCGCAGCTCACTGTCTTCTCTCTGGTCTCCAGGTGCACCACGCTGACTCTC +CCCAAATGCATGTCGGCCATCCGGCAAACCAGCTTCAGCCGCGACAGCAGCATTTTGATA +GCGGTGTGTGATGACGCGTCGATCTGGCGCTGGGATCGACAGCGCTGAGCGGTTCAGACT +GACTCAAAAGCGATTTGAGTTCCTGTTGCTTTTATCCCCAACCTGCATCCCTGTTGTACA +GATCTACACTGCTGTTTGAGCATTTTGTTTCCTCTGTGTGTTTGTGTGAATGATGTAAAA +ATACTGTATTTCCTAAAAGAAAGTGAAGAATCGTGCCAAGGTGAGATGATCCTGTGCTAC +TCCAGGAGTTAGTTTCCACTTCCTGTTTGTCCGGTAGCAGGAACGACAGATATTTCTAAG +ATGTTTAAGGACAAGGAACAAAAACATCAGTGATTATCTGAGATTTTTCCCTTTAGATGA +TCATGATGGAGCCACAAAAGCGTAAGCAATATGTTGGTGAAATAATCAGCATCGGCAGAA +CAAAGTTCATAAATTAATCACTAACACCATTTTAAGGCTTTGAGACGAGAGGAAATGTTG +GTATTTCAGGCACCTGGCAGATCTATCACTCATTTTAGGGGAAAAAAGCTTTTAAGAATA +AATGTGATGGATGGCAGTGTGACATATTTTATATCCAAAATGAAGATTTTTCTCCTTTTT +TCTCCGCTTATTTTAACATTTCCCACATTCCTTTTCATATTTTTTAATGCCCTCTTGGTT +TGCTCACCCCCCTCCTCACAAACACACACCTTTGACTGTTGCATCATTGACATTTGAGGC +TTTATTGAGTGCAGTCAATAAAATGATTTTTGTAAATATACATTTACTAAAGAGTCAGTT +TGTGCAGTTGAAAATGTTCCACTTTTGTTTGGTGAATAGTTAAATGAGATTGTGCTGGGA +GTGTTTTTTTTTTTTTTTTTTTTAGCTCCAGAGAAGTTGACATTTGGATGATTGGATTTT +TACAGCAAAGTAAAGTTGAAAAGTTCGAGTTAATCTCTTAAAACAAAAGTCTCTTAAAAT +AAAAGTCTGCTGAAGAGGAGGGAAGTGGGGTCCTTTTGCCTCTATGGAGTGCTTGTATTT +GAATTTACCTGGACTTAAATAAA diff -r 000000000000 -r 7297f56d2d03 test-data/proteins.fasta --- /dev/null Thu Jan 01 00:00:00 1970 +0000 +++ b/test-data/proteins.fasta Tue Oct 13 12:30:39 2020 +0000 @@ -0,0 +1,56 @@ +>XP_008319618.1 +MALNVAGVTVMMLFYLLVLFIGIWASVKSRREAEKSRDGDRTDMALLGNRGINLVVGVFT +MTATWVGGGFIVGTTEAVYDPSLGLLWAVMPVTATMCFIIGGLFFAEPMRNNKYVTMMDP +FQVKYGKVPTAALSLACLVSEVMWVTGTLIGLGVTMSVILDLSYTVSIWISAAVAITYTL +MGGLYSVAYTDIIQLILIFVSLWLCVPFALINPAVTDITETAKNFTFQPPWIGAVEGDRA +WRWIDNFLLLGLGNLGLQNFHQRTLSASSSSTAKICCYAAAVIVPLMGIPPILLGAAAAS +TNWNLTSYGSPSPFERGETGLVLPIVLQHLTPTYISIVGIGAVAAAVMSSTDSALLSAAS +IFTSNIYKTILRTQASEQEIQWVIRASVVVVGLAGTSLTFLDNSVLMIWILRSDLTYTLM +LPQLVCVLFFGVSNGYGAVLGCLSGILLRVLSGEPQLGIPPVVHFPGCTLVNGIYVQQSP +VRTICMLWAVAAILFFSYMASLLFNRGFIPETWDIFNVKTQTGIKTKKQNQEVQTEKSEA +QEPMIESSC +>XP_008322079.1 +MASPLKVCIVGSGNWGSAIARIIGNNVKSIQRFATTVNMWVYEENIDGRNLTDIINTEHE +NVKYLPGYKLPENVVAIPKLRDAAEGADLLVFVVPHQFIRKLCDEMVGCVSNKARGISLI +KGVDEGPEGLKLISDIIRERMGIDMSVLMGANIANEVAAEKFCETTIGSKILENGLLFKD +LLQTPNFRITVVDDADTVELCGALKNIVAVGAGFCDGLQCGDNTKAAVIRLGLMEMIAFA +KLFSKDNSVQTATFLESCGLADLITTCYGGRNRRVAEAFVKTGKSIEELENEMLNGQKLQ +GPATSAEVHRILKQKNLVDKFPLFTAVYQICFEGRPINEMISCLQSHPEHM +>XP_008322769.1 +MERVVTAILHLDPGLLLLLVFLACSHTPQMVKATVPAAPVNISVTQLRAHSAMVTWNVPL +GDTVIGYAISQQRQDGLMQRSIREVNSSSRWCVLWDLDENTHYSVQVQSVGPQGDSQPSH +AIHFRTLERSDHYPAGVLDHHEPAMEGLGMTPHLQTGELLIITTVLLLWAAVIALFCRQY +DIIKDNDSNGTREKAKRPLVHATSSYYNPSPGHSPIYHNGAVRSSRLHRASSSISIIRV +>XP_008322771.1 +MFSTKTVKTEPSHHQHVSSAEQILMVECCCGPGHNCELHTADTGRIPCSADCQEMCNSKK +QGLDNLAYVYGSQSELQPPAKCISRVTFRILGLSTEPQAREVETRISILKGVLGVSLSMP +RKLAKVDYDTSVITSKEIVLELQNTGHSVEAAVQIRVDGMHCQSCVRSIEDRISGLPGVT +RIQVSLQNREAVIVFQPLIVEQQELRVAIENMGFDAILRDDLSLEDINGWQLDILTPSSQ +TVNIWIVGMTCNSCVQSIEGRISQMAGVLSICVSLMEEKGTISFDPRQMDPEKLRVAIED +MGFDASLQEPVQSSVKSNPVTSAPSHLPEMRSTDNSVPSNNNRSQSIPGISQCGSTDVKA +QKCFICVTGMTCASCVSNIERNLLKHRGVISVLVSLMAGKAEVKYDPSTIDSAAVTQLIE +DLGFGAKLIEDNALTHGKLDLSITGMTCASCVHNIESKLTTTKGILTASVALATKKAQIQ +FDPDVLGARDIIKIIQDLGFEASLVKTGFKNNLDHSEEIKQWKNSFFFSLVFGLPVMGLM +IYMMVMDSQHQEHGGSMPEDQNILPGLSLLNLAFFLLCTPVQVLGGRYFYIQAYRSLKHH +TANMDVLIVLATSIAYLYSCVVLIVAMAEQAHQSPVTFFDTPPMLFVFIALGRWLEHVAK +SKTSEALAKLMSLQATDATVVTLGSNLSIIKEEQVVVDLVQRGDIVKVVPGGKFPVDGKV +IEGSSTADESLITGEPMPVSKKVGSLVIAGSINGHGALLVEATHVGDDTTLSQIVRLVEE +AQTSKAPIQQFADRLSGYFVPFIVIVSVLTLVAWIAVGFVNFDIIKENFPGYNSNISKAE +VIVRFAFQASITVLSIACPCSLGLATPTAVMVGTGVGAQNGILIKGGEPLEMAHKIGVVM +FDKTGTITNGIPQVTRVLVLWEMARMPLRNILAVVGTAEASSEHPLGRAVSKYCKKELGC +DLLGHCQEFQAVPGCGISCRVFNVEHLLQKGPQQISEEHFLLPGATTDESSLLSDENPYT +HMPSQSPSYLVIIGNREWMRRNGHHIGADIDAAMSSHEMKGQTAILVAVDGMLCAMIAIA +DTVKAEAALAVHTLSSRGIDVVMITGDNRRTAKAIAAQVGIRKVFAEVLPSHKVAKVQEL +QEKGLRVAMVGDGVNDSPALARSDVGIAIGTGTDVAVEAADIVLIRNNLLDVVTSIELSK +KTVQRIRINFVFALIYNLLGIPIAAGVFMPAGLVLQPWMGSAAMAASSVSVVLSSLLLRT +YKKTSVDLYETRARGQMKSLGSSQISTHLGLEGRWRSPAPPGTAEEHFDQSTMAPSALSR +DEVSVNSFKGQQDRYSLLDHQTTEDINV +>XP_008322772.1 +MRENKNMSESPSQAGKEIPSKKQKLSSDENSNPDISGDENDDAVSVESGTNTERPDTPTN +TANAPGRKSWGKGKWKSKKCRFSFKCVNSLKEDHGQPLFGVQFNWHSKEGDPLVFATVGS +NRVTLYECHSQGEIRLLQSYVDADAEENFYTCAWTYDTNTSHPLLAVAGSRGIIRVINHI +SMQCIKHYVGHGNAINELKFHPRDPNLLLSVSKDHALRLWNIQTDTLVAIFGGVEGHRDE +VLSADFDLLGEKIMSCGMDHSLKLWRINSERMQKAIRGSYEYNPSKTNRPFVSEKIHFPD +FSTRDIHRNYVDCVRWLGDLILSKSCENAIVCWKPGKMEDDIDHIKPNESNVTILGRFDY +SQCDIWYMRFSMDFWQKMLALGNQVGKLYVWDLEVEDPHKAKCTTLTLPKCVSAIRQTSF +SRDSSILIAVCDDASIWRWDRQR diff -r 000000000000 -r 7297f56d2d03 test-data/spaln_out.gff3 --- /dev/null Thu Jan 01 00:00:00 1970 +0000 +++ b/test-data/spaln_out.gff3 Tue Oct 13 12:30:39 2020 +0000 @@ -0,0 +1,63 @@ +##gff-version 3 +##sequence-region NW_017366533.1 906 39583 +NW_017366533.1 ALN gene 1001 3313 1509 + . ID=gene00001;Name=NW_017366533.1_1 +NW_017366533.1 ALN mRNA 1001 3313 1509 + . ID=mRNA1_00001;Parent=gene00001;Name=NW_017366533.1_1 +NW_017366533.1 ALN cds 1001 1293 92 + 0 ID=cds1_00001;Parent=mRNA1_00001;Name=NW_017366533.1_1;Target=XP_008319618.1 99 152 + +NW_017366533.1 ALN cds 1403 1551 206 + 2 ID=cds1_00002;Parent=mRNA1_00001;Name=NW_017366533.1_1;Target=XP_008319618.1 153 202 + +NW_017366533.1 ALN cds 1659 1802 189 + 0 ID=cds1_00003;Parent=mRNA1_00001;Name=NW_017366533.1_1;Target=XP_008319618.1 203 250 + +NW_017366533.1 ALN cds 2061 2214 200 + 0 ID=cds1_00004;Parent=mRNA1_00001;Name=NW_017366533.1_1;Target=XP_008319618.1 251 301 + +NW_017366533.1 ALN cds 2487 2701 312 + 2 ID=cds1_00005;Parent=mRNA1_00001;Name=NW_017366533.1_1;Target=XP_008319618.1 302 374 + +NW_017366533.1 ALN cds 2783 3313 610 + 0 ID=cds1_00006;Parent=mRNA1_00001;Name=NW_017366533.1_1;Target=XP_008319618.1 375 549 + +NW_017366533.1 ALN gene 5314 8701 1447 - . ID=gene00002;Name=NW_017366533.1_2 +NW_017366533.1 ALN mRNA 5314 8701 1447 - . ID=mRNA2_00001;Parent=gene00002;Name=NW_017366533.1_2 +NW_017366533.1 ALN cds 8528 8701 267 - 0 ID=cds2_00001;Parent=mRNA2_00001;Name=NW_017366533.1_2;Target=XP_008322079.1 17 74 + +NW_017366533.1 ALN cds 7566 7706 184 - 0 ID=cds2_00002;Parent=mRNA2_00001;Name=NW_017366533.1_2;Target=XP_008322079.1 75 121 + +NW_017366533.1 ALN cds 7219 7357 242 - 0 ID=cds2_00003;Parent=mRNA2_00001;Name=NW_017366533.1_2;Target=XP_008322079.1 122 167 + +NW_017366533.1 ALN cds 6929 7041 177 - 2 ID=cds2_00004;Parent=mRNA2_00001;Name=NW_017366533.1_2;Target=XP_008322079.1 168 205 + +NW_017366533.1 ALN cds 6595 6828 385 - 0 ID=cds2_00005;Parent=mRNA2_00001;Name=NW_017366533.1_2;Target=XP_008322079.1 206 284 + +NW_017366533.1 ALN cds 6288 6394 177 - 0 ID=cds2_00006;Parent=mRNA2_00001;Name=NW_017366533.1_2;Target=XP_008322079.1 285 320 + +NW_017366533.1 ALN cds 5314 5407 172 - 1 ID=cds2_00007;Parent=mRNA2_00001;Name=NW_017366533.1_2;Target=XP_008322079.1 321 351 + +NW_017366533.1 ALN gene 10702 20056 1065 + . ID=gene00003;Name=NW_017366533.1_3 +NW_017366533.1 ALN mRNA 10702 20056 1065 + . ID=mRNA3_00001;Parent=gene00003;Name=NW_017366533.1_3 +NW_017366533.1 ALN cds 10702 10827 208 + 0 ID=cds3_00001;Parent=mRNA3_00001;Name=NW_017366533.1_3;Target=XP_008322769.1 31 72 + +NW_017366533.1 ALN cds 15802 15903 235 + 0 ID=cds3_00002;Parent=mRNA3_00001;Name=NW_017366533.1_3;Target=XP_008322769.1 73 106 + +NW_017366533.1 ALN cds 17604 17706 205 + 0 ID=cds3_00003;Parent=mRNA3_00001;Name=NW_017366533.1_3;Target=XP_008322769.1 107 140 + +NW_017366533.1 ALN cds 17792 17881 192 + 2 ID=cds3_00004;Parent=mRNA3_00001;Name=NW_017366533.1_3;Target=XP_008322769.1 141 170 + +NW_017366533.1 ALN cds 18376 18542 310 + 2 ID=cds3_00005;Parent=mRNA3_00001;Name=NW_017366533.1_3;Target=XP_008322769.1 171 226 + +NW_017366533.1 ALN cds 20021 20056 71 + 0 ID=cds3_00006;Parent=mRNA3_00001;Name=NW_017366533.1_3;Target=XP_008322769.1 227 238 + +NW_017366533.1 ALN gene 22057 32752 5551 + . ID=gene00004;Name=NW_017366533.1_4 +NW_017366533.1 ALN mRNA 22057 32752 5551 + . ID=mRNA4_00001;Parent=gene00004;Name=NW_017366533.1_4 +NW_017366533.1 ALN cds 22057 22827 845 + 0 ID=cds4_00001;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 60 308 + +NW_017366533.1 ALN cds 23837 24082 263 + 2 ID=cds4_00002;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 309 387 + +NW_017366533.1 ALN cds 24229 24392 270 + 2 ID=cds4_00003;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 388 442 + +NW_017366533.1 ALN cds 24476 24637 279 + 0 ID=cds4_00004;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 443 496 + +NW_017366533.1 ALN cds 24718 24791 127 + 0 ID=cds4_00005;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 497 521 + +NW_017366533.1 ALN cds 25910 26093 358 + 1 ID=cds4_00006;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 522 582 + +NW_017366533.1 ALN cds 26306 26539 433 + 0 ID=cds4_00007;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 583 660 + +NW_017366533.1 ALN cds 27205 27296 152 + 0 ID=cds4_00008;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 661 691 + +NW_017366533.1 ALN cds 27383 27510 235 + 1 ID=cds4_00009;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 692 733 + +NW_017366533.1 ALN cds 27607 27761 271 + 2 ID=cds4_00010;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 734 785 + +NW_017366533.1 ALN cds 28374 28508 266 + 0 ID=cds4_00011;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 786 830 + +NW_017366533.1 ALN cds 28614 28808 351 + 0 ID=cds4_00012;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 831 895 + +NW_017366533.1 ALN cds 29603 29785 322 + 0 ID=cds4_00013;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 896 956 + +NW_017366533.1 ALN cds 29869 30052 278 + 0 ID=cds4_00014;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 957 1020 + +NW_017366533.1 ALN cds 30791 30931 224 + 2 ID=cds4_00015;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 1021 1070 + +NW_017366533.1 ALN cds 31017 31159 249 + 2 ID=cds4_00016;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 1071 1118 + +NW_017366533.1 ALN cds 31243 31446 346 + 0 ID=cds4_00017;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 1119 1186 + +NW_017366533.1 ALN cds 31534 31651 207 + 0 ID=cds4_00018;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 1187 1225 + +NW_017366533.1 ALN cds 32253 32355 196 + 2 ID=cds4_00019;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 1226 1260 + +NW_017366533.1 ALN cds 32488 32752 323 + 1 ID=cds4_00020;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 1261 1348 + +NW_017366533.1 ALN gene 34753 39583 2503 + . ID=gene00005;Name=NW_017366533.1_5 +NW_017366533.1 ALN mRNA 34753 39583 2503 + . ID=mRNA5_00001;Parent=gene00005;Name=NW_017366533.1_5 +NW_017366533.1 ALN cds 34753 34872 272 + 0 ID=cds5_00001;Parent=mRNA5_00001;Name=NW_017366533.1_5;Target=XP_008322772.1 1 40 + +NW_017366533.1 ALN cds 35722 35874 296 + 0 ID=cds5_00002;Parent=mRNA5_00001;Name=NW_017366533.1_5;Target=XP_008322772.1 41 91 + +NW_017366533.1 ALN cds 35986 36078 203 + 0 ID=cds5_00003;Parent=mRNA5_00001;Name=NW_017366533.1_5;Target=XP_008322772.1 92 122 + +NW_017366533.1 ALN cds 36220 36285 147 + 0 ID=cds5_00004;Parent=mRNA5_00001;Name=NW_017366533.1_5;Target=XP_008322772.1 123 144 + +NW_017366533.1 ALN cds 36706 36831 249 + 0 ID=cds5_00005;Parent=mRNA5_00001;Name=NW_017366533.1_5;Target=XP_008322772.1 145 186 + +NW_017366533.1 ALN cds 37166 37247 172 + 0 ID=cds5_00006;Parent=mRNA5_00001;Name=NW_017366533.1_5;Target=XP_008322772.1 187 213 + +NW_017366533.1 ALN cds 37677 37768 188 + 2 ID=cds5_00007;Parent=mRNA5_00001;Name=NW_017366533.1_5;Target=XP_008322772.1 214 244 + +NW_017366533.1 ALN cds 37884 38017 272 + 0 ID=cds5_00008;Parent=mRNA5_00001;Name=NW_017366533.1_5;Target=XP_008322772.1 245 289 + +NW_017366533.1 ALN cds 38109 38214 215 + 1 ID=cds5_00009;Parent=mRNA5_00001;Name=NW_017366533.1_5;Target=XP_008322772.1 290 324 + +NW_017366533.1 ALN cds 38546 38704 359 + 0 ID=cds5_00010;Parent=mRNA5_00001;Name=NW_017366533.1_5;Target=XP_008322772.1 325 377 + +NW_017366533.1 ALN cds 38803 38876 166 + 0 ID=cds5_00011;Parent=mRNA5_00001;Name=NW_017366533.1_5;Target=XP_008322772.1 378 402 + +NW_017366533.1 ALN cds 39463 39583 241 + 1 ID=cds5_00012;Parent=mRNA5_00001;Name=NW_017366533.1_5;Target=XP_008322772.1 403 442 + diff -r 000000000000 -r 7297f56d2d03 test-data/spaln_out_no_st.gff3 --- /dev/null Thu Jan 01 00:00:00 1970 +0000 +++ b/test-data/spaln_out_no_st.gff3 Tue Oct 13 12:30:39 2020 +0000 @@ -0,0 +1,65 @@ +##gff-version 3 +##sequence-region NW_017366533.1 906 39583 +NW_017366533.1 ALN gene 1001 3313 1569 + . ID=gene00001;Name=NW_017366533.1_1 +NW_017366533.1 ALN mRNA 1001 3313 1569 + . ID=mRNA1_00001;Parent=gene00001;Name=NW_017366533.1_1 +NW_017366533.1 ALN cds 1001 1293 93 + 0 ID=cds1_00001;Parent=mRNA1_00001;Name=NW_017366533.1_1;Target=XP_008319618.1 99 152 + +NW_017366533.1 ALN cds 1403 1551 203 + 2 ID=cds1_00002;Parent=mRNA1_00001;Name=NW_017366533.1_1;Target=XP_008319618.1 153 202 + +NW_017366533.1 ALN cds 1659 1802 187 + 0 ID=cds1_00003;Parent=mRNA1_00001;Name=NW_017366533.1_1;Target=XP_008319618.1 203 250 + +NW_017366533.1 ALN cds 2061 2214 199 + 0 ID=cds1_00004;Parent=mRNA1_00001;Name=NW_017366533.1_1;Target=XP_008319618.1 251 301 + +NW_017366533.1 ALN cds 2487 2701 307 + 2 ID=cds1_00005;Parent=mRNA1_00001;Name=NW_017366533.1_1;Target=XP_008319618.1 302 374 + +NW_017366533.1 ALN cds 2783 3313 609 + 0 ID=cds1_00006;Parent=mRNA1_00001;Name=NW_017366533.1_1;Target=XP_008319618.1 375 549 + +NW_017366533.1 ALN gene 5314 8701 1518 - . ID=gene00002;Name=NW_017366533.1_2 +NW_017366533.1 ALN mRNA 5314 8701 1518 - . ID=mRNA2_00001;Parent=gene00002;Name=NW_017366533.1_2 +NW_017366533.1 ALN cds 8528 8701 268 - 0 ID=cds2_00001;Parent=mRNA2_00001;Name=NW_017366533.1_2;Target=XP_008322079.1 17 74 + +NW_017366533.1 ALN cds 7566 7706 181 - 0 ID=cds2_00002;Parent=mRNA2_00001;Name=NW_017366533.1_2;Target=XP_008322079.1 75 121 + +NW_017366533.1 ALN cds 7219 7357 238 - 0 ID=cds2_00003;Parent=mRNA2_00001;Name=NW_017366533.1_2;Target=XP_008322079.1 122 167 + +NW_017366533.1 ALN cds 6929 7041 176 - 2 ID=cds2_00004;Parent=mRNA2_00001;Name=NW_017366533.1_2;Target=XP_008322079.1 168 205 + +NW_017366533.1 ALN cds 6595 6828 386 - 0 ID=cds2_00005;Parent=mRNA2_00001;Name=NW_017366533.1_2;Target=XP_008322079.1 206 284 + +NW_017366533.1 ALN cds 6288 6394 171 - 0 ID=cds2_00006;Parent=mRNA2_00001;Name=NW_017366533.1_2;Target=XP_008322079.1 285 320 + +NW_017366533.1 ALN cds 5314 5407 170 - 1 ID=cds2_00007;Parent=mRNA2_00001;Name=NW_017366533.1_2;Target=XP_008322079.1 321 351 + +NW_017366533.1 ALN gene 10702 20056 1109 + . ID=gene00003;Name=NW_017366533.1_3 +NW_017366533.1 ALN mRNA 10702 20056 1109 + . ID=mRNA3_00001;Parent=gene00003;Name=NW_017366533.1_3 +NW_017366533.1 ALN cds 10702 10827 207 + 0 ID=cds3_00001;Parent=mRNA3_00001;Name=NW_017366533.1_3;Target=XP_008322769.1 31 72 + +NW_017366533.1 ALN cds 15802 15903 228 + 0 ID=cds3_00002;Parent=mRNA3_00001;Name=NW_017366533.1_3;Target=XP_008322769.1 73 106 + +NW_017366533.1 ALN cds 17604 17706 204 + 0 ID=cds3_00003;Parent=mRNA3_00001;Name=NW_017366533.1_3;Target=XP_008322769.1 107 140 + +NW_017366533.1 ALN cds 17792 17881 187 + 2 ID=cds3_00004;Parent=mRNA3_00001;Name=NW_017366533.1_3;Target=XP_008322769.1 141 170 + +NW_017366533.1 ALN cds 18376 18542 305 + 2 ID=cds3_00005;Parent=mRNA3_00001;Name=NW_017366533.1_3;Target=XP_008322769.1 171 226 + +NW_017366533.1 ALN cds 20021 20056 70 + 0 ID=cds3_00006;Parent=mRNA3_00001;Name=NW_017366533.1_3;Target=XP_008322769.1 227 238 + +NW_017366533.1 ALN gene 22057 32752 5799 + . ID=gene00004;Name=NW_017366533.1_4 +NW_017366533.1 ALN mRNA 22057 32752 5799 + . ID=mRNA4_00001;Parent=gene00004;Name=NW_017366533.1_4 +NW_017366533.1 ALN cds 22057 22827 844 + 0 ID=cds4_00001;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 60 308 + +NW_017366533.1 ALN cds 23837 24082 261 + 2 ID=cds4_00002;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 309 387 + +NW_017366533.1 ALN cds 24229 24392 271 + 2 ID=cds4_00003;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 388 442 + +NW_017366533.1 ALN cds 24476 24637 281 + 0 ID=cds4_00004;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 443 496 + +NW_017366533.1 ALN cds 24718 24791 125 + 0 ID=cds4_00005;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 497 521 + +NW_017366533.1 ALN cds 25910 26093 355 + 1 ID=cds4_00006;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 522 582 + +NW_017366533.1 ALN cds 26306 26539 430 + 0 ID=cds4_00007;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 583 660 + +NW_017366533.1 ALN cds 27205 27296 147 + 0 ID=cds4_00008;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 661 691 + +NW_017366533.1 ALN cds 27383 27510 233 + 1 ID=cds4_00009;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 692 733 + +NW_017366533.1 ALN cds 27607 27761 266 + 2 ID=cds4_00010;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 734 785 + +NW_017366533.1 ALN cds 28374 28508 264 + 0 ID=cds4_00011;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 786 830 + +NW_017366533.1 ALN cds 28614 28808 349 + 0 ID=cds4_00012;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 831 895 + +NW_017366533.1 ALN cds 29603 29785 319 + 0 ID=cds4_00013;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 896 956 + +NW_017366533.1 ALN cds 29869 30052 272 + 0 ID=cds4_00014;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 957 1020 + +NW_017366533.1 ALN cds 30433 30452 10 + 2 ID=cds4_00015;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 1021 1028 + +NW_017366533.1 ALN cds 30555 30561 32 + 0 ID=cds4_00016;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 1029 1030 + +NW_017366533.1 ALN cds 30812 30931 228 + 2 ID=cds4_00017;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 1031 1070 + +NW_017366533.1 ALN cds 31017 31159 246 + 2 ID=cds4_00018;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 1071 1118 + +NW_017366533.1 ALN cds 31243 31446 347 + 0 ID=cds4_00019;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 1119 1186 + +NW_017366533.1 ALN cds 31534 31651 209 + 0 ID=cds4_00020;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 1187 1225 + +NW_017366533.1 ALN cds 32253 32355 193 + 2 ID=cds4_00021;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 1226 1260 + +NW_017366533.1 ALN cds 32488 32752 322 + 1 ID=cds4_00022;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 1261 1348 + +NW_017366533.1 ALN gene 34753 39583 2632 + . ID=gene00005;Name=NW_017366533.1_5 +NW_017366533.1 ALN mRNA 34753 39583 2632 + . ID=mRNA5_00001;Parent=gene00005;Name=NW_017366533.1_5 +NW_017366533.1 ALN cds 34753 34872 273 + 0 ID=cds5_00001;Parent=mRNA5_00001;Name=NW_017366533.1_5;Target=XP_008322772.1 1 40 + +NW_017366533.1 ALN cds 35722 35874 297 + 0 ID=cds5_00002;Parent=mRNA5_00001;Name=NW_017366533.1_5;Target=XP_008322772.1 41 91 + +NW_017366533.1 ALN cds 35986 36078 203 + 0 ID=cds5_00003;Parent=mRNA5_00001;Name=NW_017366533.1_5;Target=XP_008322772.1 92 122 + +NW_017366533.1 ALN cds 36220 36285 145 + 0 ID=cds5_00004;Parent=mRNA5_00001;Name=NW_017366533.1_5;Target=XP_008322772.1 123 144 + +NW_017366533.1 ALN cds 36706 36831 248 + 0 ID=cds5_00005;Parent=mRNA5_00001;Name=NW_017366533.1_5;Target=XP_008322772.1 145 186 + +NW_017366533.1 ALN cds 37166 37247 169 + 0 ID=cds5_00006;Parent=mRNA5_00001;Name=NW_017366533.1_5;Target=XP_008322772.1 187 213 + +NW_017366533.1 ALN cds 37677 37768 187 + 2 ID=cds5_00007;Parent=mRNA5_00001;Name=NW_017366533.1_5;Target=XP_008322772.1 214 244 + +NW_017366533.1 ALN cds 37884 38017 271 + 0 ID=cds5_00008;Parent=mRNA5_00001;Name=NW_017366533.1_5;Target=XP_008322772.1 245 289 + +NW_017366533.1 ALN cds 38109 38214 210 + 1 ID=cds5_00009;Parent=mRNA5_00001;Name=NW_017366533.1_5;Target=XP_008322772.1 290 324 + +NW_017366533.1 ALN cds 38546 38704 354 + 0 ID=cds5_00010;Parent=mRNA5_00001;Name=NW_017366533.1_5;Target=XP_008322772.1 325 377 + +NW_017366533.1 ALN cds 38803 38876 164 + 0 ID=cds5_00011;Parent=mRNA5_00001;Name=NW_017366533.1_5;Target=XP_008322772.1 378 402 + +NW_017366533.1 ALN cds 39463 39583 235 + 1 ID=cds5_00012;Parent=mRNA5_00001;Name=NW_017366533.1_5;Target=XP_008322772.1 403 442 +