changeset 0:7297f56d2d03 draft

lukasa 0.0.6
author sanbi-uwc
date Tue, 13 Oct 2020 12:30:39 +0000
parents
children 20c176cd4c3b
files lukasa.xml test-data/contig.fasta test-data/proteins.fasta test-data/spaln_out.gff3 test-data/spaln_out_no_st.gff3
diffstat 5 files changed, 915 insertions(+), 0 deletions(-) [+]
line wrap: on
line diff
--- /dev/null	Thu Jan 01 00:00:00 1970 +0000
+++ b/lukasa.xml	Tue Oct 13 12:30:39 2020 +0000
@@ -0,0 +1,53 @@
+<tool id="lukasa" name="Lukasa" version="@TOOL_VERSION@+galaxy0" python_template_version="3.5">
+    <description>Align protein evidence against genomic contigs using metaeuk and spaln</description>
+    <macros>
+        <token name="@TOOL_VERSION@">0.0.6</token>
+        <!-- note that this DOI is for lukasa 0.0.6 - update as needed -->
+        <token name="@DOI@">10.5281/zenodo.4084863</token> 
+    </macros>
+    <requirements>
+        <requirement type="package" version="@TOOL_VERSION@">lukasa</requirement>
+    </requirements>
+    <command detect_errors="exit_code"><![CDATA[
+        lukasa.py
+        #if str($species_table).strip() != ''
+            --species_table '$species_table'
+        #end if
+            --output_filename '$output_gff' '$contigs_fasta' '$proteins_fasta'
+    ]]></command>
+    <inputs>
+        <param name='contigs_fasta' type='data' format='fasta' label='Genomic contigs (FASTA)' />
+        <param name='proteins_fasta' type='data' format='fasta' label='Proteins (FASTA)' />
+        <param name='species_table' type='text' label='Spaln species table to use (optional)' />
+    </inputs>
+    <outputs>
+        <data name="output_gff" format='gff3' label='Map proteins to genome ${on_string}' />
+    </outputs>
+    <tests>
+        <test>
+            <param name="contigs_fasta" ftype="fasta" value="contig.fasta" />
+            <param name="proteins_fasta" ftype="fasta" value="proteins.fasta" />
+            <param name="species_table" value="cynosemi" />
+            <output name="output_gff" value="spaln_out.gff3" />
+        </test>
+        <test>
+            <param name="contigs_fasta" ftype="fasta" value="contig.fasta" />
+            <param name="proteins_fasta" ftype="fasta" value="proteins.fasta" />
+            <output name="output_gff" value="spaln_out_no_st.gff3" />
+        </test>
+    </tests>
+    <help><![CDATA[
+    Lukasa combines MetaEUK and spaln to rapidly identify matches between proteins and genomic contigs and
+    accurately align the proteins to the identified regions. The output is GFF3 format, suitable for use in 
+    eukaryotic genome annotation.
+
+    The 'species table' parameter is the name of a species parameter table for spaln. A suitable species
+    table can be found either by examining the spaln gnm2tab_ file or using the list_spaln_tables tool (installed 
+    along with the Galaxy spaln tool). While this parameter is optional it is recommended.
+
+    .. _gnm2tab: https://github.com/ogotoh/spaln/blob/master/table/gnm2tab
+    ]]></help>
+    <citations>
+        <citation type="doi">@DOI@</citation>
+    </citations>
+</tool>
\ No newline at end of file
--- /dev/null	Thu Jan 01 00:00:00 1970 +0000
+++ b/test-data/contig.fasta	Tue Oct 13 12:30:39 2020 +0000
@@ -0,0 +1,678 @@
+>NW_017366533.1
+CTCAGTCTACCCTGATTTGATTAAAAGACAAGGTAACAAATCCAAACAGAAATATGTCAA
+GGACAGTTTTGTATGCAAGATATGCCACTAAGTAATGGATGACATGGAAAATATGTGCAA
+TATCACAGACGAAAAGGTGAATTTCCCAGATAATTAGTACCTGTAGCTCTTCTGTGAATA
+TTCTCATTCATCCAGGTCATAGTTATCCAAAGAAAGGTTTAATCGAAAGCAACTGGACTT
+AGTTATAGTCTGGAAAGACTATAACCAGACTATAACTAAGTCCAGTTGCTTTCGATTAAA
+CCTTTCTTTGGATACCTGTAGCTCCTGACCTCACTCTTGGATTTAAGTTTGGTTTGAGTT
+CCAGTCTTTATATTTTACAGAATTTCATTTATTAATATTGGCTGTTGACTGTAAGCAAGG
+GGTTAAGTGATAGACAGGAACCGTGGCCTTGGTTGCAGCTGCTTGTTACATTTTAAATGT
+TTCATATCAGAGACTGTTGCTCTGTTTTACTGGGCGTTCAACTCTACATGTATCTTTTCA
+TTTTCCGCTTCTAGCTCAGTATGTCTTGATAGCTTGCATGTGGTTACCTGAGATTATAAT
+CACCAGAAAATAGTCCACAATGGCTCTCCATATACCAGGTCTGATCATGATGGTCGTCTT
+CTACTTGTTGGTGTTGGGAATCGGCATCTGGGCGTCTGTAAAATCCAAGAAGATGGAGAA
+AAACACACTCAGTGGACAGATAGAAGTTTCTCTTCTGGCTAACCGGAGGGTCAGCTTGGC
+AGTGGGAGTCTTCACAATGACGGGTGAGTTTTGGTCAGGTAGATACGTTAAGGGTAATTT
+AATTTACACAGCCTTCTTGAATGATGATACATTGATGTGTATTCTGTATGTTTACTTCCT
+GCTGCAGCCACATGGGTTGGTGGTGCGTTTATCATTGGAGTTGCAGAGTCAGTTTATGAC
+CCCACAAAAGGATTAATCTGGGCTCTTATTCCCCTACAAATGTCACTTTCATTTATTATT
+GGTAAGATCCTCTTACAAAAAAAGCATAGAAGCTATGAGATACAGTTTGTAACAAAAGTA
+AAACACAAGAAAATAAAACACAGAGAAATAAAATCTAACTTGATTCTCTCTTAAAGGTGG
+ACTGTTCTTTGCAAAACCAATGCGAGACAAAAACTACGTCACTATGATGGATCCGTTCCA
+GAGGAAGTATGGAAAAATACTGACTGGTTTTCTTGCCATTGTTCCATTTATAAGTGAAGT
+GATGTGGGTTCCTGTCACACTGATTTCCTTGGGTAATTTTTCACATTATTCTCCAGAGGT
+GTTAGAATAAATGTTAGTGATTAGGAGCTTTATTTACATGGCAACTTATGTGTTTCTGTA
+TATTGTGTACTCTTCCAACAGGAGTTACCGTTAGCATCTTTTCCGATTTGCCCTTAAGTC
+TTTGCATCTGGATCTCTGCTGTGGTGGCCATCTTCTACACTGTCCTCGGTGGTCTCTACT
+CAGTCGCTTTCACTGACGTCATCCAGTTGTCACTGGTGTTTTGTAGCTTGGTGAGTTTAA
+TATAAAAAAACACAAGACACGTCTCTGAACAGATAAACATCACCATGTATTTATTTCTGG
+ATAAAATGTCAATGAATAATTTTCCCTGTGTTTATAGTGGCTGTGTGCCCCTTTTGTTCT
+GGCAAGTGATGTTTACACTGACCTCAGTAAAACAGCATTCAACCACACGTATCAGGCCCC
+CTGGCTCGGTCGCCTTGAGTCGCATGAAGTGTGGAGATGGATTGATAATTTCCTGGCAAT
+GGTAAGATGAAACACATGGAAGATTTAAAATGCCTGAATAAACAATACACATATATGCAT
+TTTTCTTTAAATGAAAAACATGTTAAATGAGTTTAATGAGCTTTTTCTTTGTGGAGATGC
+CAAAATGAAAAACAATTTTGATTGTAATGTGGCAAAACAATCATTAATGAAAACAAAAAA
+CTTAATAATTATCATTTTAATATGTTTTTCATTTCATTATGACACAACAAATGTGAACTT
+TGCCTTTTTTGTTTTCCAGAGTGTTGGAAATTTGGCATTTCAGGATTTCCATCAAAGGAC
+GCTCTCCTCCAGCTCCACATCTACAGCCAGAATGATCTGTTTCATAGCAGCAGGTGTGGT
+GATTGTTCTTGGGATTCCACCTGTGCTGATTGGTGCCACTGCAGCCTCAACAGGTACGCA
+CTGATTAAGAGGGCAGAGCTTAAAGAACAGAAGAAAAGATAGAAGAAACTGATTTTTTCA
+TTAACTACATGAGCTAAGTTCACCTTCCATTCATTCTGGTTCTACTCTCTCTGTCAACTA
+CTCTCTCAGTGCTGAATTTCAAAATGTCAGCACTTTTAATTAGGTAAAACTGAGACTGAA
+ATTGAACTAAATTAAACCAAGCTGCAGTAAACTACTAAGCCACCTCAGACTGAGCAGCAT
+CCAGCAGCTTCCTGTTGTGTTTCAGACTGGAATTTGACCTCATATGGGTCTCCATCTCCG
+TATGAGCGAGGAGAGGCGGCTATGGTGTTGCCCATCATGCTCCTGCATCTCACCCCGACT
+GCCATTTTCGTCGTCGGCATGGGAGCCATCGCCGGTGCTGCCATGTCGTCCACTGACTCT
+TGCCTGCTGGCAGCGACCTCCATCTTCACAACCAATATCTACAAGCTCATTAGACACCAG
+GTACGAAAAGAAGGTGGTTTAAAAAACAGCTGAGGGTCATTGTGACATTTTAACTGAAAT
+ACAGTTTGTTCTTTTCTCTAGGCATCAGATAAAGAGCTGCAGTGGGTGATACGTCTCTCC
+ATCGTGGTCGTAGGGCTTGTAGGAACATCCCTCACCTACCTGGACAGCAGCATCTTGGCG
+TTCTGGATCCTGAGCTCAGACCTGACTTACACCATAATGCTCCCCCAGCTGATCTGCATC
+CTCTTCATCAGGGTTTCCAATGGTTACGGGGCAATTGCAGGCTATATTGTTGCTTTTGTG
+ATGAGAGTGTTGTGTGGAGAGCCAGTGTTCAGCCTTCCCGTCATCCTCCATTTCCCAGGA
+TGCACTTTGGAGGATGGTGTCTACATCCAGCGCTCACCTTTCAAGAGCATTTGCATGCTC
+TCCGCCCTGGTCTCCATCCTGTTGTTTTCATATGTGGCTTCACTCCTGTTCAACAAGGAG
+ATCCTTCCTGAGAGGTGGGACGTGTTCAATGTGAAATCACAGGCAGCACCATCACCAGCA
+GGTGGCACCAGAGAGGATGAAGGTGAAGAGGCTGATGTTAAACGTGAAAATGAACCAATG
+CTTGATACAGACTGCTAATTCAGTTTCTATTGACTTTATTTTTCTTTTTGTGACATAAAC
+ACATTTATGATAAAGATCAAAATCTCATGGAAACAGAATGAGTTGATGGAATCCTTACAG
+TTAAATATCTTTACGTGCATTTCTATCTGTTCAATGCTTCTGTTTTTCCAAATGTGATCA
+TCAAAGCAGCACATGACATATAGATAATCATTCTAATACTGATGTGTTTGATGTGTGAAT
+TGTTTTTATTGGATTTTGTTATTATGTAAAATAAAGCATAAAATTATAACAGATGTTATC
+ACTTTTTTCAGAAACTGTCTGCAGTCACAAAATGTGCATTAATCACATAATAATCAGTCT
+TTTCTAATAAGATTTATATTTAGTATTACTAGTAATAGTTTACTTTTATTCTTTGAGAGT
+CAAAAAATTTGAAATATTTTTGATAAGGCTAGTATGAACTCTGAGAATTGCATCAAAAAA
+TCATCATAAAAAATGTGAATTTTCTTCAGTTCATAATGACTGCTTTATAATTGAGATGTA
+TGTAAATGGATGATAAAGGAAATTAGTGCCACATACCACAGCATTTATAACCTTCTCATC
+CCTGAGAGGGTCTATTATTTATGAACAAAGATACGATGAAGTGACCAAAAAGCTCAATGA
+CAAGCACTATATCATTCATGGCTACTTGAATGATCCCTCTATAATAGTCCCAGTGTTATA
+AAGAAAGATATACCTGAGAGCTATTTACAGTTGTTTCCATATTAGAAAATGCACATGCAT
+ATCAATCAAACTCATATTGATTAGCATCTTGTATCGAGCATTGGTGCAGAGGTGTCTTTG
+CCACTTTGCAAGTCATCCTCTCTGGCGCCACCTGCTGGTGATGGTGCTGCCTGTGATTTC
+ACCTTGAACACGTCCCACCTCTCAGGAAGGATCTCCTTGTTGAACAGGAGTGAAGCCACA
+TATGAAAAGAACAGGATGGAGACCAGGGCGGAGAGCATGCAGGTGGTCTTAACATGGAGA
+CAGTCCGACAGCAGGAGAGTATCAAAGGTTTCACCAGTCTGACCTGTAACATGGTTGAGA
+TCGAGGGACAAGGACGCTGTTTGTTCATTAATCCACTCTCTCATACTGAGTTACCTCGGC
+CCCTCGTGGGAATCAGTTTCTGCCCGTCACAGACTGACTGTGAGATCTGACACACAACTC
+AATCACACAGCTGCAAACACAGGAGTGAATATCAGCTTGGGGATGAGCTCCCATTTCAGA
+AAACTGATCGTGTACAATATTCTGCAGGTGAAGATTAAAGGATAAAACAGGCTGAAAGCT
+TTCATTTGTGATCACAAGATGCACCATCTTCATCCATCACTAACAAAGCAATGTGATGTG
+CACAGTGCGCCCCCTTGTGACAAAATTGATCAATACAGGATGTTAATTTAGATTATTCAG
+AAATAAAACAAAGAGTTTCCAATATCTTAGGAATTGATTTTATTGAGAAATCAACTCCAC
+ATAAAGATAAAAAAGAAGATCTTTAGTTTTCATTGTGAGATTGTAAACACTATCATGTAG
+TGAAATGAAAGTCAGACAAACAGTATTGTGTTTATGTGCCACCATAAAGAAATCATGACA
+TTTTATGGCAATTACTGCAAGAATGCAAGTGGCGTGGTCTGCCTTAGATAGAGTTTTATA
+CCTGCCACTGATGAAAAATTATTTTTACAGCTTATTTAGTATCATTTCATTGATATCTTT
+AACTTCCCTGCACAAGAGCCAAATGAATATTACAGGACTTGCAAAATAAGAGCTAATTCA
+ATAAAATGAATTGCTTTTGAAGCTAAGAAAATAGAGGCTCCATTATTAAATGTCACCAGG
+CAAAAATAATCTCAAATAAAAAGTGCCATTGGTTGTATTTGCCTTCTTGTGTTGTGCGTT
+TCTGTCTCATGAACCTCTTTCACCCTCTAGTGATGGTAGGTTGTTAGTGAAGGAGCAGCA
+GCAGCGAACGTGTCTGCAGACTGGTCGCGTTACATGTGCTCTGGATGGTTCTGCAGACAG
+GTGATGAACTCTTTCACCTCTTTTCCCTCAAAGCAGATCTGGTAGACTGCTGCAAACAAA
+GGAAACCTGCAGGAGAGAATAGATATGGTTTAATATCAGCCTAAAATATCCAGCACTGAT
+CGGGTACTGAACTAACAAAAGGGTGAAGATGTCATCCAGTCTTCAGAGGGGTCTAATCAG
+GCGGCGTGAGTGAAAAGACAGAGACGACCACAGCTGTGTAAAGTGTAATGCTGCGTTCAT
+GTCACGTTGGAAAGTCAATAAAATTAAAACCACAATCACGGCATCCTCTGTCATGACTAG
+TAGAGACAGACACTTACTTCTGCATGTTATATATTTATATTTCTAATATATTAGTGAAGT
+TACCAGCGTTTCAGTTTTTGCAAAGATATTTGTAATAATTGATTTACATAAACACTTTCT
+ATTTACTACAGACATCCATCTTTTCTATCGTTTTGAACGCAGCATAACTGTTTCATTTTA
+TTAATATAAATGATGCAGATTAATTCATTCCTGTGTGCTGGCAGAAAAAAATATTAAGTA
+AACTTTTTATTGTGGTTGACTGTGTTGATCAGAATATATAAGGACAAAATCAACATCACT
+ATTTAAGCCTCTGAATCCACTTTACTAGGTACACCTGTACAATCTAATCAAGTCCAATAT
+ATCTCTTCTGCCATAAAGTCAGCTTTTATTATGGCTGCAATGTTCAGTTTTTGTTGACAC
+TGTTATAAATGTGTTCATGTCTGTGTTTTAGCTCTGAGGTCATAGTTTGAACAGGGCTGC
+ATTATATTGAAGTGTGCTGAATATTCTGCCCTGCTCATGTGTGCGAATAGAATGGACAAT
+AGGATGTAGTCCAGTAAACACCGCCTTTAATTATAACCTCAGCAATAAACACCTAATTAA
+ATGCTGACGAACAGAAACTTTGTAGAATTCATGGCTGTGGACTCACTTGTTGATCATGTC
+ATTCTTCTGTAGGATCTTGTAGACCTCAGCTGAAGTCTGTGGACCCTGCAGCTTCTGGCC
+GTTGAGCATTTCTGCCTCCAGTTCAGCGATGGACTGAAGAACCAAACACACAGAAACCAT
+GTGGATGTTGTTTAGTGACATATGTGTTAGTCCTTTAGCATGCAGTAAAAGGTAGACAAC
+TAAAGGTTTTAAATTTAAAGGTTTTTAATTTTGAGGTTGTGTCTTGCTTGAACTATTGTG
+TTCCATTTCATTAATTTCCCTAAGCTTTCAGAAAGCATCTGTATTACACTCACCTTGGAC
+GTTCTGACAAAGGCCTCAGCAACTTTGCGGTTTCGGCCTCCGTAGCAGGTGGTGATGAGG
+TCGGCCACGCCACAGCTTTCCAGGAATGTGGAGGAGCTCACTTCACCTTTGCAGAACAGC
+TTGGCGAAGGCGACCATTTCCATCAGACCCAGCCTGATCACCGCTGCTTTGGTGTTGTCG
+CCAAAGCCGAGGCCGTCGCAGAACCCAGCTCCTACTGCCACAATATTCTGGCAGGGCAAA
+AATTAAAGGACACACAATAATTTTGCACCAATTTCTGCTTTAATGCAGACAAACTACTCA
+TAATTCACAATAGGCAACTGTCTTTACCTTTAAGGCTCCACACAGCTCCACTGTATCACT
+CTCTTGTACGACAGTGATGCGAAAGTTGGGAGTCTGAAGCAGCTCTTTGAAGATCTGGCC
+ATTTGCCTCACTTTTTGCCCCTTTATTAAACACAAGCGTAACATCATTCAACACTGGTGC
+AGAAGGGGAAGCAGAAGGGGAACACTGTGTTTTCTTGTCATTGCCTGGCGACCACACTGC
+ACCCTCTGCAGCGTCAGGAAAATTTTGTGCAGCAGAAGCTGAAATAACTTTGACAGTAAC
+AAAAAACAGCGGCTAACCAATGGTGGTTTCGCAGAACTTCTCATCTGCCACCTCGTTCGC
+GATGTTGGCCCCCATCAGGACGCTGACCTCGATCTCTAGTTTCTCCCGGATGATGTCTGA
+GATGAGCTTCAGTCCATCTGGTCCTGCATCAACACCCTGCACGACAATGACAGAGAGAGT
+TTCTGTACTGTACTCAGAGCCATAACCTCTGGCCTGGAGTGGTTGTGGCTTTGAGGGAAG
+ATTTCCTCCACGTTGCTCAACTGCAACGTCTTGTGATGTGTCAAATATGAAGAAAGGTCA
+GGTGACTGTTTCCCCTTTTTTGCTGTCAGGAAATGTGAACTGAAGAACAATGACAGGATC
+TTACTTTGATGAGTGATATCCCAATGGTTCCCTCTGTGATGTGAGGCTTCATCTGATCGC
+AGAGTTTGCCAATGAACTGGTGTGGGATCACAAAGACGAGGATCTTTGCTCCTTTGACGG
+CGTCTGTGATGTCTGGGACAGCGACCTAAGAGAGGCATCAGAACAGAGTGTGTCAACAGA
+GATAGCTGATGCCAAACAAGATCTTTTTAGCCTTTTATCTGGGAAGACACTGATCTTTCT
+GCAGCTTCTGCTGCTGCTTTCTCTTGATTTTACATTTATTATGTATCAAGACAAACCTTT
+TATGATGTGCCATCTTGTTTTTTAGCTAACTTATTGCCTTTTCATTGCTATTCTATAATA
+TTTTATAGCAGATGCAGAGATAAAGGTAATACACATCAATAACAACAACAAGAAACACAA
+TGCACAAAAAAACTGACATTAAAAACAGTTATGAAGAAGCATTTGCCCTCTCTACCCAAT
+ATTCACTGAGTAAAATTCTGCTATTTAACCTGCAGTCTCACTGTTGTGGAGGTGGAGGTG
+TATCAAGGTCTCTGTCTTGCTTTCAGATTCATTACACCCCTGGTATTCACAAATATAAAT
+ATGTATTTTGAAAAAGCAGTTTATCTTTCCAGAGTTAATTTATTTTAACCAGGCTAATAA
+ATGTGGTGGTTCATAGGGGAAAACTGTCTCTTTTGAAGTTATTTGTCTCTTACACCACTT
+GACTTTGTGCCATTAAATGGTTCTTTTCTGTAGCTCTTGATGGCTGTGTAGTTGATGTGA
+GCGTACAGTTAATGAAAGACACAAGGAAACAGATTAAGTAGATGATACATAAGACATATG
+GGTCAACGTTAAGTATTCTTATCAGGGTAGATGTCTTACAATCAAAGCCTGTTTCAAGAT
+TGCAGTGAATTGCATAACCTGAAGGGCGGTGTGATTGACAGATAATGCTGCCTATAATAA
+ACATACCACATTCCTGGGCAGCTTGTGACCTGGCAGATATTTGACATTTTCATGCTCCGT
+ATTGATGATCTCTGTGAGCTTCCTCCCGTCGATCATTTCCTCATACACCCACATGTTCAC
+CATGGGGTCGAAGCGGTTGGATGCTTTGACATTGTGGCCGATGATTTTGGCAATGGAGGA
+GCCCCTGGAGACGAGAGGAAAGGGGCATGTGAGGGGATGGCGTTGAAGTTAAATTTCACC
+AGAAATCCTGAATGTCTCAAGAAATCCCAAAACACCACCAACCCAGAAGCATGGGAAACT
+AAAAATCAAGCATTTATTTTAAATTCAGGCTTTAACATTTGCATAAAGGTAAAAAAAACA
+AAACAAAAAAAAACAGTATACGTTGTAAGTAATAATGCACAGTTATCAATGTGCAGTGGA
+CAATCTACTCCATAAAGACACATTCACACTGTATAGAGCTATAGTGACCTAATGCTGGTA
+TAACTTTACATAAAGTACTCAAGGGTCGTTTTTAGTCAATGGGACTAAAAGGTTCCAGAG
+TAAACAGGCCTCCATTAGTCTTTTATCCGAGTTATTTCATGTTGCAGCTTGCAGCCGGAT
+TCCTCAGGTTGCTCTAAGATAAAGGCTGCGGTCCAAAGAAAGTCGGTTTTGAACGAGAAC
+AGCTGAGTGTTTTCCTAACCCTAACCCATTTGATGCGATTTGATTTTAACTTAAGATAAT
+GCAAGAATTACACGTAGCCGGTCTCCGGTGTTTGTCTCAATCTGCAGACTGTCGAATTCC
+GTGTTGAGTTGAGCGTTAAATGCATAATACTAAGGACATTTATGAACAAAATGTTCCTGT
+TTCTGAAAGATGCATCTGTAATAAGAAGTTACCAGTTTCCAGATCCAACGATGCAGACTT
+TCTTTCCAGGCATTTTGAGGTTGGTTCGGCTGCAGTGAAGACCCTGTTCTTTTGTTTTCC
+CTCCGTCTATAAAAACTTCCTCATACGCCCTGTAAAATGCTGCTGGGTTCACTCCTCCCC
+TCGCTCTCCACGGACAGCCTACACCTCCTGCCTTTAGAAAACTGGAAATCATATTAATCC
+AAAGCATCTTAGACGTCTTAACACATATATCCCCCCTCTTTGTCTGTTTACACACGCATC
+ACAAGCTTTATAATTCACCAATGGGCTTATTTTACAAAGATAATTGATCCTCCTTTGTTA
+GAGTCATACTTTATTGTAAAGTGTATCTATCATTAGTAGAAGTGTTCATATATCTGTGTC
+TAATCACATTAAACACTGACAACTAACATGAACAGAGGAATGTAATAAATAAAATGCAAC
+AATAACAAAGAATGGGAAGATAGTTAAAGTTAAAACAGTCTGTGGGAGAGGCCTCAGGGC
+TGATGTGCATTATTCATGTTAGTTTATTCATCTTTAATGTATTTAATTTGCCTGAGAGAG
+ATTAAGGTTGCAATCTTTTCTAATTTTCCTCAGGAGAAGAAACTGATTTTTGATGCCGTG
+ATGTTAAGATTTGACATTTCTTTTTGGTGAAACTGTGAATAATGAAGTGGAACTAATTAA
+AATTTTGATCCAACTGGTTTTGTATTCAAATACGTTTTACTGGCAGCCTGTTTTCATGGC
+TTTCATGACAGGTCATTTTAATGCTTCAGGAAACTGATATTTTTGCCAGCGTTGTTGCAT
+CCGTTTGGAAAGACCCTTCCCTGTTTCAACAAAACAAAGGCTGCTATTTTGTCTTGGTTT
+TTTTTTTTTTTTTCATTTTTGTGTGGAAGAACTTGGCTCAATCCCAGTGACTCACCAACT
+CACAGAAGCACATTCCTGTTAAGTCCTTGAGAGCTCATGGTTGCCCCACTGTGAAATCAT
+CAAATGCATGATGACTCTCTGGCAGACATTTTGAGCCAGGGAATTACCCACAGATCATAG
+CGTTGTGACGTTAAACAGGGGGAAGCCTGAGCACATTAAAAAAAAGAAAAAAAATGCCAA
+CAAACTTTGACACAAAGAGACAAAATAATGGACAGTGTTGGACCAGATATTTTTGGCCAC
+TTTGTGTATCATGTGTCTTATTTTGAAATCCTTTGCTGCAGCAGGACGAGCGCACTCTGC
+AAACTAGACACGTGTTCTCCAAAGTTTTTTTTCACCGACCGTCCCTAACAACTAATATAC
+AAATGTGTGTGTGTGTGTGTGTTTTAACAGCTGTGCCAGCAGCCCCGGTGAACGTATCAG
+TGACCCAGCTGAGGGCGCACTCGGCCATGGTGACCTGGAACGTCCCTCAGGGAGATACTG
+TCATTGGATACGCCATCTCACAGCAGGTACAGTGCAGCAGCAGCCCTGTTACGTGTGGGT
+GGCAATCGAGCTCAAAGATTGATTTTTCTTAATTGGTTTAATCCTCAAAAAGCTTGGAAA
+AATAATTCCTCAGTCTTCTCATTAAACTCAGTCAATCTGTCTCACGTCAAATTTACCCTG
+ATCTAACCTTTTCTCCCTCTGCGCTCTCATTTGGTTGAAGGCCAATTAATTTTCCAGGGA
+TACAAATTGAAAGGATATAAATTATGAATCAAATGCCCAGAAAACTTGGCTCGCTGCCAC
+GTTCTGCGTCTGAAAGGAGCCTTTTTTCAAAGTTGAATTATGTATTTTTTTTTTTTGTGT
+GATCCATCTTTATCTCTTGAGGAGTGGATTCTTGTCCACAGGGCTTTTTAAAACCGCTGC
+GTCATTCATGAGGCCAGTAGACAAAGTCAGCATTTTGCTCCAAGACGCTTTCACTCACGA
+GGGGTTGAACGTGTCTCTTTAAAAAAGAAGTCTGGAAATATAAACATTTAACTTGAAGAG
+CTTGTGAATGTCGAGGCTGGCTGCTGGTTGATGTAGGTACTTGGAGCAATAATGAAGGAA
+CAAATCTTGTGATTGCAAAATTTTCCAGCCAAAAAAGAAGGCGTGGAACTTTATAAGCAT
+CCGATCAGCGAGAAAAAGTCTGAAAATATTGGTTGAATTTGAAAATAATTCTTAGAAAGC
+GGTGGAAATCATGCAACAGACCAACCCACCAGGCATCCTGCTCCATGTTTTCATTGTAAC
+CATAATTTAGGTTTCACCTGCTTTAACAATTGGCCAAGATCCTGTTCACACCTGGTGATC
+CGATCACAGGTGCACAGCTGTAAGTGAAGGTGTGAATGAACCCAAGACGGACTGAGTTTC
+CATCTGACAACAAAACAGATACTAATAGAAATAAAAAGAAAGGAACAGGATTGAAAAGCT
+GAGGGTTAAGTAGAGAAAATACATTTTTTAGTTCAGTCCACAGGAGCTCTGTTGTGTCTA
+CATGTGAAACTGTGACGGTGCGACGCTTTAAATGCTGCTGCTGCAAGGAATTATGGGACA
+GCATTCTCTTCATAAATGATTTGCTGTGGTCAAATAGTTGTTTTTGCTTAGGAAGGTTCC
+TAAATGACCCAGAAGTATCTCACTGGCAGCCATGATCAGAGCTGGTCCAGGTCTCTAAAT
+GTTAAGGAAAGGAGCTTCAGTGTTTCCTATCTTTAGCAGAGGAGACACTGGACCTTCCTT
+TACGAAAGGAAAGGAGAGAATGCCATCCCACAATTCCAGTCGTAGTTTCAGATCCACAAA
+TATGTGGGCACATCAGAGCTCCTGTTTCATGTTTGTGACACAATCCAAAACTTCTGAAAA
+TCTCCTGCAGGTTATAAATAACAACACATTTTATCTTTGCAAACAGAAATGATGATCAGG
+GAAATGAGATCACCTCCAGGTAGACCTCTATCCTCGCTCGCTAACTGCTCTTCATACACT
+CTCCAGCTCACTCAACGTGTCGATATTTTTCTCTGATCAAAACCTAATTCTTTATTTTGC
+TAATTAACTGAGCGACTCTACGATCTCTCCCTGGAGTCCACGTGGCCCCGGTTGCATCAC
+AGTAATAGACATTTCACATTAACCCCTCGCTCGTATTTCACCACATTACGTTACATCTCC
+TGAAACCTCGGCGCTGCAAACTCAGCTCGGCTCACTCTCTAATCAGTTTTTACCACCCAC
+AGTTTGGCAAAAAGCAGAATCAGACATTAGCTGAGCTTCTGAGTGGGAGTTGTCTCCATT
+AGTGGAAATTATTTGGCCGGGACTCGTCTCACAGGAGGAACATCCACAGCAGCAACGATG
+CCAAACAACTCTTGTATTTATTTATTTTATTTTTTTCCTTTTAAAGTCGCCTCACGTCTG
+ACTCAGAATCCATCAACCTTGTGGCATTTTCTAGAAAACAGAGGATGGAGGGGGGATGTA
+CGACATCTCCTCCTCCTGCCATAACCTCAGAAAGCACTTATGTAAAAACCTTACTCAAAT
+ATTAATAAGGGAGGTGATGGGAGCAGGTAGATGTAGGTTTTATCTATTGACTTCTTTTTT
+TGAAGCAGAGGAAATGCAGTTATATAAAGGCAGCTGCTTCTTGTCAATCACATTTTTGTC
+TTAGAGACCAACTTCTTAATAGATAATAAAACAAGCAACAATTGTTCAGCTGCGTGCGTG
+TGTGGTTTGAATCCTCGTACACAAGCCGCTTTATGGAGGATTATTCCACATACAGTATCT
+TTTCTGGCGAACAAGCCAAGCCTTCTGTTTGTGAAGGAGAAACAGGACGAGTGAATCTGC
+TCTAGACAAAGAGTTTTCGAGCTTCACTCATCTGAAGTCTTTCCAAATCCCAGAGCGCCG
+GCTGCCGAGATTCACACATTACGCAACAGCACTCACTCGCTTGCAGAGGAAGTAACCCAA
+TTTAAGATTTTATATCTGAAACTCACAACAATCCTGATTCATAAATCCCAACCTATGACA
+GACACAAGGTTAATTGATGATTATATGAATATGTGGGTAAAATAAATCCATGCTGGCTCT
+TTCAGATAGCATCTGTTGTCAACAACAGAGCGGAGATTTGTTCCTGCTGACTTCCTCTCT
+GACCTAAAAATAGTTACACAACCAAACTTTATCTTCACCTGTGGAGTCATCAAAGAGGGA
+ACATTTTACCGAGGTTACCTGGAGCATGACAGTCGTAGCTCCTCTGCCCCCGCTGAAGCT
+TTTTAGAAGGGATCTGAGGGGGTTTGTTTGATGGGTTTGTCTCAGCTGAACCATAACAAA
+CCTCACTACAACAAATCTGTCCAACGGAAAAGAAAAACTCAGGGTGAATTCTTGTTTTGA
+TCTTTTCTTTTACAGCAATGGAAATGGAGCAAAACTGCAAATCCTCTCATCTAATAAGTT
+TAGTCCTTCTTTTAGAGTAATGCTGCTAGAATAAAATAATTTAATGATCTCAATACACTT
+CACCTTCCTAGGATGCTGTTTATCACTGGTCAGATCTATTTTGCCTCCTCTACTTGTGCA
+GTTTCAGTTTGATATAATCACTACATCTTGTTTGGCTCTGGAAAACTTTAAAGGGAATGT
+TGAAGAAGCAAAAAGGTGCAAAAATGTAACATTTATTACCAAAAAATCCAAATTAAAGTC
+TTTTTTTGCTTCTCAGGTAATTTACAGTGGTATGGTGGTGATATTTTGTGTCCACTATGG
+GGTGTTATAACTCTCACTATACATTCAGACAGCACCACAAAGTGGTGAACTCACTTTGTA
+CTAATTATACAGTAGTTATTCCTGTAATAGTTACTGTACAGAAGCATGGGGATGTGAAGT
+GCACATTTAAATAGCATGCTGCGTTCAGGGACATTTTGCATGTCATGTCGAGACATTAAG
+CTTTTAGCGTGAGTGAAGACACGTTTAATTACTTTAGGACACTGGTGTTTTCAGAAGCCT
+TTTCGCCTGAATGAGCCATTTGGTTTTTTGTTGTCCTGCCAGTTGCTTCAGCTGCGTTTT
+TTCTTTAAATTCTGTACATTTGTCCAGAATCGGAGAAACTTGCATAATCACCGTTGAGTC
+ACCAGTGCTGATTAACAACCCTTTTAACCCCTGAGAAGACGTCGTGTAGTCTCCACAATA
+AAATCCCTCCTTGCTGACCCGTCGCTTGCGGCGCTGCCAGAGGAGCAGGAGACACGGCTC
+TGACTCTGCTGAGTCTCTGATGCAGACATCTGGAGGGCCTCGAGCGTCCTGCCAGCCTCC
+TAATTATTGACTCTTCCTCAGCTTTGAGTGCTTTACAGCCACATTTACTCACTGAGAGAC
+TTGTGTCTCGTTCTGAACCCAGACTTTAACGCCCACCACCGGCTGCATCATAGTAGACTT
+TAATCCAAAAAAAACTATTAATGGAGTTCTTACCGAACACTTTTCCAGCTTAAGTCACAA
+AAAAAAACACACAGCTGTTGATTATGCAAATGTTAGCTTCTCATGAACATGAAAATAAGC
+AATTTATTATGTTTTTATGAAGTTTTGTGAGTGGTTTTTTGCACTTAAAACAACATGAAA
+ACAAACAAACCTCAAAGAAAAAAGTAGGAAGTTCATGAAAAATGTTTATTTTTCAAATAA
+CAACAGATCAGATAACTACTTGTACACAGACAGTTTTGCTGTGTCCCCTCAACTTTATGG
+AGTTTCATATTATTGTTTTTGTTTTAATGCCTCAAACTCGACTGTTTTGGTTCATTTTTA
+TTGCTCTCACAGTGTTTTTCAGGTGACAGACAAATGAAGTAGCTAGCTAAATGTAGCATT
+TACCAGCTAAAGAGACAAATATTGCCTTCAGAGTTGGTACAGACCAAAAGCAAGCTAAAA
+AGCTGAAGCTAAAAGAGAGGGAATACTGGCTAAAAAGGACACAGAAACAAGCTAAAATGC
+TAATGTTGCTCCTTATCTACAGCCAACAAATCAACCTTATTAATTTGTCAGTGTTGTGTG
+TTTCTGCTGCCCCCATGTGGCCAAAAAGAGCTCAACAACTTACATTTACAGAATATTTTC
+TGACTCCAGCTTGTTACAGAGTGATATGATCTCTAAAATAAGAATACATTCACTCTGAAT
+TACCCTGAGCAACCTCTGCACAGTGACTTTGAACTGATGCCATCAAGATAAAAGTCAACT
+ATTTCTTTTCATCGGGTCAAAATCAGTTCATGCATAAACTGGTTTTGGAGATATTTCTGC
+ACAGGCTCTGTATTAGCCGAGTATCTGTGCCTGCATGTGGATTATTTCTGTGTTTCTTCC
+AAATGATGATTTGCTGGTGTTACCTTGCCTGCAGACCTAATTTCCCCCGGTGGGACAGGA
+AGTGTTTGAGCTGAATTCATATGAGGTGAAGCTGCTTTGTTACAGTGAGAACTGTATTTG
+TCTTGAAGTGGTGAAACAATGCAACAGATGAGTTATACTGTGAAATTAGACCGCAGTGCC
+CTCGTGTGTCTCGTCTCCAGAGGCAGGACGGCCTGATGCAGCGCTCCATCCGAGAGGTGA
+ACACGTCCAGCCGCTGGTGTGTGCTCTGGGACCTGGACGAGGACACGCACTACAGCGTCC
+AGGTGAGACGGTTTCTGGGTTTTCTGTCGTGTTTGCAGACGAACCAAACATTTTTGATAT
+AGGGAATAATTCAGACATATTTCTCTTTCTTCTGCTGATGAAACTGTTTATTATTCTGTT
+GCTTTAACCCTTAATGTGACAAATATTTTTGAAAGAACTTTGGTGCAGCAGCTCATCGAG
+TCTGTGGGCAGCAAACTGGATACTTACCAGCTCGTATATGAAAGAAACCGTAGCACAGGA
+GGATATAGTTGTTTCTGTTTTTGATTATTTTGTGTCTCTTCTTGTAGTTTTGCATCTCTG
+TACTCGTTCTGCATCATTTTGTGGTTCTTTTGTCTAAAGCCTAAAACTACAGCTAGTGCT
+CTCATCTTAGATTTTACATCTGAAGACTAGACTAGACGTTAATCTTCAAACAACAAATGG
+TTAGGTTGTCACAAGGAAAGCAGCAAATTAAAATCTGCAGGGAAACTTAAATCAAGGAAC
+TTCATTGATAATAAATTTTCATATATAGAAATGAACTCTTATTTTTATTAACCTCCTCTC
+AGTGTTTAATTAACACACTGACAACACTTTCTTTATGGCACATTTAATCATTATTACAGC
+TCAGACCAGCTTAAATCAAAAGCCAGCACAAAACTGCAGCTCCTCTCTGAAGGAGGAGCG
+TCTAATGTGTTTCCATTATCACGACTCTATTAAACTTTTTATAATCCATTATAGCTTAAT
+AGACGGATACAGATTGTCCTTCACTCTGAGGGCTCGGTTAAATATGCTCCTCAGCCAGTG
+GATGTCCTGCAGAAGTGTCATTGAGCAAAGCACTGAAGCGATGCCAAGACGGGGGGGGCT
+GAGATTTGACCTCTGACCTCCCTGAGGAGGCGAGGAAAGTGAAAAAAGAGATTTTCTCTA
+TGTTTTGGTTTCAGCTCTTTTTTTTACTCATTTTGTTTTATGAGATTTTCTCTGTGGAGT
+CAGGTGAAGAGTTTATCATTAACCAGACTTTTTTCCTCAAGGACAGATATCAAACTTGCA
+ACTTGCCAATTAGAGAAGTCTTTTGGATACTTTCACATGAATTCAAGGACTCATTTTGAA
+ATGTTTTGTGCCGTACCCACCTCTGCTAGTTATTTTCCCACAATGACTTGCAACTACCTC
+CACAGAAAGCTCTCTGCGTTCAACCTCCGGGTTCAGCGTGTGGGTGGAGGCAGCAGTGTC
+TGCAGCACTGTGGGACCTCTTGTGGATGTAATTGTGGTGGATATCTCTCTTTGTGTGATT
+GTTGAACTTGCTGTTATCACAGCTGCTAGAAATATCTCTGTGTCCTGTTTGAGTCAGAAC
+TACGCCATTAAACTCAATGTCTTCATTTTTAATGGTTTTTCGCTTTCTTTAGTTGCTGAA
+AACCTCCCGAAAAAGTCCCTAAATGAGCTGTGGCTCTAATCTGTGTTCCCTCTTATTATC
+TCTCATGCTCTCTCTCTGCTTCTACATTTACAGTGCCATTTGTCCTCCAGTGATCACTCA
+GGATCCCGGCCAAAAACCAGAGCGCCATTTGCTCGCTAAATACACCCTCGCGAGCCAGCT
+TCTTCTCATCGTTACATAATGTCATCCTCTGTTAATGACAGGCTGGGTTTTAAAGTGTGC
+TCTGATTATATGGCTCCATCTTAGCTTCAGTATTTCCTTGAAAATGTGAGTTTTCACCTC
+TTTTATTTTCACTTTTTTTCAGGTGCAGTCCGTCGGGCCGCACGGCGACAGCCAGCCCAG
+CCGTGCCATCCACTTCAGGACTCTGGAGAGAAGCGACCACTATCCAGCCGGAGTCCTGGA
+CCACCGTAAATAATCACAAATACACGTGTACAGACACACAAAGTCAGGAAATAACAAAAT
+ATAAATGTGTAAATGTGGATTTGTCCTCAGACGAACCAGCGATGGAGGGACTCGGGATGA
+CTCCTCACCTACAGACAGGAGAGCTGCTCATTATCACCACTGTGCTGCTGCTGTGGGCAG
+GTCAGCCTTGATATATATGTGTGTGTGTGTGTGTGTGTGTGGGTGTGTGGATGTGTCTGC
+TTCACTGTGTGCAGATAAGGATGTTCTGGGAGAACACTCACAGATGGATTATGAGAGTGT
+GTCCCTGGGCTCACACATGTAAAAAGTCTCCCATCCCTCTCTACATGAGGGCAAGACTCA
+CACATTCAGAGACTCTGTGTTTGTTGTTTTGTGTCTCTTTATGGTTGTTTTGTTTCTGGT
+CGTTCTGTTTGTTTACTGTTGTTTTGTGTCTCTTAATCATTCATTTGGGTCTCTTTGGTT
+GTTGTTCCTCTCTGTACTCATTCTGCATTTGTTTGCCACTTTCATTGGTTGTTGTGTGTC
+TTTTGTGGTCATTTGTAATGTTTTGTGACAATTTGTGGTCATATTTCTGCCACACACAAA
+TGACAACACCCTTTTCTTCTCTCTCTTGCATTTGACTTTGTCTCCACTTCCTCAACTGTA
+ATCGTCCTCCCCAGCCGTCATCGCCCTGTTCTGCCGACAGTACGACATCATCAAGGACAA
+TGACTCCAACGGCACCAAGGAGAAAGCCAAGAGGCCGCTGGTCCGCGCCACCTCCTCCTA
+CTACAACGCCTCGGCCGGAAGCTCGCCCATCTACCACAACGGAGCCGTGCGCAGCAGCAG
+GGTGAACATTTAGAAAACTTCTCCTCCTTCCCCGACTCTTCTCCCGAGCTTTTGTGTTGT
+TTGCTGCACCTCTCTATAATGCATGATCATTCTTGGCTGCCAGGAATATTTTGTTTTCCT
+CTGAAGGGCCTTTGTAGTTGCATCAGAGATCTCCTAGCAACCAGAGCTGCTGCCATCATG
+GCTAAATATAAAACTTCCAGGCTGGAAAACAGAGAGCTAGCTGCAGAAGCTCGTTGGGCT
+TGTTGCTGTGCATCTCTTCAGAGACGTGCTCGGCAAAAGTGAAACATCTGACGAGGAAGG
+TTTATAATGATAAACTGGAGTTAGAGGCGAGACTGTCCTCACTGTCACAGCCAGCTAGCT
+AGAACATTTAAAACAGCTCAATTTTACATTGTTTTTGGTGGTGGTCAGTGAGTTTTACAC
+AAATATATCTTGTATAAAACTCATTAATAATTAAATATAACCCGAGGCTGCTTTGCTAGA
+CATTTATTTTCCTGACTGCGTAGTCCTGCTCACTGAACTGAAACACGGTATATTTTACCC
+ATGATCCCTGGCTCCTGGAGCAGGAAGTGCTGTCACTCTAACAAATGCACCAACCTCCAT
+TCAAATTTTTGATATTTTTAAAGTTTCCTGGCTGGATATCAGAGATGAACACGGGTTTTC
+AATGACTTCTGAGTCTTTTTAACTGACCTACAGTTCGGCATTGCTCTTGAACTTGTTGGG
+CTGCTGACTATCACTCAGTTAGAGGGAGATTGTACCTGTTCATCATCAACAACAGGTGCT
+CAGGAAGCAGAGTGGACCATCACAATGATTCAGAAATTGGTATTTTATGGTAAAATAGTT
+ATGTTAGTTATAATAGTTAGTTATGTTGCTTGGAATAATATCAACCAAAATTTGGCAGCA
+CAGGATGAATTTATAATTGAAAATGATCAACTCGGGGTAAACATATGTTTTTGGTTCAGT
+TTTGGAGCCAAAACTCCAGAGCAGAGATAAGTCAAAAGCAACAACAAGACACAATGTCCT
+TTCACGTCTGGTTGCCTTGATAACAAGGACGTGCCTCTCCATCCTCCCTGCAGTCAGACT
+TATTTTCCATTTTCTGTCATTTTTTTTTCCACCAAACCCGAACCCAAACGCAATTAAGTG
+AGAAGTGCATCCGAGCCCATTGGGACGCATTAGATTTGTGCTTTAAATGTCAAGCTGTCT
+CACATGAGTGGAACAGTTCATTGATTAGCTAATAAATCTTTGACAGACGTTTTATATATA
+TATATGTGTGTATATATATAAATATATATATATATACACATATATATATATATATATAAT
+GTATTACAGCACGTGGCGGCGCATGTGAATCTGACCCACACACTGTCGTCCTGAGCTGTA
+TGAGTCATGTTTATATATGCGACCCTCTCCATCTCTTTCTGTTTATGACTCATGTGTTTA
+TGCACACAGCTTCTATCTCACTGTTTCCTCTTCTTTCAGCTCCACAGAGCTTCCTCCTCC
+ATCAGCATCATTAGAGTCTGAGTCCGGACGGTTTGGTTTAAAGACTCTCTGCCGTGCTGT
+GCAGGACGGGGCGGAGCTGAGGATGTGTGGTGGCAAACTTGGGGAATTTATAGACCTAAT
+TTATTGTAAAATATGGACAAAGTGAGAAACACAAAGTGAGAAATGCAAATCTAATTCAAA
+TCAAACTAAGGAGTCGCACTGTGGATGACTGCTGCCCTCTAGTGGCAGAAGACGGCAGCA
+TTAAAACATCACAGCTGTTTGGAGCTTTCCCAGCAAAAAGAAGATGTATTTTCAACTAAT
+ATCCTGTTGTATAAAGACGTTTTCTTCTCTCTGATGTCAAAGACTAAAATGTGAATAACC
+GCCAGCATGTCGGCCAAGTCCTCTCCGCCTCAATTTAATTGATTCTCCAACACATCTGTG
+TGTGTGTGTGACTGTTTGTGTGATTTATACATTTTTAAATTTCCAATCAGTAATTAGATG
+TACAGTACTAACATCAAAAGCAGTGTATTATATGTAATTAGAATATGTACATAGATAACT
+TGAAGGCAGGTAAGTTGAAGTAATTGAAACAAATATTTGAATGTATATGATGATGGTGTT
+GGAGGCTGAAAAACACGCAGACTTCACACTGTAAGCTTTCATCAACAGTTTAATTAAATC
+ATTAACTCAGTGTAATTAGATCTGAACATTAATCTAAGTTGTTTAGCAGACTTCCCTTGA
+ATTTTCTGCAGTTGAAAACTAGGCAGCAAATCCTGTCAATTTAAGAAAACTTAAATTTAA
+CTTGTTTTTCTTAAGTTGACCTCACACTGTCAAGTCTTGTGTTTACACGTGTCTAACAAA
+GCTTTAATTATCACATTTAATATTGTTCGACTTCAGCCCCTCATCTCCTCTAATTAGTTT
+GATTGAGATTGACAGGGACACAGACTTTATCTCAACATGCAATAACTGTAAAAACTGTGT
+TTAAATATATGAGATAATAGATTTAAAATCAAGTATTTCCTTGTGTTAATCAGTAATTTT
+TGGCCCATTATGTTCTCCATATTTTAATGGATAACTAACCCTAACCCTTCTCCAACCAGG
+ACCACAATGTTTTTGTGATGTCCACTTAGTGAGAGCAGAGATTTGAGGATGCAGAGCTGA
+AACCATGGCCAAAGTACCACATACAGGCTGAACAGGGTCAAGTGGGTCTTGTTGAGTAGC
+TCAATAGTGGTTTGCCTGGGGAACATGTCCGTCAGTTCCAGCTGTATTTCTTGCACTCAG
+GATGAAAAGAGCTAAAGAAAACAGAGTAAGAATGCTGACATAGATGGAGCAGGAAATTAG
+AAGCGTGTTCCAGGTCTGTGCTGGCTTTGTTCCTGAGCCAATACAGTAATTACTCAGGAA
+CACACAATAATAAAAGATATTGGTTTTATTGTTGGAAAGTTGTCAGTGATTTAAAACACA
+TGTTTTGGTGTCAGAGCAGGAGGATACATGCATTTATTTTTTCCCTCTTGAGATTTATTA
+TATAAAAGAGATCAAGCGCTTAAAAGTTTAATTATACATTTCTTTTTGGGTGTAAAACCG
+AATTAAACAAATAAAACAAAAGATCACTGGTGTTGTCCAAATCAATGTTATATCATGATA
+TTTAAATCAGGTACATCATCCTTTTGCTCGTACTCTTTTAGTTGTTTAAAAGTAATTTAA
+CCAACACTGTGCTGTTATATTATGAGAAAATTACAAGAAAACTATCTCATAATTCTAAAA
+AAAAGAATAATAACAAAAACACAATCAAGATCAGATCAGGATGTCATAAATTTGAGAAAA
+ATATTGCATAATTTTGAGAAAACTATCTCATACTTAGAATTATTTTATATTTATGAGATC
+AGGATCTCATAAAACTGCCATTATTATGGGAAACTATCTCACAATTAAGAGGTAATTTGT
+TTGAAACCGTTGCTTGTTATTAGGAGATGCAGAAATTATGAAAATGCTGACTTGATTGCA
+CTTTTCTCTCACACTTTTCCAGGAGAATTGCACTGATGTTGGGAAACAAGGCCTTGACAA
+CTTGGCCTACGAGTATGGGAGTCAGAGTGAGCTCTACCGTCCACCCAAAGCTGCCTTCAG
+GGTGACCTTTAGACTCCTGGGACTCACCACTGAGCACCAGGCCCGAGCCATCGAAGCCAA
+AATCTCCATCCTGAAGGGAGTAGCCAGTGTCAGCTTGTCTTTACCCCGACGATTAGCCAA
+AGTGGACTATGATACCTCACTTCTCTCAACCAAAGAGATCGCCCTGGAGCTCCAGAGGCT
+GGGGTACAGTGTGGAGTTGGCGGTGCAGGTCAGGGTGGATGGTATGCACTGCCAGTCCTG
+TGTGCAGTCCATTGAGGGACAGATCGGGGAGCTACCTGGGGTTTCATATATTCAGGTGTC
+TCTTCAAGACAGGGCAGCACTGATTGTGTTTCAGCCTCTTCTGGTTACACAACAGGAACT
+GAGAGACAAGATCGAGGACATGGGGTTTGATGCCACTTTATTATCCCAGGACCCACCAGT
+GGAAGATATAAGCTACTGGCAGACTGACATATCGACTTCATCCTTGTCATCGTCAACCCG
+GACTGTAACTGTTTGGATCGTAGGGATGACTTGCAACTCTTGTGTGCAGTCAATAGAAGG
+GAGGATCTCTCAGATGTCAGGAGTACAGTCCATCGCGGTGTCGCTGAAGGATGAAAAGGG
+AACAATAACCTTTGACCCCTGTCTGACAGAGCCGGAGCAGCTCAGGGCGGCTATCGAGGA
+CATGGGCTTTGATGCGTCACTTCAAGGTAGACACTGACGAGGAAAGGTTTACTGATAATA
+TCAGAATATTTAATATCTTCGGCTTGTTTCTCTTTCCCAGAAGAGGAGTTGGTTTTGGAA
+CTCAAATAACATTGAACTGGTTTTTCAGCTTGCCATGCTCAAGGTAGAAAAACACCCATT
+GTTAGATGCCCTTAGAAGGACTTATATTGTTCTTCAAGCAACCACCCCACCCACAAATTC
+CTGTACATGATATTAGGAGGAGGACTATGTTATTAATAACCTCATGAGTGTAATAAAAGA
+GGCAAAGAAATCTAGTAATAGCACCTGTTCGTTAAGCTCTTGCATGTATAATCTGAAGGG
+TCACTAAGCAACAAGACACCCCATAGTCACCTCAACTCAGTTTCCACCAGTTACTGTGGA
+AACCAGCCAAGTATGCTCTGCAGTGCAGCTCAGAGAGGGCCCTTTACGGTGGCCAGGGGA
+TTTCTTGTCGGATTTAATGACAAAAAAAAAAAAAAAAAAAACAGCGTGCCAAGACATGGA
+ATTAACTCAGGGAGATTATGAGCAGATTCTTTCATCTACCTTTTTCCAATTTCAGCTGTT
+ATGGTCGAGTTGAAGTTGACGTTTTCAGCTTTTAAAGCTGCACTGCTGGCCTGGACTTGC
+GATTAATTCAGAGCTACAACTCAGCATAGAAGTTGTATATATTGGTATCATTGTGATGTG
+AAGGAGTCTGCAGAATAATAAATGGTCCAGTTATACCTATTACAACCACCGTTTTCTGAG
+TAAGATTTCATTGCTTGCAGATCACCAACATTAAGGCTGAGGTAATGGAGGCAGAAACTG
+TCTTCTGCTATGACTCTTTGTTTAGTCCAGTAGGTTTTCGAGGTTTGGTGCTTTGGCATC
+TTCCACTGCAGGATATACTCACAGTTAGCAGTTTATTAGGTACACCAACCTAGAAGTAAT
+CCAGTTTAAAGAGGTGTCGATTCAACCTCCCTTTAAACATCTTTGGCCACTGACTTTGCT
+CTCTTTTCTCTTCAGAACCTGCACAGAGCATCCAGGGTCATGAACAGTCCAGGCCTGTTA
+TCTCTGGACCCTCTCACCTCCCTGACTTGCAGTCACCCAGTAAGGCTGGAGTCAGCAATG
+GCACCGGATCACAGGCGAACACTGCGAGTCATCACCCCAACCCTCCTGACATTAAAGTAC
+AAAAATGCTTCATTTGCGTAATGGGAATGACCTGTGCCTCCTGCGTGGCCAACATTGAGA
+GGAACCTGCTCAAACACAAGGGTATGTTTGATTTAAATAGTCAGTTTATCACCCAGTTTT
+CCAGTATATGAGAGAAGGGTTATTGATTAAGTAAACTACTCAAGTATGAGTCGCTGATAA
+AAAATAATGAGGAAAACACAGTGTTTCACAATCGCTTTGACTTCCAGGAATCATTTCGGT
+GTTGGTGTCACTAATGGCGGGAAAGGCAGAGGTGAAATATGACACAGAAATCATAGATGC
+TGCTGCTGTAACTCAGCTCATAGAAGACTTAGGCTTTGGGGCCAAATTAATGGAGGACAA
+TGCAGTAACGCATGGGAAACTGGACCTCTCAGTAAGTCCTCAGAACGTAACGTGATACAG
+CATTCCTAAATACCAAGAACAGTTAAGAATTTTCACCAAATCTCTCACTGTTAGATAACA
+GGAATGACATGTGCGTCATGTGTCCACAACATTGAGTCCAAGCTCACCACAACCAAAGGA
+ATCCTCGGGGCCTCTGTCGCTCTGGCCACCAATAAAGCACAGATCCAATTTGACCCAGAA
+GTGCTCGGAGCTCGAGATATCATCAAGATCATTCAGGTAGCCATCACTTATTTTTTACAC
+TGTCTATTATAAGCCTCGTCTTTGATTTTGTGTCATGCTGTTGTTTCTCGCTGTAGAGCC
+TTGGATTCGGGGCCAGTCTGGTGAAGGCGGGCTTCAAAAACACCCTCGACCACTCAGAGG
+AAATTAGACAGCAAGTATCTGTTTAATGTTCCTCATTATCAGAATAAACGTTTATTTAAT
+CTGTTTAAAGTTTAAATACATTTATAGATTTAAATAAAACCTCAAACATAATCTAATGGA
+CAGACCCACCAACATAAAGATGAGTTTCTAGCAGAGGATGGTTAAGATCCATCGACCTCT
+GGGTTATGGGCCCAGCACGCTTCCGCTGCGCCACTCTGCTGGAAACCACCCCAGATGGGA
+CTCGAACCCACAATCCCTGGCTTAGGAGGCCAGTGCCTTATCCATTAGGCCACTGGGGCT
+ACACAAGTGCCAGTCTACACATGATGACCAGACTACACAAATCCAGCCCAGTTCTGAAAT
+GACAAATTTCAAGCGTCAGGCGTCTGGAACAACTAACAGGTCTTGTAGTGGGACATAACA
+GCAATGTGGCATCTGGGACGCCCCACGGCACCTCAAAGAAATGTCACGTCTCTTAGGGTT
+GTATTGCCATCTGTTGGTTTGACATTCGTGACCCTCCTCCCAGACGCATGGACGTGAACA
+ATGACTGATCGAGGTCAAAGTTGCAGTTTTTTGCCAGTCTCCTCTATCAAGATGTGGCAA
+GAATTTATGGCGCTATGATTGCTGTATTTGACACAGTGACTCTTGTGAAAGACAAAAAAA
+TATCACGACTGTTTCTCTCACTGCAAGATAAAAGAACGACTTTCTAGCAGAGGATGGTTT
+CGATCCATCGACCTCTGGGTTATGGGCCCAGCACGCTTCCGCTGCGCCACTCTGCTGGAA
+ACCACCCCAGATGGGACTCGAACCCACAATCCCTGGCTTAGGAGGCCAGTGCCTTATCCA
+TTAGGCCACTGGGGCTACAACACACCCCTCACTCCATATACAATATCACTTTCTTAAAAC
+ACAAATCCCCCTAGTGACAATAGCTGGAAGGATTTGTCCCCATGAGGCCCTTTGTGTAGC
+CTGCACAGACCACAATGGACACCATCAGACAATGACTACAGCTGTCAGTGCTAGTCAAGT
+GTTGTGTTAGGTTGCTGTTGCCTTTCATACATCTGGAAATCAGCAGAAAAACAGGCAAAA
+GGTGAGAGACAAAATCACTACAGTGTCTCATTTCTGTGAATGTTGCAGGTGGAAGAACTC
+CTTCCTGCTCAGCCTTGTTTTTGGCTTGCCTGTCATGGGCCTCATGATTTACATGATGGT
+AATGGACAGTCAGCACCATGAACATGGAGGCTCCATGCCTGAGGAGCAGAACCTGTTGCC
+GGGCCTCTCCCTCCTCAACCTGGCCTTTTTTGTGCTGTGTACACCTGTGCAGGTAAGAGA
+ACAGGTGACCTTGTTGGTTCTTTTTTAAGAGTTTGTTATTGCTAAATTCACATTGTGCAT
+CAGAAATGGTTACGTGTTTCCTCTCTGCAAGAATGTACATGTGATTGGTTTTGTCTTTTG
+TGATTCTACAGGTCAATAAATTGATAATAAATATACCTTATATGTTTGATTGGCGGCCAT
+TTTTCCTGTCTTCACTCCCTGCAGATCTTCGGAGGTCGGTACTTCTACATCCAGGCATAT
+CGCTCGTTAAAACACCGCACAGCCAACATGGATGTCCTGATTGTGTTGGCCACCTCTATT
+GCCTACATCTACTCCTGTGTTGTCCTCATCGTAGCCATGGGCGAGCGAGCGAGCCAGAGC
+CCCGTCACCTTTTTTGACACTCCACCCATGCTGTTTGTGTTCATCGCTCTGGGGCGATGG
+TTGGAGCATGTTGCAAAGGTAAAAATAAGGCTCTTTCCAGCTGTTGCCAGTCTTTGTGCT
+AGGCTAAGCTAACCAAGGAGCTTCATATTGTATTTGCTCTGTAGACATGAGTGATATTGA
+TTCTCTAATCTAACTCTTGGCTGGAAATAATTAAGCATATTTCACTGAATGATGTACTAT
+TCTTTTGCTGAAAAAAATAAGTGATGTTAGGAGTGTGTTAAATTGTGGAAGATCAGCATT
+AACACTGACTGACTGAAATCACCTTCTGTTTTTTCCATTATAATTCTATGTAAGCTTCCA
+TGTCACCACAAAGGCATAACTTCAATTATTCATTATACAAATCTGCATCAACTGAGCCTT
+TATTGTAATGTTTTGATGACTCATCAGTGGACATTTTAACAGCCTGGGATATGGGTCATG
+TCATGAGTTTTTGTAGATTATTAACTGTACATCAGCTGCTGTAACACAATCATAAGACCG
+GATTAAATTTTATCATGAGACTTGCTAGTGACCTTGCTGTACCAACAACTGACCAGATAG
+CATCTTGAATCACCCTTAAATACAAGCTATAATTCACAACCGCTGACAAGTCTGAATTCA
+GCATATATAATGTACAACAAAGCAAAAAGTACTACAAAGCTACTACAGGTTTTAAGTACT
+TTGTTTTGTCGCCATTTCTGCAGAGTAAAACCTCAGAGGCCTTGGCAAAGCTAATGTCAC
+TTCAAGCCACTGATGCCACTGTGGTCACTCTGGGATCTGACCACTCCATTATCAGGTGGG
+ACAAAAGATACAGTAAATAAAAACACAACACAATAGATGGACACCAGAGAGTGTAACTGT
+AGATACATTTGTTGACTTCAGTGAGGAGCAGGTGGTGGTGGAGCTGGTCCAGCGAGGCGA
+CATTGTGAAGGTTGTCCCTGGAGGAAAGTTCCCCGTTGATGGGAAAGTGATTGAGGGAAG
+CTCCATGGCAGATGAGTCTTTGATCACAGGTAGGAGGATGTAACAGTTGTAAAACATTAA
+CACAAAGGCCTGTAATTTTTGCTAACTTTATTTTTCCTGCCGTCTGTGTCTCCTATCTCT
+ACCAGGTGAGCCGATGCCTGTTAGTAAGAAGGTGGGCAGTTTGGTGATCGCCGGCTCCAT
+CAACGCTCATGGCTCTCTTCTGGTGGAGGCTACTCATGTTGGTGCAGACACAACTCTGTC
+TCAGATAGTCAAACTGGTGGAAGAAGCCCAGACCTCCAAGGTAGGGAGGCAGATTCTGAC
+AATTTAAACATAAAAGCATAAAATGTTAATGACAGGTGCATTGGATCTTTGGAATACAAC
+AGTGTATTTGGGTCATTGTAGGTAAATTTACTGCTTTAATCCCAGAGAATATCCACATTT
+TTACATAAATATACGACTTTAATCTTGGAAATTCTGAGTTTTTTTCTAAGTATATAAAAC
+CCTTTTTATATTTAAGTCAAGATTTTCACAAATGAAAACACAGTTTTTGCTGCTTGGACT
+ACAAAAACATTCACTTTAGACCTTTAATATCTAATATATTCCACATTCAATCCTGTTTTT
+TTTCATAAAACGAGAAAATAAGCAAATTCTTAAATCTCTTAATGCAGTTTCAGATATTTC
+CTAGAGATCAGTGTCTTGAGATAAAGATTAAATAAGAGGAAATAAGGAAAATCCATGCAC
+CTATATTAGGAAGATGACAATTGACACTGAACATTCACAAAAAAAAGTTTCTTAGAATTT
+TTTTCACTTGTTTCAAAGGCAAAAAATATAATAAAGAAAGTGGTTAAGTTTAGTTAGTTT
+AGTTCTGATAAGAGCTGACAGTTCACTCTCCTTCACTCTTGTGTTTGCTCAGGCCCCCAT
+CCAGCAGTTTGCAGACAGGCTCAGTGGGTACTTTGTGCCCTTCATAGTTATCGTTTCTCT
+GCTCACACTGGTGGCCTGGATGGCGGTCGGGTTTGTCGACTTTGATATTGTGAAGGAAAA
+CTTCCCGGTAGGTGCGCACAAAAATGTTTTCACACGTGGACAAAAGCGTATGACACAGAG
+AGAGAGAGGTTATTTTTATTTTCATATCACTTTCACAACTTCCTCCTCGCAGGGTTATAA
+CCAGAACATATCCAAGGCGGAAGTTATCGTCCGCTTTGCCTTCCAGGCGTCCATTACTGT
+TCTGTCCATCGCCTGCCCCTGCTCTCTGGGGCTGGCAACCCCAACAGCCGTCATGGTGGG
+AACAGGTGTCGGAGCTCAGAACGGAATCCTGATCAAAGGAGGCGAGCCGCTGGAGATGGC
+CCATAAGGCAACGCACTTTCATTTACTTAACTGTTGTTGTTAGCAATTTAACATTTAATA
+ATTTGTTAATAATTAATAATGAATTCTTAGTTTTGTTTTATACTGACTGAAACTCAGGAT
+GTTTGTAGTGTTACATAATGAGCATGAACAGAAAAGTTAGAGGAAGAGGGCAAAATGATT
+CCATTTTCCAAATAAAAGTTGAATTAGATTTATTTATTTTACAACAGCAAACAACAAGAT
+TATCAGGTGCATAACTCAAGCTTTTGTCATATTTATTCTTTGATTTACTTGTGCAGAAAC
+AAGAAGAGAACAACACCAATATTGTTGTAAGTTACATGAGATATAAGTGACTCACTCGTA
+AAAACATCAAACTAATGTGGCAGCTGTGTTATTTTAACTTAGGCAAATATTTGATGGGTG
+AATTGATTCATTCATGGCATCAATGTTGCCATTAAAGGTAGAAAAACAAAGTGGCTGCAG
+TTTGTCCTGGTATGTAGATGTGCAGCATACCATCCTCCTGGTGTAATTGATTCTTGTTGA
+TCTTCTCACTTACTGCATGATCAATGAGAACAAAGTGTATTTTCCCACACACTGAGGTCA
+GGAGTCTGGAGTTCTGGATATTTTAACATCTAATCTATCTCTGTTCTAATTAACTAGCGC
+CACTGTGTGGCGTCAGAAGTTACTGCTTCATTACAGGCACACTCTCTTCTCCTGTGTAAC
+TGCTTCCACCTATGTTTGTGTTCTTTAGTTTTACAATACTGTGATATTGTTACATTTAAT
+TTGTCTTTGCTGCTTGCTCAGATCGGTGTGGTGATGTTCGATAAGACCGGCACGATTACA
+AATGGCGTGCCTCGGGTGACTCGTGTTTTGGTGTTGTGGGAGATGGCCCGCATGCCCCTG
+AGAAAGATCCTGGCGGTGGTAGGCACGGCTGAGGCCAGCAGCGAGCACCCGCTGGGCATG
+GCGGTCGCTAAACACTGCAAAGAGGTGGGAGAGGAAGCCATTTAGCTTCATTAACTGTTT
+GTATCCAGGTAAAATTAGCAGTACTGTCGTCTGTGTGCATGTACCAGGAGCTGGGCTGTG
+ACGTCCTGGGCTACTGCCAGGACTTCCAGGCGGTGCCTGGCTGTGGGATCAGCTGCCGGG
+TGTCCAATGTAGATCATCTGCTGCAGCAGCAGAGTGAAGAGCGTTTCCTGCTTCCAGGAG
+CAACCACAGACGAAAGCAGCCTGCTCTCTGCTGTCGAGGCCCCGTCTGCAGGTCTGATGG
+TTTTCACTTTCCTGGGGTTCAACTCAGAGTCATACACAGTGTTTACTTGTTGATTTTAAA
+TCTGGAGGGTTTATTTAACTGATTCCCACTTTGTTTGAATGTAATCACTGTCTGCCTTCA
+GTCAATGAGGAGCCTTTATCTTTCCTGTGGTGAATACATTAAAGTACAGCCTCTTAGCTG
+AACAATCAAAGTTTTACTACCCCTGAAAACACAGCACACACTTCAAACTAAATCTAGGTT
+GTTAACAAGCCCTAAATTTGTCCATTAATTTGAAAAGAAAACAAACAATCACAAATTTTA
+AAAGCCCCTGATTAAAAGATTAAGTAGAGCTTAGGTGGTACATGACATTAGCCTTAATTT
+TAATTTTAAAGATTTGACAATCTCATCAATTGTCAGTTTAATTTAAGATTATATTGAGGT
+CGATATTTTGGTTTCAGTTGTCTGAAATACTTTAATGTGCAAATTAATTATATTTTAGGA
+AATTCTCATACAGTATTTAGGTATTTAATAGGCTCACTGAGGGATTCAAAGGGGTAAAAC
+CATTAATCTACACCTTCATTTATAACTTAAGACATTTTTAAATGGATTATAATATATTAA
+GGGGTTTAATGGGTTTAATGGTCTAATATGGATGTAGCCGCTTTAAGGTGTGAATTAACT
+GGATGTCATCTCCTTGTCCTAGATCATTTTTACTCATGTAATTTTCACTTCTGTGATCCT
+AAAATGTAGGTGAAGGCTTGTCTTACTCAGTCCTGATTGGAAACAGAGAGTGGATGAGGA
+GGAACGGTCACCACATTGGAGCAGATGTTGATGCCGCCATGAGCAGCCATGAGACCAAAG
+GGCAGACGGCCATCCTGGTGGCAATAGACGGTGAGGATAAAACTATTTTCTCGTTCTCCG
+ATCTTTTATAGATTTTACTGCTGCAGTCATCGTCTGTTACGTGTGTTGTCTGCAGGTGTG
+CTCTGCGCCATGATAGCTATCGCAGACACAGTGAAAGCAGAGTCAGCGTTAGCGGTGTAC
+ACGCTCAACAGCATGGGCATTGAGGTGGTTATGATAACAGGCGACAACAGACGCACAGCC
+AAAGCTATCGCCGCACAGGTAAAATCTTTTTTTTTTTAAATACTGAGAGAAAAGCACCTG
+AATTAATGAAATAAAAAGCCTGGAAGTTTGGTTGAACTCAGGTGGGGATCAGGAAGGTGT
+TCGCTGAGGTGCTGCCGTCACATAAGGTGGCTAAAGTTCAAGAGCTGCAGGAGCAAGGCC
+GGCGAGTTGCCATGGTGGGAGACGGCGTTAATGACTCACCCGCTCTCGCCCGTGCTGACG
+TCGGCATCGCTATCGGCACGGGGACAGATGTGGCTATTGAGGCAGCGGATATTGTCCTGA
+TCAGAGTAGGTGACCCACTGTAACTGCCAGTCTGTGCAGAGATATAACAACACGTTTACA
+CCACCTGACCTGAAGGTTTTCACACCGTCTAGAATGACCTGCTGGATGTGGTGGCGAGTA
+TCGAGCTGTCAAAGAAGACGGTGCGGAGGATAAGGATCAACTTTGTCTTCGCTCTCATCT
+ACAACCTTGTAGGAATACCAATCGCTGCAGGTACAGGCTGATCATACACTGACTCACTCC
+TGAGGAATCAGATCTATAACAGCAACAAGATACTGTATCACCAACACAGCAGATCACCTT
+TTTTATTAATCAGGCAGGGAGATAAAACTCAGCAGTAAAACTTCCCAAATATCAAATTGG
+AGGACACATAGCAAAGCTGCAGCCAGAGTTGTGTTTGTTCATTTGGAAGCTGTTCAGTCT
+GTCTTTTTTAAAACTTAAATCCTAGTCATGAACGCAAACTCCACAAGCACAACCTCAAGA
+AAACTTTGACAAGCCAACAAAAAATGTTATAAGTTATATTTTTGTCTTTTCCACACTTAA
+TTCTAGCAGACTATTCAATTTGCTGTCTTCTCACATTAAAATATAAATAATCAAAGCATT
+AAAACATGTGATCTGTGCCTCAACACATGGTTAAAAATCTTGTGAAAAGTGATGTCAGTG
+TTTACAAAGAAAGGAAATGATTTGTCCATACTGGTACCATGTGGACACAGAGCAAACTTA
+GACTTTGTTACGTAAACTTTAAAAAACTACATTGAAACACACCACAGCTGCACAAATTAC
+ACAAAGCTTTAACTTCTCTGTTGTGTTGTAGGTGTGTTCATGCCTGTCGGTCTGGTACTG
+CAACCCTGGATGGGTTCAGCTGCAATGGCCGCCTCGTCCGTCTCTGTGGTTCTGTCGTCC
+TTACTGCTGAGAATGTGAGTCCCTGGTATATCCTGTGACTTCTCTCTCCCCTTCATTAGA
+GTCGACTGACTTTCATGATACGTTTTCATCTTATTATACCTCACTTGCACTCAGAGGAGA
+AGGTAATAACCGTCTGTTTCCTCCAGGTACAAGAAAACCTCTGTGGAGCTGTACGAGGTG
+CGCGCACAGGGTCAAATGAGGAGCCTTCGATCGTCTCAGATCAGCACATATCTGGGGCTG
+GATGGCCGTCGGCGGAGCCCGGCTCTCCCCGCCAGAGCTCGGGAACAGCTAAGTCAAAGC
+AGCTCGGCAACCCCGCCCTCCCTCTCCAGCCAGGGGCCGTCCATTAACTCTGTCCAGGAG
+CAGCAGGACCGCTGCTCCCTCCTGGACCACCAGACTACAGAGGACCTTCATGTGTAGTAA
+AGGGAAAAGGGAAGAAAGACCTGGTTGTTTACAAATTCAGTGACGCTCTTTGATATTAAT
+ATCTCTAAGTATTTATATAAACAGATGAGGTTAATTGTGCACGGAAACTTTTAAAGTTCT
+CTTTTATTTCGCCTCATTCATCTTTAGCTCATAAATCCTGATCCTCTGAGGACCCTGAGT
+CAACACTGATCCTTCACTTTCTCATTGAAAATATCTGAAAATCAATTTGCTAACACTCAC
+AAAGTGACGTTTGACCGTGCTTCTGAAGCATTTTCTATATTTTTTTTCCTTTTTCATGCC
+AGATCACAGGTGCTACACGAATTAAAATTGACGTGTATATAAAGGTGCACTTTTACAGTG
+AACTCAAAGTAAAACTACACATTGTTTGTTTGGATAAGACTGTGCTGGTGTGAGTGTTGG
+TCTCAGGTTATAAACAACTAATACACAGGTTGATGGAGGAAAATTAGCATTTTTATCAGT
+ACGTGGGTTTATATTTGCACTTGATGCTCCTGTCTTTTGCATTCAGCTGCTCAGGTTTGT
+GCAGAACTGTCACTTCATCCAAGAGAATAATATTTGTTCTTGTTGATATGTTTTAAACTC
+TTGCAGTTCACAAGTATAGAGTTCTTGTGTTAAATATATAAATGAGGGAGAAGAAATGGA
+GCTCAGACCTTCTGGACTTTCCTTCATGTGTATTTCGAGCTGTGCCAGAGATAATTAATG
+CAGTAAATTAATCAAATCATCTCATCCATGGGCTCTATAGTTAACCAGAAAAGATCAGTC
+ACATATATCGGCTTCAGAGATAGTAATGACTCTTGTGTTGCACTCAGCCTATATGATAGA
+TAATAATAATAACTCATTGATGCTTTTAGTATGATGATCTTTTATTGCTTTATTTTGTCA
+CTTTGCAAACACAGCATTGTTATATGGGGTATCCTTTGCTTGCTCAGCTATGCATCCGTA
+ATTGTGCCAAGTTTTAAGGCTGATAGACTCGGGGCTCTTTGTTACTTTCTTGCTGGATGT
+AAGACTAACATTTCATTGCTTTGAGTCTGTTTTTAACCAGATTTCCTTTTGGTGTGCAGG
+TCAGGAGCCATACTGCCTACCCTCCAGGCGCTGCAGAAGAGCATCCAGAGACACTTTGAC
+AACCTGTCCAAACTGTGAGTCTCAACGTTTTTGCAACTTCAACCTCCGTACACAAGAAAT
+GACACAAACTTCAGGAGCTGTAAATGTGTATTTTCTCTGTGCAGGTGCGACTTTAACATG
+TACAACATTCGTTATGCCAAGGCCCTGTCGAAGCAGAGGGGTGTGAAGAGGGCGGCTGAG
+GAGGTCCAGGAGGAGGAGGAGGAGGAGGAGGAGGAGGAGGAGGAGGAGGACGAAGGGCTG
+TCTGAGGGCATGAGTGAAGCCTCTGCAGAAGATGCAGCAGAAATGATTCTTTAGGCTTAT
+TTAGGTGTCCTGAAGCCCTGCAGAGATGATAATGATGTTGGATTGTAAAAACAAACAGAT
+TTCTGTGATAAAACTTTGTTATTGTAAACTGTTTTTTATTAAATTCTTATGTAAATGTAA
+ATGTGGATGTTTTTATGTTTTATTATTTATACCTCCCTGTCCAAAAAATGGAGAGGACCA
+GCTACTATGTGTACCTGAACAACCCCAGCTCCATCCCCCACTGTTTTGATGCTTAAGTCA
+ACAAAATATGGGATGCTGGTTATGATTATGTTGTTTACCACATGGTGAATCCTAACACAC
+TAATTTATTTAACTTTCAATTTAACACTTTTAATGCATATATGAGCTGCATTAAACTCAT
+TTAGTTTGCCTATGCCTATAAAAAAATACAATGGTCCACAGTTAGAATTACATTTAAAGG
+ATAAGAGCACCTGAAACCAGCAAATATGTGGTATTTTTCCATCAGTTTGAATGAAATGCA
+CCAGAACTACATCGAACTACGTTACCCAGCAGTCCTTGCGGCGGAGCGGAAAAGGCGGAG
+TTTGAGCCAAAATGAGGGAAAATAAGAACATGTCCGAGTCCCCTTCTCAAGCGGGAAAAG
+AAATACCGGCGAAAAAACAAAAACTAAGCAGTGACGAGAACAGTAACCCCGATTTATCAG
+GAGACGAGAATGTAAGAAGCTAAACTGTGTTTGTTCTTCGTCGATAAATGACCCATAATT
+AGCTTCTAGCGGGTTAGCATTGCTGCTAAAGTAGCCGAATAGCTAAAGCGGCTAGCTAGC
+AGCTTTGTCCACCTGTACCGGCTGAATTCAGACAGCTGTTCCAAATTTATACCTGCTTTA
+AACCTGTTTAATATCTCCTAAATGTGTTGCACAGAGAGAGTTTTGTCTTCACCGTCTCTG
+TCTTTTATGCACACCCTCAAATGTCGCTATCTTTGGGCTCTGATCGCAGCTATTCACGTG
+TAAACTGAAGTTAGCTTTAGTGCTAGCAGCTAACTGAAATGTGCATTGTGGCAGTTATTG
+GAAATTATCTGTTAAATTAAGGGTCGATGGAGATGGATAAAGCTTGAGATATGATAATGG
+AGGATGGCTTGTTATCACCAGCATAATAGGCAGTTAGTATGAGAGCCACGTTGATTTATA
+GGTATTACTATTTATCACACTGAGCAAATATAAACTGTTATAATTTAATTGTTTACTGTG
+GAGCCACTTGTGCATGAAGTGCTTGAAGGTTAGTGCCCATTGACTTTAAGTGACTTTTCT
+GACGAAACTGTTATGCAGATTATTAAGAATATTATTGATCAAAATAACATATTTCTATTT
+TAAAACAGCAACAGTCACCAGGCAGATACTGGCAAGAAATGACTGTTGTGTCTGTCAGTG
+TAATGTCAAAGCATTCAGCAAGTTTAGAGCCTCGGGAGCATCTGTGAATTAAGTTATTTG
+TACTTTGTCTTTAAGGAAGTCTGTAAGATTTACTTTAAACACACACATACATCACTTGTA
+CCTGTGTTTTGCTTTCATAGGATGATGCTGTCAGTGTTGAGAGCGGGACCAACGCAGAGC
+GCCCAGACACACCCACCAACACCGCCAACGCCCCGGGCAGAAAGAGCTGGGGCAAGGGCA
+AGTGGAAGTCCAAGAAGTGCAGATACTCTTTTAAATGTGTCAACAGTCTAAGGGTATGTA
+CCTCCACCAGGTGTTTTCCTTCCGCAAAACAGGCAGCATATGTCTGGTGTCGTGGGCTCA
+CTTCACCCTCTGAATGTTCATGAATCGTGTAATGGTTTTCACAGGAAGACCATGGCCAGC
+CGCTGTTCGGAGTCCAGTTTAACTGGCACAGTAAGGAGGGAGACCCGCTGGTGTTCGCCA
+CAGTCGGGAGTAACAGAGTAAGTGACGACGAGCCAGTTCTCACATGCTGTTGTGCTGATG
+CTGTGATGTTGCCCTCTTGGCTCTACATAACCTTTTTTTTTAGTAATTTGTTGTTTGTAC
+TGTTCCATAACTAACCCCCTGTTTCTTTTCTTCCCCAGGTAACTTTGTATGAATGTCACT
+CTCAGGGAGAAATAAGACTCCTGCAGTCTTATGTCGATGCAGATGTATCCTTTACTTACT
+TAAAATGTCTTTTTAAATTGGCTCCTTCCTTGTTCTTGTTGTCATTCTTCACAGTTTCCA
+GTCCACATAGCAGTTGCTTTTGTTCTCAATCGCTATTATATAACTTGTCACTTGAGCTAA
+ACAGAAACACAACAACTGGAGGTCATACTTGAAATGTTTGCACAGAAATGTGAAAATCTT
+ATCTCCTAGAAACCTTTTGAACATAATTAAAACAAACATACAGTGATAGTTGACAGCAGA
+AATAAATGGCAGAGTAAAAACAGGGTATTTTAAGTAGTATAGACAGAACCACCTTTCTGT
+CATCCCATGAAGCTCTTGAATTGAGGTGAAATTCTCTCACAGCTGAGAGGTTGGAGCATC
+TGAGACTTCTTGTATCGATTTCTTTGACTAAACTTGTGCAAAAGGCTGATGAGAACTTTT
+ACACGTGTGCCTGGACCTACGACACCAACACGAGTCATCCCCTGCTGGCTGTAGCCGGAT
+CCCGCGGTATTATCAGGGTGATCAACCACATCACAATGCAGTGCATCAAGGTACATTTAA
+GCCATTCTCGCTCAATATTCGGTGGCTGGAAGGCACAGAGGACTGTGTTTTCACAGTTCA
+GTGCTCCAGACTGATATAATTTTATATCCTATACATCATACACTGGATAAGGATGCATTT
+ACTGAGAAGGAGATGCTGTTTCCTGCCTTTGCTTATCACCATTTGGTGTTTACTTTTCTA
+AGTTTTCTGACTGTGCCACAGATGGGATCAGATTGACATCCACCAAACCTGTTCACTCAA
+ATACTTTAAATTGCATTTTCAAATCACAGAATGAATAAATTAAGACCACATCTATAATAA
+CAGTGTTTTTCTTTTCATATCCAGCACTATGTAGGTCATGGAAATGCCATCAATGAGCTC
+AAGTTTCACCCGAGGGATCCCAATCTCCTCCTGTCTGTCAGCAAAGGTAAAAAGTTCTAA
+AATTCTTCACAAACAGCTAACAAGAGTTATATGTCCTGCTTTATTGAGCACTGAAAATGT
+TTTCTCACCCATGATTTGTTGCCACTGTCTTTGTGACACAGCAGAGAAGTAGGTTACTGT
+AGGTCAGGGGTAGGGATAGACAGTAGGGATAGTTAAAGTGTTTTTATTACCATGATTGTC
+AGGTGGTTCCTTAATCTGAGCAAAAACAGATTACTTCTCTGATAAGGGCCTAGTTTAATC
+TTAATAATGTTTTCTCAGTTACAACCTTCTTTAAATTTGCATATGTGAAACATCTGCTTC
+GCCTTGCTGAAGGGCAAAGGATTTTCTTCCATTATGAGCACATAATCCATCTGAAGTAGC
+TGTAATAATCTCTAAACTCTTGTTTTAATTGGTTATTTCATGCCAATTTCCTCAGATCAT
+GCCCTTCGTCTATGGAACATACAGACAGACACATTAGTGGCGATATTTGGTGGCGTGGAA
+GGTCATCGAGATGAAGTCCTGAGCGCCGTGAGTGTTGCCAAATCACACCTCACATCAACG
+ACTCTGTCCCATCAATAGATACAGTTAAATAAGTAGTTTATATGAAGGACTTCTAATCTG
+TTTTTTGTACATTTTATTTCAGGATTTTGATCTGCTGGGTGAAAAGATTATGTCATGTGG
+GATGGACCACTCCCTCAAACTGTGGCGGATCAATTCAGAGAGGATGCAGAAAGCCATTCG
+TGGATCTTATGAGTACAACCCCTCAAAGACCAATAGGTAAAAACAAATACAAAATAATTA
+TTCTTTACTTGATAAGCCTCTTGGACCTTTGGGGGCAGTGTTTCTCATGTTTTTGTGTTT
+TCTTCAGGCCTTTTGTCTCACAGAAAATTCATTTCCCCGACTTCTCAACACGAGACATCC
+ACAGAAACTATGTGGACTGTGTGCGGTGGCTCGGAGATCTTATTCTTTCCAAGGCAAGTT
+CTTACAGAGAGTGCAATGTTTGTAATGTTTTCAAACCTCTGGACTTCTTGCAAGCTTAAT
+CAGGTCAGAAGGGACACATGGAAAAACCGAATGCTGCTTCTCCAGGTCAATATAGGTTGT
+TATGAGTAGAATTTTATCCATTTAACATTAAGTTTAACACAAGAAAGTGTAAAAACATTA
+TGGTCTGATACTTTCTAAATCCACTAAATGTGGGAAATGTGGATAAAAATTGGATTTTAA
+ATATGATATATTTGTCTGATGAGAAATGTAACATGGCTTTTATCCAATTTATCGTTCTCG
+TTTCCTCTTCCTGTCTCATTGCAGTCCTGTGAAAATGCCATAGTGTGCTGGAAGCCAGGA
+AAGATGGAGGACGACATCGATCACATTAAGCCCAACGAGTCAAACGTGACGATTCTGGGA
+CGCTTTGATTACAGTCAGTGTGACATCTGGTACATGCGCTTCTCCATGGACTTCTGGCAG
+AAGGTCAGACAATTTAAACATTTCTGTCCACTTGTATCTCCATCTATAGTCAGGACATAA
+CCTGTTGCTGATGCTCTGTGTGGTCTGATGGTGGTTTACAGATGCTGGCTCTGGGAAACC
+AGGTGGGGAAACTTTATGTGTGGGACCTTGAAGTGGAAGATCCTCATAAAGCAAAGTAAG
+TCCACAACGCAAACTGATAAGTCACAGTTTTAATCCTCTGTGACTCTGAGCCAGGACACT
+CCTCCTGTCATAGATAATGTCTGTCAGCTAAATCCCTCTACATATGACTATAATGTTTCA
+CACCAGCCAGACGTGTTGTGAAACAAAACACGCGTGCTGCCAAAGTAAACTGTAGAGCAA
+TGCTAGATGCTAATCCAGGCCAGAAAAATAAAGAGTGTCATAGCTTCGTCTGACAGCTGA
+AGTTTCACTTAAGTTTTATTTTTATCAGTAGAGTGTAGAGAAAATAATACATAGAAACAC
+AAAACTGCTGCACATAAAATTACCATTTGGAGAAGATCCAGCTGTTGACTTATGTTGAGC
+TGTAACCCTCTTGTTTAGAGTAGGGATCTGTATGATTAGCACCAGAAAAACTGGTTGGTT
+AAACTTATTGATATATGCTAATGTGCAGATGTCAAAGTGGAAAGTGGGACAGTAGATGTG
+TCGTAAAACTACTCCACTCAAAGCTGATTTCTTCATGCTGAATATAGAATAAAATATACC
+AATGTTACAGCGCAGCTCACTGTCTTCTCTCTGGTCTCCAGGTGCACCACGCTGACTCTC
+CCCAAATGCATGTCGGCCATCCGGCAAACCAGCTTCAGCCGCGACAGCAGCATTTTGATA
+GCGGTGTGTGATGACGCGTCGATCTGGCGCTGGGATCGACAGCGCTGAGCGGTTCAGACT
+GACTCAAAAGCGATTTGAGTTCCTGTTGCTTTTATCCCCAACCTGCATCCCTGTTGTACA
+GATCTACACTGCTGTTTGAGCATTTTGTTTCCTCTGTGTGTTTGTGTGAATGATGTAAAA
+ATACTGTATTTCCTAAAAGAAAGTGAAGAATCGTGCCAAGGTGAGATGATCCTGTGCTAC
+TCCAGGAGTTAGTTTCCACTTCCTGTTTGTCCGGTAGCAGGAACGACAGATATTTCTAAG
+ATGTTTAAGGACAAGGAACAAAAACATCAGTGATTATCTGAGATTTTTCCCTTTAGATGA
+TCATGATGGAGCCACAAAAGCGTAAGCAATATGTTGGTGAAATAATCAGCATCGGCAGAA
+CAAAGTTCATAAATTAATCACTAACACCATTTTAAGGCTTTGAGACGAGAGGAAATGTTG
+GTATTTCAGGCACCTGGCAGATCTATCACTCATTTTAGGGGAAAAAAGCTTTTAAGAATA
+AATGTGATGGATGGCAGTGTGACATATTTTATATCCAAAATGAAGATTTTTCTCCTTTTT
+TCTCCGCTTATTTTAACATTTCCCACATTCCTTTTCATATTTTTTAATGCCCTCTTGGTT
+TGCTCACCCCCCTCCTCACAAACACACACCTTTGACTGTTGCATCATTGACATTTGAGGC
+TTTATTGAGTGCAGTCAATAAAATGATTTTTGTAAATATACATTTACTAAAGAGTCAGTT
+TGTGCAGTTGAAAATGTTCCACTTTTGTTTGGTGAATAGTTAAATGAGATTGTGCTGGGA
+GTGTTTTTTTTTTTTTTTTTTTTAGCTCCAGAGAAGTTGACATTTGGATGATTGGATTTT
+TACAGCAAAGTAAAGTTGAAAAGTTCGAGTTAATCTCTTAAAACAAAAGTCTCTTAAAAT
+AAAAGTCTGCTGAAGAGGAGGGAAGTGGGGTCCTTTTGCCTCTATGGAGTGCTTGTATTT
+GAATTTACCTGGACTTAAATAAA
--- /dev/null	Thu Jan 01 00:00:00 1970 +0000
+++ b/test-data/proteins.fasta	Tue Oct 13 12:30:39 2020 +0000
@@ -0,0 +1,56 @@
+>XP_008319618.1
+MALNVAGVTVMMLFYLLVLFIGIWASVKSRREAEKSRDGDRTDMALLGNRGINLVVGVFT
+MTATWVGGGFIVGTTEAVYDPSLGLLWAVMPVTATMCFIIGGLFFAEPMRNNKYVTMMDP
+FQVKYGKVPTAALSLACLVSEVMWVTGTLIGLGVTMSVILDLSYTVSIWISAAVAITYTL
+MGGLYSVAYTDIIQLILIFVSLWLCVPFALINPAVTDITETAKNFTFQPPWIGAVEGDRA
+WRWIDNFLLLGLGNLGLQNFHQRTLSASSSSTAKICCYAAAVIVPLMGIPPILLGAAAAS
+TNWNLTSYGSPSPFERGETGLVLPIVLQHLTPTYISIVGIGAVAAAVMSSTDSALLSAAS
+IFTSNIYKTILRTQASEQEIQWVIRASVVVVGLAGTSLTFLDNSVLMIWILRSDLTYTLM
+LPQLVCVLFFGVSNGYGAVLGCLSGILLRVLSGEPQLGIPPVVHFPGCTLVNGIYVQQSP
+VRTICMLWAVAAILFFSYMASLLFNRGFIPETWDIFNVKTQTGIKTKKQNQEVQTEKSEA
+QEPMIESSC
+>XP_008322079.1
+MASPLKVCIVGSGNWGSAIARIIGNNVKSIQRFATTVNMWVYEENIDGRNLTDIINTEHE
+NVKYLPGYKLPENVVAIPKLRDAAEGADLLVFVVPHQFIRKLCDEMVGCVSNKARGISLI
+KGVDEGPEGLKLISDIIRERMGIDMSVLMGANIANEVAAEKFCETTIGSKILENGLLFKD
+LLQTPNFRITVVDDADTVELCGALKNIVAVGAGFCDGLQCGDNTKAAVIRLGLMEMIAFA
+KLFSKDNSVQTATFLESCGLADLITTCYGGRNRRVAEAFVKTGKSIEELENEMLNGQKLQ
+GPATSAEVHRILKQKNLVDKFPLFTAVYQICFEGRPINEMISCLQSHPEHM
+>XP_008322769.1
+MERVVTAILHLDPGLLLLLVFLACSHTPQMVKATVPAAPVNISVTQLRAHSAMVTWNVPL
+GDTVIGYAISQQRQDGLMQRSIREVNSSSRWCVLWDLDENTHYSVQVQSVGPQGDSQPSH
+AIHFRTLERSDHYPAGVLDHHEPAMEGLGMTPHLQTGELLIITTVLLLWAAVIALFCRQY
+DIIKDNDSNGTREKAKRPLVHATSSYYNPSPGHSPIYHNGAVRSSRLHRASSSISIIRV
+>XP_008322771.1
+MFSTKTVKTEPSHHQHVSSAEQILMVECCCGPGHNCELHTADTGRIPCSADCQEMCNSKK
+QGLDNLAYVYGSQSELQPPAKCISRVTFRILGLSTEPQAREVETRISILKGVLGVSLSMP
+RKLAKVDYDTSVITSKEIVLELQNTGHSVEAAVQIRVDGMHCQSCVRSIEDRISGLPGVT
+RIQVSLQNREAVIVFQPLIVEQQELRVAIENMGFDAILRDDLSLEDINGWQLDILTPSSQ
+TVNIWIVGMTCNSCVQSIEGRISQMAGVLSICVSLMEEKGTISFDPRQMDPEKLRVAIED
+MGFDASLQEPVQSSVKSNPVTSAPSHLPEMRSTDNSVPSNNNRSQSIPGISQCGSTDVKA
+QKCFICVTGMTCASCVSNIERNLLKHRGVISVLVSLMAGKAEVKYDPSTIDSAAVTQLIE
+DLGFGAKLIEDNALTHGKLDLSITGMTCASCVHNIESKLTTTKGILTASVALATKKAQIQ
+FDPDVLGARDIIKIIQDLGFEASLVKTGFKNNLDHSEEIKQWKNSFFFSLVFGLPVMGLM
+IYMMVMDSQHQEHGGSMPEDQNILPGLSLLNLAFFLLCTPVQVLGGRYFYIQAYRSLKHH
+TANMDVLIVLATSIAYLYSCVVLIVAMAEQAHQSPVTFFDTPPMLFVFIALGRWLEHVAK
+SKTSEALAKLMSLQATDATVVTLGSNLSIIKEEQVVVDLVQRGDIVKVVPGGKFPVDGKV
+IEGSSTADESLITGEPMPVSKKVGSLVIAGSINGHGALLVEATHVGDDTTLSQIVRLVEE
+AQTSKAPIQQFADRLSGYFVPFIVIVSVLTLVAWIAVGFVNFDIIKENFPGYNSNISKAE
+VIVRFAFQASITVLSIACPCSLGLATPTAVMVGTGVGAQNGILIKGGEPLEMAHKIGVVM
+FDKTGTITNGIPQVTRVLVLWEMARMPLRNILAVVGTAEASSEHPLGRAVSKYCKKELGC
+DLLGHCQEFQAVPGCGISCRVFNVEHLLQKGPQQISEEHFLLPGATTDESSLLSDENPYT
+HMPSQSPSYLVIIGNREWMRRNGHHIGADIDAAMSSHEMKGQTAILVAVDGMLCAMIAIA
+DTVKAEAALAVHTLSSRGIDVVMITGDNRRTAKAIAAQVGIRKVFAEVLPSHKVAKVQEL
+QEKGLRVAMVGDGVNDSPALARSDVGIAIGTGTDVAVEAADIVLIRNNLLDVVTSIELSK
+KTVQRIRINFVFALIYNLLGIPIAAGVFMPAGLVLQPWMGSAAMAASSVSVVLSSLLLRT
+YKKTSVDLYETRARGQMKSLGSSQISTHLGLEGRWRSPAPPGTAEEHFDQSTMAPSALSR
+DEVSVNSFKGQQDRYSLLDHQTTEDINV
+>XP_008322772.1
+MRENKNMSESPSQAGKEIPSKKQKLSSDENSNPDISGDENDDAVSVESGTNTERPDTPTN
+TANAPGRKSWGKGKWKSKKCRFSFKCVNSLKEDHGQPLFGVQFNWHSKEGDPLVFATVGS
+NRVTLYECHSQGEIRLLQSYVDADAEENFYTCAWTYDTNTSHPLLAVAGSRGIIRVINHI
+SMQCIKHYVGHGNAINELKFHPRDPNLLLSVSKDHALRLWNIQTDTLVAIFGGVEGHRDE
+VLSADFDLLGEKIMSCGMDHSLKLWRINSERMQKAIRGSYEYNPSKTNRPFVSEKIHFPD
+FSTRDIHRNYVDCVRWLGDLILSKSCENAIVCWKPGKMEDDIDHIKPNESNVTILGRFDY
+SQCDIWYMRFSMDFWQKMLALGNQVGKLYVWDLEVEDPHKAKCTTLTLPKCVSAIRQTSF
+SRDSSILIAVCDDASIWRWDRQR
--- /dev/null	Thu Jan 01 00:00:00 1970 +0000
+++ b/test-data/spaln_out.gff3	Tue Oct 13 12:30:39 2020 +0000
@@ -0,0 +1,63 @@
+##gff-version	3
+##sequence-region	NW_017366533.1 906 39583
+NW_017366533.1	ALN	gene	1001	3313	1509	+	.	ID=gene00001;Name=NW_017366533.1_1
+NW_017366533.1	ALN	mRNA	1001	3313	1509	+	.	ID=mRNA1_00001;Parent=gene00001;Name=NW_017366533.1_1
+NW_017366533.1	ALN	cds	1001	1293	92	+	0	ID=cds1_00001;Parent=mRNA1_00001;Name=NW_017366533.1_1;Target=XP_008319618.1 99 152 +
+NW_017366533.1	ALN	cds	1403	1551	206	+	2	ID=cds1_00002;Parent=mRNA1_00001;Name=NW_017366533.1_1;Target=XP_008319618.1 153 202 +
+NW_017366533.1	ALN	cds	1659	1802	189	+	0	ID=cds1_00003;Parent=mRNA1_00001;Name=NW_017366533.1_1;Target=XP_008319618.1 203 250 +
+NW_017366533.1	ALN	cds	2061	2214	200	+	0	ID=cds1_00004;Parent=mRNA1_00001;Name=NW_017366533.1_1;Target=XP_008319618.1 251 301 +
+NW_017366533.1	ALN	cds	2487	2701	312	+	2	ID=cds1_00005;Parent=mRNA1_00001;Name=NW_017366533.1_1;Target=XP_008319618.1 302 374 +
+NW_017366533.1	ALN	cds	2783	3313	610	+	0	ID=cds1_00006;Parent=mRNA1_00001;Name=NW_017366533.1_1;Target=XP_008319618.1 375 549 +
+NW_017366533.1	ALN	gene	5314	8701	1447	-	.	ID=gene00002;Name=NW_017366533.1_2
+NW_017366533.1	ALN	mRNA	5314	8701	1447	-	.	ID=mRNA2_00001;Parent=gene00002;Name=NW_017366533.1_2
+NW_017366533.1	ALN	cds	8528	8701	267	-	0	ID=cds2_00001;Parent=mRNA2_00001;Name=NW_017366533.1_2;Target=XP_008322079.1 17 74 +
+NW_017366533.1	ALN	cds	7566	7706	184	-	0	ID=cds2_00002;Parent=mRNA2_00001;Name=NW_017366533.1_2;Target=XP_008322079.1 75 121 +
+NW_017366533.1	ALN	cds	7219	7357	242	-	0	ID=cds2_00003;Parent=mRNA2_00001;Name=NW_017366533.1_2;Target=XP_008322079.1 122 167 +
+NW_017366533.1	ALN	cds	6929	7041	177	-	2	ID=cds2_00004;Parent=mRNA2_00001;Name=NW_017366533.1_2;Target=XP_008322079.1 168 205 +
+NW_017366533.1	ALN	cds	6595	6828	385	-	0	ID=cds2_00005;Parent=mRNA2_00001;Name=NW_017366533.1_2;Target=XP_008322079.1 206 284 +
+NW_017366533.1	ALN	cds	6288	6394	177	-	0	ID=cds2_00006;Parent=mRNA2_00001;Name=NW_017366533.1_2;Target=XP_008322079.1 285 320 +
+NW_017366533.1	ALN	cds	5314	5407	172	-	1	ID=cds2_00007;Parent=mRNA2_00001;Name=NW_017366533.1_2;Target=XP_008322079.1 321 351 +
+NW_017366533.1	ALN	gene	10702	20056	1065	+	.	ID=gene00003;Name=NW_017366533.1_3
+NW_017366533.1	ALN	mRNA	10702	20056	1065	+	.	ID=mRNA3_00001;Parent=gene00003;Name=NW_017366533.1_3
+NW_017366533.1	ALN	cds	10702	10827	208	+	0	ID=cds3_00001;Parent=mRNA3_00001;Name=NW_017366533.1_3;Target=XP_008322769.1 31 72 +
+NW_017366533.1	ALN	cds	15802	15903	235	+	0	ID=cds3_00002;Parent=mRNA3_00001;Name=NW_017366533.1_3;Target=XP_008322769.1 73 106 +
+NW_017366533.1	ALN	cds	17604	17706	205	+	0	ID=cds3_00003;Parent=mRNA3_00001;Name=NW_017366533.1_3;Target=XP_008322769.1 107 140 +
+NW_017366533.1	ALN	cds	17792	17881	192	+	2	ID=cds3_00004;Parent=mRNA3_00001;Name=NW_017366533.1_3;Target=XP_008322769.1 141 170 +
+NW_017366533.1	ALN	cds	18376	18542	310	+	2	ID=cds3_00005;Parent=mRNA3_00001;Name=NW_017366533.1_3;Target=XP_008322769.1 171 226 +
+NW_017366533.1	ALN	cds	20021	20056	71	+	0	ID=cds3_00006;Parent=mRNA3_00001;Name=NW_017366533.1_3;Target=XP_008322769.1 227 238 +
+NW_017366533.1	ALN	gene	22057	32752	5551	+	.	ID=gene00004;Name=NW_017366533.1_4
+NW_017366533.1	ALN	mRNA	22057	32752	5551	+	.	ID=mRNA4_00001;Parent=gene00004;Name=NW_017366533.1_4
+NW_017366533.1	ALN	cds	22057	22827	845	+	0	ID=cds4_00001;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 60 308 +
+NW_017366533.1	ALN	cds	23837	24082	263	+	2	ID=cds4_00002;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 309 387 +
+NW_017366533.1	ALN	cds	24229	24392	270	+	2	ID=cds4_00003;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 388 442 +
+NW_017366533.1	ALN	cds	24476	24637	279	+	0	ID=cds4_00004;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 443 496 +
+NW_017366533.1	ALN	cds	24718	24791	127	+	0	ID=cds4_00005;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 497 521 +
+NW_017366533.1	ALN	cds	25910	26093	358	+	1	ID=cds4_00006;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 522 582 +
+NW_017366533.1	ALN	cds	26306	26539	433	+	0	ID=cds4_00007;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 583 660 +
+NW_017366533.1	ALN	cds	27205	27296	152	+	0	ID=cds4_00008;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 661 691 +
+NW_017366533.1	ALN	cds	27383	27510	235	+	1	ID=cds4_00009;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 692 733 +
+NW_017366533.1	ALN	cds	27607	27761	271	+	2	ID=cds4_00010;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 734 785 +
+NW_017366533.1	ALN	cds	28374	28508	266	+	0	ID=cds4_00011;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 786 830 +
+NW_017366533.1	ALN	cds	28614	28808	351	+	0	ID=cds4_00012;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 831 895 +
+NW_017366533.1	ALN	cds	29603	29785	322	+	0	ID=cds4_00013;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 896 956 +
+NW_017366533.1	ALN	cds	29869	30052	278	+	0	ID=cds4_00014;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 957 1020 +
+NW_017366533.1	ALN	cds	30791	30931	224	+	2	ID=cds4_00015;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 1021 1070 +
+NW_017366533.1	ALN	cds	31017	31159	249	+	2	ID=cds4_00016;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 1071 1118 +
+NW_017366533.1	ALN	cds	31243	31446	346	+	0	ID=cds4_00017;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 1119 1186 +
+NW_017366533.1	ALN	cds	31534	31651	207	+	0	ID=cds4_00018;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 1187 1225 +
+NW_017366533.1	ALN	cds	32253	32355	196	+	2	ID=cds4_00019;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 1226 1260 +
+NW_017366533.1	ALN	cds	32488	32752	323	+	1	ID=cds4_00020;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 1261 1348 +
+NW_017366533.1	ALN	gene	34753	39583	2503	+	.	ID=gene00005;Name=NW_017366533.1_5
+NW_017366533.1	ALN	mRNA	34753	39583	2503	+	.	ID=mRNA5_00001;Parent=gene00005;Name=NW_017366533.1_5
+NW_017366533.1	ALN	cds	34753	34872	272	+	0	ID=cds5_00001;Parent=mRNA5_00001;Name=NW_017366533.1_5;Target=XP_008322772.1 1 40 +
+NW_017366533.1	ALN	cds	35722	35874	296	+	0	ID=cds5_00002;Parent=mRNA5_00001;Name=NW_017366533.1_5;Target=XP_008322772.1 41 91 +
+NW_017366533.1	ALN	cds	35986	36078	203	+	0	ID=cds5_00003;Parent=mRNA5_00001;Name=NW_017366533.1_5;Target=XP_008322772.1 92 122 +
+NW_017366533.1	ALN	cds	36220	36285	147	+	0	ID=cds5_00004;Parent=mRNA5_00001;Name=NW_017366533.1_5;Target=XP_008322772.1 123 144 +
+NW_017366533.1	ALN	cds	36706	36831	249	+	0	ID=cds5_00005;Parent=mRNA5_00001;Name=NW_017366533.1_5;Target=XP_008322772.1 145 186 +
+NW_017366533.1	ALN	cds	37166	37247	172	+	0	ID=cds5_00006;Parent=mRNA5_00001;Name=NW_017366533.1_5;Target=XP_008322772.1 187 213 +
+NW_017366533.1	ALN	cds	37677	37768	188	+	2	ID=cds5_00007;Parent=mRNA5_00001;Name=NW_017366533.1_5;Target=XP_008322772.1 214 244 +
+NW_017366533.1	ALN	cds	37884	38017	272	+	0	ID=cds5_00008;Parent=mRNA5_00001;Name=NW_017366533.1_5;Target=XP_008322772.1 245 289 +
+NW_017366533.1	ALN	cds	38109	38214	215	+	1	ID=cds5_00009;Parent=mRNA5_00001;Name=NW_017366533.1_5;Target=XP_008322772.1 290 324 +
+NW_017366533.1	ALN	cds	38546	38704	359	+	0	ID=cds5_00010;Parent=mRNA5_00001;Name=NW_017366533.1_5;Target=XP_008322772.1 325 377 +
+NW_017366533.1	ALN	cds	38803	38876	166	+	0	ID=cds5_00011;Parent=mRNA5_00001;Name=NW_017366533.1_5;Target=XP_008322772.1 378 402 +
+NW_017366533.1	ALN	cds	39463	39583	241	+	1	ID=cds5_00012;Parent=mRNA5_00001;Name=NW_017366533.1_5;Target=XP_008322772.1 403 442 +
--- /dev/null	Thu Jan 01 00:00:00 1970 +0000
+++ b/test-data/spaln_out_no_st.gff3	Tue Oct 13 12:30:39 2020 +0000
@@ -0,0 +1,65 @@
+##gff-version	3
+##sequence-region	NW_017366533.1 906 39583
+NW_017366533.1	ALN	gene	1001	3313	1569	+	.	ID=gene00001;Name=NW_017366533.1_1
+NW_017366533.1	ALN	mRNA	1001	3313	1569	+	.	ID=mRNA1_00001;Parent=gene00001;Name=NW_017366533.1_1
+NW_017366533.1	ALN	cds	1001	1293	93	+	0	ID=cds1_00001;Parent=mRNA1_00001;Name=NW_017366533.1_1;Target=XP_008319618.1 99 152 +
+NW_017366533.1	ALN	cds	1403	1551	203	+	2	ID=cds1_00002;Parent=mRNA1_00001;Name=NW_017366533.1_1;Target=XP_008319618.1 153 202 +
+NW_017366533.1	ALN	cds	1659	1802	187	+	0	ID=cds1_00003;Parent=mRNA1_00001;Name=NW_017366533.1_1;Target=XP_008319618.1 203 250 +
+NW_017366533.1	ALN	cds	2061	2214	199	+	0	ID=cds1_00004;Parent=mRNA1_00001;Name=NW_017366533.1_1;Target=XP_008319618.1 251 301 +
+NW_017366533.1	ALN	cds	2487	2701	307	+	2	ID=cds1_00005;Parent=mRNA1_00001;Name=NW_017366533.1_1;Target=XP_008319618.1 302 374 +
+NW_017366533.1	ALN	cds	2783	3313	609	+	0	ID=cds1_00006;Parent=mRNA1_00001;Name=NW_017366533.1_1;Target=XP_008319618.1 375 549 +
+NW_017366533.1	ALN	gene	5314	8701	1518	-	.	ID=gene00002;Name=NW_017366533.1_2
+NW_017366533.1	ALN	mRNA	5314	8701	1518	-	.	ID=mRNA2_00001;Parent=gene00002;Name=NW_017366533.1_2
+NW_017366533.1	ALN	cds	8528	8701	268	-	0	ID=cds2_00001;Parent=mRNA2_00001;Name=NW_017366533.1_2;Target=XP_008322079.1 17 74 +
+NW_017366533.1	ALN	cds	7566	7706	181	-	0	ID=cds2_00002;Parent=mRNA2_00001;Name=NW_017366533.1_2;Target=XP_008322079.1 75 121 +
+NW_017366533.1	ALN	cds	7219	7357	238	-	0	ID=cds2_00003;Parent=mRNA2_00001;Name=NW_017366533.1_2;Target=XP_008322079.1 122 167 +
+NW_017366533.1	ALN	cds	6929	7041	176	-	2	ID=cds2_00004;Parent=mRNA2_00001;Name=NW_017366533.1_2;Target=XP_008322079.1 168 205 +
+NW_017366533.1	ALN	cds	6595	6828	386	-	0	ID=cds2_00005;Parent=mRNA2_00001;Name=NW_017366533.1_2;Target=XP_008322079.1 206 284 +
+NW_017366533.1	ALN	cds	6288	6394	171	-	0	ID=cds2_00006;Parent=mRNA2_00001;Name=NW_017366533.1_2;Target=XP_008322079.1 285 320 +
+NW_017366533.1	ALN	cds	5314	5407	170	-	1	ID=cds2_00007;Parent=mRNA2_00001;Name=NW_017366533.1_2;Target=XP_008322079.1 321 351 +
+NW_017366533.1	ALN	gene	10702	20056	1109	+	.	ID=gene00003;Name=NW_017366533.1_3
+NW_017366533.1	ALN	mRNA	10702	20056	1109	+	.	ID=mRNA3_00001;Parent=gene00003;Name=NW_017366533.1_3
+NW_017366533.1	ALN	cds	10702	10827	207	+	0	ID=cds3_00001;Parent=mRNA3_00001;Name=NW_017366533.1_3;Target=XP_008322769.1 31 72 +
+NW_017366533.1	ALN	cds	15802	15903	228	+	0	ID=cds3_00002;Parent=mRNA3_00001;Name=NW_017366533.1_3;Target=XP_008322769.1 73 106 +
+NW_017366533.1	ALN	cds	17604	17706	204	+	0	ID=cds3_00003;Parent=mRNA3_00001;Name=NW_017366533.1_3;Target=XP_008322769.1 107 140 +
+NW_017366533.1	ALN	cds	17792	17881	187	+	2	ID=cds3_00004;Parent=mRNA3_00001;Name=NW_017366533.1_3;Target=XP_008322769.1 141 170 +
+NW_017366533.1	ALN	cds	18376	18542	305	+	2	ID=cds3_00005;Parent=mRNA3_00001;Name=NW_017366533.1_3;Target=XP_008322769.1 171 226 +
+NW_017366533.1	ALN	cds	20021	20056	70	+	0	ID=cds3_00006;Parent=mRNA3_00001;Name=NW_017366533.1_3;Target=XP_008322769.1 227 238 +
+NW_017366533.1	ALN	gene	22057	32752	5799	+	.	ID=gene00004;Name=NW_017366533.1_4
+NW_017366533.1	ALN	mRNA	22057	32752	5799	+	.	ID=mRNA4_00001;Parent=gene00004;Name=NW_017366533.1_4
+NW_017366533.1	ALN	cds	22057	22827	844	+	0	ID=cds4_00001;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 60 308 +
+NW_017366533.1	ALN	cds	23837	24082	261	+	2	ID=cds4_00002;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 309 387 +
+NW_017366533.1	ALN	cds	24229	24392	271	+	2	ID=cds4_00003;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 388 442 +
+NW_017366533.1	ALN	cds	24476	24637	281	+	0	ID=cds4_00004;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 443 496 +
+NW_017366533.1	ALN	cds	24718	24791	125	+	0	ID=cds4_00005;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 497 521 +
+NW_017366533.1	ALN	cds	25910	26093	355	+	1	ID=cds4_00006;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 522 582 +
+NW_017366533.1	ALN	cds	26306	26539	430	+	0	ID=cds4_00007;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 583 660 +
+NW_017366533.1	ALN	cds	27205	27296	147	+	0	ID=cds4_00008;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 661 691 +
+NW_017366533.1	ALN	cds	27383	27510	233	+	1	ID=cds4_00009;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 692 733 +
+NW_017366533.1	ALN	cds	27607	27761	266	+	2	ID=cds4_00010;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 734 785 +
+NW_017366533.1	ALN	cds	28374	28508	264	+	0	ID=cds4_00011;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 786 830 +
+NW_017366533.1	ALN	cds	28614	28808	349	+	0	ID=cds4_00012;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 831 895 +
+NW_017366533.1	ALN	cds	29603	29785	319	+	0	ID=cds4_00013;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 896 956 +
+NW_017366533.1	ALN	cds	29869	30052	272	+	0	ID=cds4_00014;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 957 1020 +
+NW_017366533.1	ALN	cds	30433	30452	10	+	2	ID=cds4_00015;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 1021 1028 +
+NW_017366533.1	ALN	cds	30555	30561	32	+	0	ID=cds4_00016;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 1029 1030 +
+NW_017366533.1	ALN	cds	30812	30931	228	+	2	ID=cds4_00017;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 1031 1070 +
+NW_017366533.1	ALN	cds	31017	31159	246	+	2	ID=cds4_00018;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 1071 1118 +
+NW_017366533.1	ALN	cds	31243	31446	347	+	0	ID=cds4_00019;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 1119 1186 +
+NW_017366533.1	ALN	cds	31534	31651	209	+	0	ID=cds4_00020;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 1187 1225 +
+NW_017366533.1	ALN	cds	32253	32355	193	+	2	ID=cds4_00021;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 1226 1260 +
+NW_017366533.1	ALN	cds	32488	32752	322	+	1	ID=cds4_00022;Parent=mRNA4_00001;Name=NW_017366533.1_4;Target=XP_008322771.1 1261 1348 +
+NW_017366533.1	ALN	gene	34753	39583	2632	+	.	ID=gene00005;Name=NW_017366533.1_5
+NW_017366533.1	ALN	mRNA	34753	39583	2632	+	.	ID=mRNA5_00001;Parent=gene00005;Name=NW_017366533.1_5
+NW_017366533.1	ALN	cds	34753	34872	273	+	0	ID=cds5_00001;Parent=mRNA5_00001;Name=NW_017366533.1_5;Target=XP_008322772.1 1 40 +
+NW_017366533.1	ALN	cds	35722	35874	297	+	0	ID=cds5_00002;Parent=mRNA5_00001;Name=NW_017366533.1_5;Target=XP_008322772.1 41 91 +
+NW_017366533.1	ALN	cds	35986	36078	203	+	0	ID=cds5_00003;Parent=mRNA5_00001;Name=NW_017366533.1_5;Target=XP_008322772.1 92 122 +
+NW_017366533.1	ALN	cds	36220	36285	145	+	0	ID=cds5_00004;Parent=mRNA5_00001;Name=NW_017366533.1_5;Target=XP_008322772.1 123 144 +
+NW_017366533.1	ALN	cds	36706	36831	248	+	0	ID=cds5_00005;Parent=mRNA5_00001;Name=NW_017366533.1_5;Target=XP_008322772.1 145 186 +
+NW_017366533.1	ALN	cds	37166	37247	169	+	0	ID=cds5_00006;Parent=mRNA5_00001;Name=NW_017366533.1_5;Target=XP_008322772.1 187 213 +
+NW_017366533.1	ALN	cds	37677	37768	187	+	2	ID=cds5_00007;Parent=mRNA5_00001;Name=NW_017366533.1_5;Target=XP_008322772.1 214 244 +
+NW_017366533.1	ALN	cds	37884	38017	271	+	0	ID=cds5_00008;Parent=mRNA5_00001;Name=NW_017366533.1_5;Target=XP_008322772.1 245 289 +
+NW_017366533.1	ALN	cds	38109	38214	210	+	1	ID=cds5_00009;Parent=mRNA5_00001;Name=NW_017366533.1_5;Target=XP_008322772.1 290 324 +
+NW_017366533.1	ALN	cds	38546	38704	354	+	0	ID=cds5_00010;Parent=mRNA5_00001;Name=NW_017366533.1_5;Target=XP_008322772.1 325 377 +
+NW_017366533.1	ALN	cds	38803	38876	164	+	0	ID=cds5_00011;Parent=mRNA5_00001;Name=NW_017366533.1_5;Target=XP_008322772.1 378 402 +
+NW_017366533.1	ALN	cds	39463	39583	235	+	1	ID=cds5_00012;Parent=mRNA5_00001;Name=NW_017366533.1_5;Target=XP_008322772.1 403 442 +