changeset 0:32b0db39551c draft

planemo upload for repository https://github.com/ARTbio/tools-artbio/tree/master/tools/facturation_ibps commit 0099dbb7178a8b187c1904f92871bce033070c58
author artbio
date Mon, 22 Oct 2018 17:17:11 -0400
parents
children 927553056183
files facturation.py facturation.xml requirements.txt template_SU.jpg template_facture.xlsx test-data/facture.htm test-data/template_SU.jpg test-data/template_facture.xlsx test-data/test.xlsx
diffstat 9 files changed, 212 insertions(+), 0 deletions(-) [+]
line wrap: on
line diff
--- /dev/null	Thu Jan 01 00:00:00 1970 +0000
+++ b/facturation.py	Mon Oct 22 17:17:11 2018 -0400
@@ -0,0 +1,105 @@
+# -*- coding: utf-8 -*-
+
+
+import argparse
+import re
+
+import openpyxl
+
+import pandas as pd
+
+
+def Parser():
+    the_parser = argparse.ArgumentParser()
+    the_parser.add_argument('--input', '-i', action='store', type=str,
+                            help="input html code to convert to xlsx")
+    the_parser.add_argument('--output', '-o', action='store', type=str,
+                            help='xlsx converted file')
+    args = the_parser.parse_args()
+    return args
+
+
+def main(input_file, output_file):
+    """Script de parsing des fichiers de facturation de l'IBPS"""
+
+    # ouverture fichier input
+    with open(input_file, 'r') as file_object:
+        facture_html = file_object.read()
+
+    # parsing de la date et de la période de facturation
+    date = re.search(r'Paris le (.*?)</p>'.decode('utf-8'),
+                     facture_html).group(1)
+    periode = re.search(r'de la prestation (.*?)</p>'.decode('utf-8'),
+                        facture_html).group(1)
+
+    # parsing des tableaux html avec pandas
+    facture_parsed = pd.read_html(
+        facture_html,
+        thousands='',
+        decimal='.',
+        flavor='bs4')
+    # remove 'Adresse de l'appel à facturation : ' (\xa0:\xa0)
+    adresse = facture_parsed[0].replace(
+        r"Adresse de l'appel \xe0 facturation\xa0:\xa0", r'', regex=True)
+
+    # supression des symboles € (ça fait planter les calculs dans excel sinon)
+    # ' € ' == \xa0\u20ac
+    elements = facture_parsed[1].replace(r"\xa0\u20ac", r'', regex=True)
+
+    # conversion des noms de colonnes
+    elements_col = elements.iloc[0]
+    cout_col = elements_col.str.extract(r'(cout.*)',
+                                        expand=False).dropna().iloc[0]
+    elements = elements.rename(columns=elements_col).drop(
+        elements.index[0])
+
+    misc = facture_parsed[3]
+
+    ref = misc.iloc[:,  # récupération de la référence
+                    0].str.extract(r'sur le bon de commande :\s*(.*)$',
+                                   expand=False).dropna().iloc[0]
+
+    # ouverture fichier output
+    facture_output = openpyxl.load_workbook(
+        'template_facture.xlsx', data_only=False, keep_vba=False)
+    ws = facture_output.worksheets[0]
+
+    # rajout de l'image de SU qui ne survit pas à la conversion
+    img = openpyxl.drawing.image.Image('template_SU.jpg')
+    img.anchor = "A1"
+    ws.add_image(img)
+
+    # ajout des éléments facturés dans le tableau
+    element_row = 23
+    for i in range(len(elements)):
+        element_row += 1
+        ws.cell(row=element_row, column=1, value=elements.iloc[i][u'Objet'])
+        ws.cell(
+            row=element_row,
+            column=2,
+            value=elements.iloc[i][u'nombre(s)'])
+        ws.cell(
+            row=element_row,
+            column=4,
+            value=elements.iloc[i][cout_col])
+
+    # ajout de l'adresse
+    address_row = 7
+    for i in range(len(adresse)):
+        address_row += 1
+        ws.cell(row=address_row, column=3,
+                value=adresse.iloc[i, 0].encode('utf-8'))
+
+    # ajout de la référence/période/date
+    ws.cell(row=2, column=3, value=ref.encode('utf-8'))
+    ws.cell(row=5, column=5, value=periode.encode('utf-8'))
+    ws.cell(row=21, column=5, value=date.encode('utf-8'))
+
+    # export fichier output
+    facture_output.save(output_file)
+    return
+
+
+if __name__ == '__main__':
+    args = Parser()
+    main(args.input, args.output)
--- /dev/null	Thu Jan 01 00:00:00 1970 +0000
+++ b/facturation.xml	Mon Oct 22 17:17:11 2018 -0400
@@ -0,0 +1,39 @@
+<tool id="facturation_ibps" name="IBPS facturation parser" version="0.2.1">
+    <description />
+    <requirements>
+            <requirement type="package" version="4.6.3=py27_0">beautifulsoup4</requirement>
+            <requirement type="package" version="1.0.1=py27_0">html5lib</requirement>
+            <requirement type="package" version="2.5.8=py27_0">openpyxl</requirement>
+            <requirement type="package" version="0.23.4=py27h04863e7_0">pandas</requirement>
+            <requirement type="package">pil</requirement>
+    </requirements>
+    <command detect_errors="exit_code"><![CDATA[
+        cp $__tool_directory__/template_* . &&
+        python $__tool_directory__/facturation.py
+            -i $input
+            -o $output
+    ]]></command>
+    <inputs>
+        <param format="data" label="Fichier html source" name="input" type="data" />
+    </inputs>
+    <outputs>
+        <data format="xlsx" name="output" label="Fichier facturation" />
+    </outputs>
+    <tests>
+        <test>
+            <param ftype="txt" name="input" value="facture.htm" />
+            <output file="test.xlsx" name="output" decompress="true" />
+        </test>
+    </tests>
+    <help>
+
+.. class:: infomark
+
+**What it does**
+
+Génère un fichier Excel de facturation à partir du fichier html du système actuel de l'IBPS.
+
+  </help>
+  <citations />
+</tool>
+
--- /dev/null	Thu Jan 01 00:00:00 1970 +0000
+++ b/requirements.txt	Mon Oct 22 17:17:11 2018 -0400
@@ -0,0 +1,5 @@
+openpyxl==2.5.9
+pandas==0.23.4
+bs4==0.0.1
+m3-PIL==1.1.7
+
Binary file template_SU.jpg has changed
Binary file template_facture.xlsx has changed
--- /dev/null	Thu Jan 01 00:00:00 1970 +0000
+++ b/test-data/facture.htm	Mon Oct 22 17:17:11 2018 -0400
@@ -0,0 +1,63 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
+<!-- saved from url=(0076)http://icps.cnrs.fr/basetechnique///////////facture-multiple/appeldouble.php -->
+<html xmlns="http://www.w3.org/1999/xhtml" lang="en" xml:lang="en"><head><title>Double de facture</title>
+<!--LIST-BASED MENUS WITHOUT IDs OR CLASSES ON THE LIST ELEMENTS-->
+<!-- tested in NN7, Opera, Firefox, IE6, IE5.5, IE5, on Windows and Safari and IE5 on Mac -->
+<!--this continues the horizontal menu demo-->
+<link rel="stylesheet" type="text/css" href="./Double de facture_files/pagedestyle.css">
+</head><body>
+<div class="blocun"><p class="titrefact"><img src="./Double de facture_files/ibps.jpg">Institut de Biologie Paris Seine - FR 3631</p><br><br>
+            					<p class="titrefact">Service Imagerie</p><br>
+            					
+            					<table>
+								<tbody><tr><td align="left"> 
+  
+  <input type="button" value="Imprimer cette page" onclick="window.print()">
+
+
+ <input type="button" value="Retour" onclick="history.back()">
+  
+ 						</td></tr></tbody></table><br><br>
+
+      
+    
+ 
+				<p class="soustitrefact">&nbsp;Paris le 20-09-2018</p>
+				
+				<table class="tableauto">
+						<tbody><tr><td>Adresse de l'appel à facturation&nbsp;:&nbsp;UMR 7622&nbsp;-&nbsp;S.Schneider-Maunoury</td></tr><tr><td>Morphogénèse du Cerveau des Vertébrés</td></tr><tr><td> Université Pierre et Marie Curie </td></tr><tr><td>9 Quai St Bernard</td></tr><tr><td>Batiment&nbsp;C&nbsp;</td></tr><tr><td>7etage</td></tr><tr><td>Paris</td></tr><tr><td>75005</td></tr></tbody></table><br><br>
+    
+			
+    		<p class="soustitrefact">&nbsp;&nbsp;Période de la prestation 8- 2018 </p><br><br><p></p><table class="tablefact">   
+   										<tbody><tr><td class="tableautd">Objet
+  										</td><td class="tableautd">nombre(s) 
+      									</td><td class="tableautd">cout séance *    						
+      									</td><td class="tableautd">total
+      									
+      						</td></tr><tr><td>&nbsp;</td></tr><tr>	<td class="bordurequestionnaire">&nbsp;				Confocal SP5 Droit 8-2018
+ 				</td><td class="centre">									77.00
+ 				</td><td class="centre">									21.00&nbsp;€
+ 				</td><td class="centre">									1617.00&nbsp;€</td></tr><tr>	<td class="bordurequestionnaire">&nbsp;				Confocal SP5 Inversé 8-2018
+ 				</td><td class="centre">									14.00
+ 				</td><td class="centre">									21.00&nbsp;€
+ 				</td><td class="centre">									294.00&nbsp;€</td></tr></tbody></table><p></p><table class="tablefact"><tbody><tr><td class="bordurequestionnaire">&nbsp;Sous total des relevés systeme</td><td class="tableautd">1911&nbsp;€</td></tr><tr><td>&nbsp;</td></tr><tr><td class="bordurequestionnaire">&nbsp;Total ht du relevé</td><td class="tableautd" id="rouge">1911&nbsp;€</td></tr></tbody></table><table class="tableauto"><tbody><tr><td>&nbsp;</td></tr><tr><td class="centre">Le total de votre relevé est de 1911.00 € <p></p><table class="tablefact">
+      
+		   <tbody><tr><td class="bordurequestionnaire" id="rouge">&nbsp;Total hors taxes sert au paiement interne</td><td class="tableautd" id="rouge">1911.00&nbsp;€
+       
+          </td></tr><tr><td class="bordurequestionnaire">&nbsp;Total TTC </td><td class="tableautd">2293.20&nbsp;€
+        
+        
+        </td></tr></tbody></table><br> <h5>Ce document est le double d'un relevé et ne peut tenir lieu de facture.<br>
+Veuillez régulariser ce relevé en nous envoyant un bon de commande par mail à nadia.baghli@upmc.fr, soit par fax au 01 44 27 22 91<br><br><br><br><font color="blue"></font></h5><br>
+							<p class="soustitrefact" id="rouge">Référence interne de l'appel à facturation, à rappeler sur le bon de commande :&nbsp; imagerie-2018/ 217</p></td></tr></tbody></table><br><p class="soustitrefact">&nbsp;Utilisateurs de l'équipe : A.Donati&nbsp;&nbsp;A.Andreu cervera&nbsp;&nbsp;F.Giudicelli&nbsp;&nbsp;C.Vesque&nbsp;&nbsp;</p><br>
+        							
+	
+
+        						
+    <table class="tablefact">
+							<tbody><tr><td class="sansbordure">* le cout de séance ne tient pas compte du tarif autonome si celui-ci existe
+							
+							</td></tr></tbody></table>   <br> <br>	
+ 
+ <table class="tablefactbordure">
+								<tbody><tr><td class="centre"> Institut de Biologie Paris Seine - FR 3631 </td></tr><tr><td class="centre">&nbsp;9 Quai St Bernard Bat B 7 étage Case 25&nbsp; 75252 Paris cedex 05 </td></tr><tr><td class="centre">&nbsp;Contact :Nadia Baghli&nbsp; Téléphone: 33-(0) 01 44 27 22 90 Fax: 33-(0) 01 44 27 22 91</td></tr></tbody></table><br><br></div><div id="techsmith-snagitchrome-extension"></div></body></html>
Binary file test-data/template_SU.jpg has changed
Binary file test-data/template_facture.xlsx has changed
Binary file test-data/test.xlsx has changed