2018-01-19 Compte-rendu du bureau ouvert

compte-rendu
bureauouvert

#1

Présents

  • Paula Forteza
  • François Bouchet
  • Guillaume Chaslot
  • Adrien Fabre
  • Jean-Marc Le Roux
  • Emmanuel Raviart
  • Maxime Chambonnet
  • Christophe Perrot
  • Loup Cellar
  • Sophie Briante
  • Marianne Billard
  • Mauricio Mejia
  • Xavier (AN, i.e. service de l’Assemblée)
  • Laurent (AN)
  • Grégoire (AN)
  • Thomas (AN)
  • Margaux Pech (cabinet de la présidence de l’AN)
  • Éric Buge (cabinet de la présidence de l’AN)

Déroulement

Réunion avec le service informatique de l’Assemblée auquel a été présentée la démarche du bureau ouvert, et notamment le travail effectué sur le dossier législatif d’un projet de loi en cours.

Une discussion s’est engagée pour voir dans quelle mesure une collaboration pourrait s’opérer entre le service informatique de l’Assemblée et le bureau ouvert.

Il s’avère qu’il n’est pas possible d’ouvrir l’API d’Éloi (qui permet aux députés de soumettre un amendement).

Les services sont ouverts à un travail en commun, mais seulement s’ils ont la certitude que ce travail aboutira à un gain de temps pour les gens qui travaillent à l’Assemblée. Ils n’ont eux-mêmes pas de temps à consacrer à des projets annexes, non validés par la questure. La collaboration possible la plus prometteuse concerne la génération automatique de liens dans la législation (cf. ci-dessous). À cette fin, l faut nécessairement monter un projet (et que ce dernier soit accepté par lu bureau de l’Assemblée) pour que les services de l’Assemblée s’emparent du travail initié par le bureau ouvert.

Ensuite, Éric Buge, le directeur de cabinet adjoint de François de Rugy, accompagné de Margaux Pech, sont venus et le bureau ouvert leur a présenté ses différentes initiatives.

Travail à venir

Nous allons poursuivre au fur et à mesure la constitution du dossier législatif, durant toutes les phases de son examen au Parlement. Contrairement au site de l’Assemblée nationale, notre dossier comporte les liens des différentes composantes entre elles, ainsi que les liens externes (vers des législations antérieures notamment), ce qui permet une navigation plus rapide et une lecture plus efficace du projet de loi. L’objectif est de montrer à l’Assemblée nationale à quoi pourrait ressembler les dossiers législatifs futurs, et à terme d’automatiser leur déploiement, afin de faciliter le travail des parlementaires et des administrateurs.

Actions de la semaine prochaine

À partir de lundi ou mardi :

  • Récupérer les amendements déposés sur Eliasse, et mettre ces amendements dans le wiki (un par page).
  • Ajouter automatiquement dans les amendements les liens vers les articles (Est-ce qu’Eliasse les fournit ?).
  • Ajouter aux articles les liens vers les amendements qui les modifient.
  • Faire une table des matières avec un tableau : numéro et titre de l’amendement ; articles modifiés

À partir de la fin de la semaine :

  • Ajouter le rapport de la rapporteure au dossier législatif (=> nouveau parser ?).
  • Ajouter les liens de ce rapport.
  • Ajouter le PJL dans sa version issue de la commission (=> nouveau parser)
  • Afficher les 2 versions d’un article du PJL côte à côte : version du gouvernement ; version de la commission
    • Les suppressions apparaissent en rouge dans la colonne de gauche
    • Les insertions apparaissent en vert dans la colonne de droite
    • Utiliser une table HTML à 2 colonnes : Chaque alinéa d’article correspond à une ligne de la table
    • Afficher en bas les références aux amendements ayant provoqué une modification dans l’article
      Choose Files Choose Files

Réunions bureau ouvert
#2

Contribution par mail de Xavier :

Dans le cadre de DuraLex, et si vous devez parser le texte pour y détecter les références internes ou les rappels (l’expression “l’article 5 du code est également modifié…” qui implicitement fait référence au
code législatif déjà modifié plus avant dans le même texte par exemple),
il y a deux projets Python intéressants NTLK (Natural Langage ToolKit:
http://www.nltk.org/) et
TextBlob(http://textblob.readthedocs.io/en/dev/) qui est une surcouche de plus haut niveau.

Je ne suis pas sur que ces outils rentrent dans la stratégie de création de liens actuelle de DuraLex, mais Il est possible qu’ils permettent de
construire des heuristiques complémentaires.

L’approche texte brut => arbre de syntaxe => arbre de sémantique me semble extrêmement bonne et devrait simplifier pas mal de choses. Cela permettrait de matcher des constructions (un sous arbre) syntaxique plutôt qu’une liste de token, ce qui est donc :

  • plus expressif ;
  • plus facile à maintenir ;
  • plus facilement générique.

Cependant :

  • il y’a un risque que ces outils gèrent peu/pas/mal le français et qu’ils soient trop complexes étant donné la tâche à effectuer ;
  • cela implique de refaire tout DuraLex

Je vais regarder ce week end si le jeu en vaut la chandelle.
Sinon, on garde ça pour une v2.