A study of deep active learning methods to reduce labelling efforts in biomedical relation extraction
L'extraction automatique de relations biomédicales (ou biomedical relation extraction, bioRE) est une tâche essentielle en rechercherche biomédicale dans le but de générer des données labellées de haute qualité qui peuvent être utilisée pour le développement de méthodes prédictives innovantes. Cependant, construire ce genre de jeux de données bioRE, complètement labélisés, et de haute qualité, d'une taille aéquate pour l'entraînement de modèles d'extraction de relations état de l'art est retenu par l'annotation qui est limitée en temps et par l'expertise des chercheurs et curateurs.
How to dockerize an application?
Summary
In this article, we present the guide line to dockerize an application. In the prerequisite section, we explain the essential concepts for understanding and correctly deploying an application. The next section of this document illustrates the implementation on Docker with some examples.
I. Virtual machines vs containers
With containers, as shown in Figure 1 below, instead of virtualizing the computer as a virtual machine, only the operating system is virtualized.
ALAMBIC : Active Learning Automation Methods to Battle Inefficient Curation
Dans ce papier, nous présentons ALAMBIC, une plateforme web open source dockérizée pour annoter des données textuelles à travers l'apprentissage actif (ou active learning, AL), pour la tâche de classification. AL est connu pour sa capacité de réduire le besoin en annotation, une tâche coûteuse en temps, en sélectionnant les instances les plus informatives parmi les instances non labélisées, atteignant une exactitude plus vite qu'en annotant des données au hasard.
Globally local and fast explanations of t-SNE-like nonlinear embeddings
Nonlinear dimensionality reduction (NLDR) algorithms such as t-SNE are often employed to visually analyze high-dimensional (HD) data sets in the form of low-dimensional (LD) embeddings. Unfortunately, the nonlinearity of the NLDR process prohibits the interpretation of the resulting embeddings in terms of the HD features. State-of-the-art studies propose post-hoc explanation approaches to locally explain the embeddings.
Embedded AI
Le WP4 se focalise sur l’optimisation dans l’intelligence artificielle selon deux axes principaux :
- les limitations en termes de calculs
 - les limitations en termes de données
 
Pour le premier axe, il s’agit de se concentrer sur la compression des réseaux de neurones quel que soit leur type afin à la fois de diminuer la taille de ces réseaux mais aussi le temps d’inférence dont ils ont besoin pour produire leurs prédictions.
Pour le deuxième axe il s’agit d’étudier les architectures qui permettent d’apprendre à partir de données