[Humanist] 24.650 internship: automatic annotation

Humanist Discussion Group willard.mccarty at mccarty.org.uk
Sat Jan 15 09:55:00 CET 2011


                 Humanist Discussion Group, Vol. 24, No. 650.
         Centre for Computing in the Humanities, King's College London
                       www.digitalhumanities.org/humanist
                Submit to: humanist at lists.digitalhumanities.org



        Date: Fri, 14 Jan 2011 11:19:22 +0100
        From: Marin Dacos <marin.dacos at revues.org>
        Subject: Automatic Annotation of Bibliographical References in DH Books,Articles and Blogs


Dear colleagues,

the Center for Open Electronic Publishing is the recipient of the Google
Grant for Digital Humanities for this project : "Robust and Language
Independent Machine Learning Approaches for Automatic Annotation of
Bibliographical References in DH Books, Articles and Blogs".

We offer a six-month internship in Marseilles for this project. Nous
proposons un stage de six mois à Marseille pour le suivi documentaire de ce
projet.

Best regards,
Marin Dacos
Director
Center for Open Electronic Publishing

Stage en information scientifique et technique: identification et
reconnaissance de références bibliographiques
13 janvier 2011
Par Emma Bester  http://leo.hypotheses.org/author/bester/  |
http://leo.hypotheses.org/5867
 http://leo.hypotheses.org/wp-admin/post.php?post=5867&action=edit

*Mission*

Le stagiaire sera chargé du suivi documentaire du projet de recherche «
Robust and Language Independent Machine Learning Approaches for Automatic
Annotation of Bibliographical References in DH Books, Articles and Blogs »,
assuré conjointement par le Centre pour l’édition électronique ouverte
(Cléo http://cleo.cnrs.fr/ )
et le Laboratoire d’Informatique Avignon (LIA <http://lia.univ-avignon.fr/>)
dans le cadre du programme Google Grant for Digital
Humanities<http://googleresearch.blogspot.com/2010/12/more-researchers-dive-into-digital.html>

Le projet a pour objectif final le développement d’outils de reconnaissance
automatique de références bibliographiques, quelque en soient les
occurrences (normalisées ou non) dans la documentation scientifique
numérique. Le stagiaire participera à toutes les étapes préalables à la
phase de développement technique : de la réflexion sur les méthodes à
déployer (typologie des usages et des formes bibliographiques existantes,
identification de cas problématiques, exploitation de référentiels) à la
rédaction d’un cahier des charges technique.  Il procèdera ensuite à
l’évaluation des résultats (échantillonnage, tests). Il s’appuiera  sur le
triple corpus du Centre pour l’édition électronique ouverte : articles de
revues, livres et compte-rendus de lectures sur Revues.org ; annonces
d’évènements scientifiques sur Calenda ;  billets de blogs ou carnets de
recherche sur Hypotheses.org. Le stagiaire travaillera au sein du Pôle
Information Scientifique du Cléo, et en lien étroit avec le laboratoire
d’informatique d’Avignon (LIA). Au carrefour de l’Apprentissage automatique
(Machine Learning, TAL) et de l’Edition électronique, le projet demande un
intérêt fort pour les Digital Humanities et une bonne connaissance du milieu
et des pratiques de la recherche en Sciences humaines et sociales. Des
compétences en développement et en mathématiques ne sont pas requises.

*Durée du stage*: de 3 à 6 mois.

*Indemnité :* Indemnité de stage prévue, en conformité avec la
réglementation en vigueur.

*Lieu : *Le stage aura lieu à Marseille (13003)

*Candidater : *Envoyer CV et lettre de motivation à l’adresse
contact at revues.org.

*L’employeur*

Le Cléo  http://cleo.cnrs.fr/  est un laboratoire associant le
CNRS http://www.cnrs.fr/ ,
l’EHESS  http://www.ehess.fr/fr/ , l’Université
d’Avignon http://www.univ-avignon.fr/ et l’Université
de Provence  http://www.univ-provence.fr/ . Il fait activement partie du
réseau constitué par le Très grand
équipement-Adonis http://www.tge-adonis.fr/ .
Il est installé à l’Université de Provence (site Saint-Charles) et mène des
missions de service public : mise à disposition d’une plateforme complète
comprenant un portail (Revues.org  http://www.revues.org/ ) de revues
scientifiques en libre accès, une plateforme de carnets de recherche en
sciences humaines (*Hypothèses  http://hypotheses.org/ *), développement de
fonctionnalités, mise en place d’accords d’interopérabilité. Il met en ligne
plus de 50 000 documents structurés en XML, via des sites web éditorialement
gérés par plus de deux cents chercheurs, enseignants, documentalistes et
éditeurs en sciences humaines. Le nombre de projets éditoriaux, de visiteurs
et de fonctionnalités est en forte croissance et en phase
d’internationalisation.
*Cléo Revues.org*

CNRS/EHESS/UP/UAPV
3, place Victor Hugo, Case n°86,
13331 Marseille Cedex 3
FRANCE
Tél. +33 4 13 55 03 55
Fax +33 4 13 55 03 41
http://cleo.cnrs.fr

-- 
Marin Dacos
Directeur - Centre pour l'édition électronique ouverte
Director - Centre for Open Electronic Publishing

CNRS - EHESS - Université de Provence - Université d'Avignon
3, place Victor Hugo, Case n°86, 13331 Marseille Cedex 3
Tél : 04 13 55 03 40 Tél. direct : 04 13 55 03 39 Fax : 04 13 55 03 41
Skype : marin.dacos - Gmail video chat : marin.dacos at gmail.com
Twitter : @marind

marin.dacos at revues.org
http://www.revues.org - http://cleo.cnrs.fr
http://leo.hypotheses.org - http://cleoradar.hypotheses.org
http://blog.homo-numericus.net





More information about the Humanist mailing list