mercredi 18 novembre 2015

poste de linguiste francophone à Gdansk

Une annonce pour un poste de linguiste informaticien pour la société Ivona Software, qui est un centre de R&D d'Amazon Europe, basée à Gdansk (Pologne). Le poste est pour 9 à 18 mois, avec une possibilité de CDI. Il est réservé aux francophones natifs. Date limite de candidature: 30 novembre.


Job Location: Gdansk, Poland
Web Address: https://www.ivona.com/
Job Title: French TTS linguist

Job Rank: French TTS linguist; Other

Specialty Areas: Computational Linguistics; Phonetics; Phonology

Required Language(s): French (fra)

Description:

French TTS linguist

IVONA Software is one of Amazon’s top notch development centers. IVONA researches, develops and delivers cutting edge multi-language Text to Speech technology, leading in voice quality, accuracy and ease of use.

As part of our development team you will work within the Amazon Digital Products department. This department has developed significant digital businesses including Amazon MP3, Amazon Video on Demand, IMDB, Amazon Fire TV, the Kindle Fire and our recently released Amazon Echo.

IVONA is a team of creative people who successfully combine passion and ambition in creating one of the best speech synthesizers in the world, and now are one of the most visible teams within Amazon where you will get the chance to have a huge influence on making a positive impact on customers all over the globe.

At Amazon, we take pride in building complete end-to-end solutions, staring from researching a problem, implementing the solution, building a scalable and reliable service and ensuring the service is there when you need it.

This position is based at IVONA headquarters in Gdansk, Poland.

As a TTS Linguist you will work alongside Software Developers who are subject matter experts in speech synthesis and related fields. You are expected to have solid knowledge of linguistics, in particular knowledge of phonetics/phonology. You will be working on a variety of tasks to improve natural language processing of TTS (text-to-speech). You will actively collaborate with Software Developers with linguistic expertise throughout the whole language and voice building process at Ivona/Amazon.

Project duration: 9-18 months, with the strong possibility of turning the position into a permanent one.

The tasks include:

- Normalizing textual resources through regular expressions.
- Creating natural language test cases for natural language processing modules.
- Labeling text with semantic, syntactic and morphological features
- Annotating lexicon entries according to guidelines.
- Producing / validating phonetic transcriptions for French.
- QA of TTS voices and linguistic data.

Basic qualifications:

- Native speaker of French.
- Degree in Linguistics, with specialization in Phonology, Computational linguistics or similar.
- Solid knowledge of regular expressions.
- Solid knowledge of phonetics and phonology.
- Knowledge of Unix/Linux command line tools.

Preferred qualifications:

- Knowledge of scripting languages (e.g. Perl, Python).
- Familiarity with software version control tools (e.g. Git).
- Ability to create / fix phonetic transcriptions for French.
- Solid communication skills.
- Strong personal interest in learning, researching, and creating new technologies related to foreign languages, linguistics, phonetics, phonology and language technology.
- Comfortable working in a fast paced, highly collaborative, dynamic work environment.

*Notice that job description at application link may be slightly different; please ignore any differences.

Application Deadline: 30-Nov-2015

Web Address for Applications: http://www.amazon.jobs/jobs/346629

lundi 26 octobre 2015

Expérience de psycholinguistique

Nous recherchons beaucoup de sujets pour des expériences de psycholinguistiques (questionnaires en ligne) assez courtes (moins de 20 minutes) portant sur le lexique. Nous recherchons des locuteurs natifs du français.

Merci de choisir un des liens suivants :
http://spellout.net/ibexexps/chevaleret/ContJust4_b/experiment.html
http://spellout.net/ibexexps/chevaleret/ContJust2_c/experiment.html
http://spellout.net/ibexexps/chevaleret/ContJust3_c/experiment.html
http://spellout.net/ibexexps/chevaleret/ContJust6_c/experiment.html
http://spellout.net/ibexexps/chevaleret/ContJust5_b/experiment.html

mardi 20 octobre 2015

Trouver un stage à Google

Voici une information intéressante pour ceux qui seraient intéressés par un stage chez Google en 2016. 
Hello!

Google France is excited to organize an Open House event on 5th November 2015. This event is intended for students in Computer Science and related areas (License, Master, PhD, Engineering Cycle) who are interested in internship opportunities at Google in 2016 (in all Google locations through the world). This will be a great opportunity to learn more about Software Engineering at Google, projects developed at Google Paris and how to get prepared for our recruiting process.

The agenda for the event will be as follows:
17:30 - Doors open, welcome drinks, visit of the Cultural Institute (optional)
18:30 - Lightning tech talks about R&D projects at Google
19:15 - Tips and tricks about the recruiting process for internships at Google
19:45 - Panel with Google Software Engineers
20:15 - Drinks, food, visit of the Cultural Institute (optional)

The event will take place at the Google office in Paris (8 rue de Londres, 75009 Paris, near Gare Saint-Lazare).

If you are interested in attending this event, please fill out this form by 29th October. Because of space limitations, we may not be able to host everyone who registers. We will confirm participants the week before the event.

Cheers,

Jess Safir / Vincent Simonet
University Programs / Google Paris Engineering

mardi 6 octobre 2015

Association d'étudiants ELIPS

ELIPS est née ! (Ou en tous cas ça s'en vient...)
La nouvelle association des étudiants de linguistique informatique de Paris Diderot est en voie de création, toutes les bonnes volontés aussi bien parmi les étudiants actuels que parmi les anciens sont les bienvenues.


ELIPS c'est :

  • Promouvoir la linguistique-informatique auprès de différents publics.
  • Faire connaître la formation LI de Paris 7, dans et hors de l'université.
  • Renforcer les liens entre les anciens et actuels étudiants du cursus à travers diverses activités et événements (JALI, sorties..).
  • Développer l'entraide au sein du cursus, par le tutorat et les conseils prodigués entre étudiants.
  • Informer les étudiants des dernières actualités du TAL.
  • Tenir à jour la liste des entreprises qui ont déjà pris des étudiants du cursus en stage.
  • Diffuser chaque année les annales des partiels et examens de l'année précédente.
  • Favoriser la prise d'initiatives et l'émergence d'idées pour le cursus LI de Paris 7.

Pour adhérer :

        Afin de permettre le fonctionnement de l'association, une contribution de 5 à 10  ( montant non encore défini) est demandée lors de l'adhésion. Si vous souhaitez nous rejoindre, envoyez un courriel avec comme objet : « Adhésion votre_NOM » à l'adresse : elips.p7@gmail.com

Twitter:
https://twitter.com/p7_elips
Facebook:                                                                                        
https://www.facebook.com/p7elips

Une offre d'emploi juste pour nous au CENTAL (Louvain)

On me fait passer une offre d'emploi urgente dans le centre de recherche de l'Université Catholique de Louvain, où on recherche un master TAL/LI pour un projet d'un an.
Date limite le 10 15 octobre.

http://cental.fltr.ucl.ac.be/team/acougnon/JobWebDeb

jeudi 17 septembre 2015

Stage sur l'évaluation des compétences linguistiques

Une offre de stage possiblement perlé, plutôt à partir de novembre; me contacter pour plus de détails.

Présentation de l’entreprise
Pipplet est un service d’évaluation en langue étrangère innovant. Nous permettons aux entreprises d’évaluer la capacité de leurs employés, actuels ou futurs, à comprendre et à se faire comprendre en anglais, et non pas leurs seules compétences académiques. Entièrement en ligne notre approche originale nous permet de plus d’évaluer efficacement les compétences en expression orale. 
Nous avons développé une première version de notre service avec une base de question initiale. Nous recherchons maintenant à enrichir cette base, en créant de nouvelles questions, voire en développant de nouveaux axes de tests.

Missions
Le stagiaire aura trois missions principales :
- L’analyse et la critique des questions actuelles et des résultats obtenus par les candidats, afin de mieux calibrer le test. 
- L’élaboration de question, recherche de contenu, rédaction des libellés, identification des domaines et des niveaux de la question.
- La recherche de nouveaux axes et/ou modes d’interrogation afin de mesurer des compétences différentes.
Ces trois missions seront menées en parallèle sur la durée du stage.

Profil recherché
Compétences et intérêt pour la linguistique et plus spécifiquement l’évaluation en langue.
Compréhension des concepts informatiques, capacité à formater de l’information dans un cadre précis
Capacité d’analyse et de synthèse

Modalités
Stage de 1 à 2 mois. Plutôt à partir de Novembre, possibilité de démarrer plus tôt à discuter.
Localisé sur Paris

vendredi 21 août 2015

Rentrée 2015/16

Comme chaque année, un post pour afficher au fur et à mesure les informations concernant la rentrée 2015/16 pour les L3, M1 et M2 Linguistique Informatique.
Pour mémoire la page de l'année dernière.
Et voici les diapos de la réunion d'information.

  • L'examen spécial d'entrée en M1 sera organisé le vendredi 11 septembre 2015 de 9h à 13h. Il aura lieu en salle 310 (3e étage, bâtiment Olympe de Gouges). Pour ceux qui ne passent qu'une épreuve, elle commencera à 9h (et se terminera à 11h). Pour ceux qui passent deux épreuves, on commencera par l'informatique à 9h. Rappel: il est nécessaire d'avoir été officiellement convoqué pour passer cet examen d'entrée. 
    Préparation de l'examen: consignesindications préparées par l'association d'étudiants.
  • Réunion d'information: Pour les étudiants de L3 et M1, une réunion d'information est organisée le vendredi 11 septembre, à 16h, dans la salle 310 (salle à confirmer). Cette réunion n'est pas obligatoire, mais elle est fortement recommandée.
  • Début des enseignements : Sauf cas particulier, les enseignements commencent la semaine du 14 septembre, il est indispensable d'assister aux cours dès la première semaine, même en cas de situation administrative non réglée. 
  • Quelques changements d'organisation : Le cours d'Algorithmique (M1) passe au 2e semestre.

dimanche 21 juin 2015

Une petite expérience simple

On recherche des sujets pour une petite expérience très simple (jugements d'acceptabilité) qui prend environ 20 minutes:

http://spellout.net/ibexexps/chevaleret/AABD1_a/experiment.html                       

Attention: L'expérience n'est pas accessible sur tous les navigateurs. Si votre navigateur préféré ne fonctionne pas, merci d'en choisir un autre.

mardi 16 juin 2015

Poste permanent en TAL à Turin (Nuance)

Un poste permanent à temps complet vient d'être ouvert à Nuance Turin (Italie).

On cherche un natif de français avec une formation en TAL. De l'expérience dans le domaine n'est pas nécessaire. Le salaire brut annuel est d'environ 30000 euros (une négociation est possible selon le profil du candidat). Si on trouve un candidat senior, on peut adapter le poste. On demande au candidat qu'il/elle vienne vivre à (ou près de) Turin (avec un "relocation bonus", évidemment).

Me contacter pour connaître les personnes à qui envoyer un CV.

---- Fiche de poste ----

Typologie d'activité: NLP/NLU
Connaissances obligatoires:
• Connaissance parfaite du français (forte préférence pour les natifs)  
• Bonne connaissance de l'anglais  
• Informatique:
     - Utilisation de Windows et Linux, y inclus ligne de commande
     - Langages de scripting (surtout python)
     - Connaissance des expressions régulières
Connaissances préférées
     - Connaissances dans le domaine de la reconnaissance vocale
     - Connaissances des formalismes grammaticaux (ABNF ou BNF)
     - Connaissances dans le domaine du NLU (Natural Language Understanding)
Lieux de travail: Turin (Italie)
Typologie de contrat: à durée indéterminée

mercredi 13 mai 2015

Sondage: quel français parlez-vous ?

Nous lançons un grand sondage sur les mots et les phrases de nos régions...

Quel français régional parlez-vous? Aidez-nous à y voir plus clair entre ceux qui "pannossent" et "wassinguent", et ceux qui mangent "un pain au chocolat" ou "une chocolatine"... Dites-vous plutôt "je vais y faire", ou "je vais le faire" ? Est-ce que "vous avez déjà eu fumé" ?

Répondez à nos quelques questions (moins de 10 minutes), et faites suivre le questionnaire autour de vous !                                                                                   
                                                                                                   
http://neuchatel.eu.qualtrics.com/WRQualtricsSurveyEngine?SID=SV_9AJlU6P5EqKv3Sd&Preview=Survey

Mathieu Avanzi
Visiting Scholar
DTAL, Faculty of Modern & Medieval Languages
University of Cambridge
http://sites.google.com/site/mathieuavanzi/

lundi 4 mai 2015

postes en TAL dans le New Jersey

Interactions is expanding its Natural Language Processing team! Ideal candidates will have a PhD or MS with an emphasis on NLP. Please apply using the link below.

http://www.interactions.net/careers/natural-language-processing-scientists-and-engineers/

mardi 10 mars 2015

Bourse Post-doctorale en analyse d'émotion, Galway

L'Unit for Natural Language Processing du centre d'analyse de données de l'université nationale d'Irlande à Galway offre une bourse post-doctorale en analyse d'émotion, date limite de candidature le 22 mars prochain.

Open Position: Postdoctoral Researcher in Emotion Analysis

The Unit for Natural Language Processing [1] of the Insight Centre for Data Analytics [2] at the National University of Ireland, Galway [3], invites applications for a postdoctoral position in emotion analysis.

The position is mainly associated with the EU funded project MixedEmotions, which will implement an integrated Big Linked Data platform for emotion analysis across heterogeneous data sources, languages and modalities. The MixedEmotions platform will provide an integrated solution for: i) large-scale emotion analysis and fusion on heterogeneous, multilingual, text, speech, video and social media data streams, leveraging open access and proprietary data sources, exploiting also social context by leveraging social network graphs; ii) semantic-level emotion information aggregation and integration through robust extraction of social semantic knowledge graphs for emotion analysis along multidimensional clusters. The platform will be developed and evaluated in the context of three cross-domain Pilot Projects that are representative of a variety of data analytics markets: Social TV, Brand Reputation Management, and Call Centre Operations.

The open position will be concerned primarily with the text mining aspects of the project, in particular emotion analysis from and across text in multiple languages. Candidates should have a PhD degree in a relevant field of study with an emphasis on areas such as text mining, natural language processing, computational linguistics, machine learning etc. The position is for a fixed period of up to 24 months with the possibility of extension, depending on successful acquisition of project funding in which the selected candidate will be expected to actively participate.

The successful applicant will be required to travel to project meetings at various locations in Europe, and will need to collaborate and cooperate with other project partners, from various disciplines.

Salary range: €37k – €42k per annum, (commensurate with qualifications and experience)

Please send your application (CV, cover letter, both in PDF only) before the closing date of March 22nd, 2015 to Dr. Paul Buitelaar: paul.buitelaar@insight-centre.org

[1] http://nlp.insight-centre.org
[2] https://www.insight-centre.org
[3] http://www.nuigalway.ie

vendredi 6 mars 2015

Journée des anciens du cursus 2015

L'édition 2015 de la journée des anciens du cursus LI est prévue pour le samedi 11 avril, à la Halle aux farines, salle 247E (pour y accéder le plus simplement, choisir l'escalier C en entrant dans le bâtiment par le 16 rue Françoise Dolto).

Au programme, comme l'année dernière, des exposés d'anciens du cursus, des exposés de professionnels du domaine, et un exposé invité.
Le programme est en cours de réalisation, sous la responsabilité d'Adrien Roux (M1 LI) et Olga Seminck (M2 LI). Si vous avez des suggestions ou des questions, vous pouvez vous adresser à eux (m'envoyer un message, je transmettrai).
[edit: le programme est en ligne]

jeudi 5 mars 2015

Exposé : Pierre Magistry, Stratification du réseau lexical du hokkien de Taïwan

Un exposé d'un ancien du cursus LI, qui applique des méthodes de TAL assez puissantes (construction semi-automatique de graphes lexicaux) dans une problématique de linguistique historique. C'est mercredi prochain 11 mars, au CRLAO, de 16h à 18h, à l'INaLCO, Salle des Plaques, 2, rue de Lille, 75007 Paris.


Pierre Magistry (Paris Diderot):  
Stratification du réseau lexical du hokkien de Taïwan

Taiwanese Hokkien presents strong evidences of multiple historical layers of borrowing through the pervasiveness of 「多音字」duoyinzi, sinograms with multiple readings. For a given sinogram, traditional analysis distinguish between wenduyin 文讀音 and baiduyin 白讀音 (so-called "literary" and "colloquial" readings) but it is well accepted that more than two strata are to be found and described.
We will both stress the limits of such analysis and explain how we can still benefit from it.
Fortunately, a large amount of lexical data for Taiwanese Hokkien is available as Open Data. We will propose a method to (semi-) automatically model and explore the Taiwanese lexicon in search of such strata.
Our method is based on the modelisation of the lexicon as a complex network .
We will first introduce all needed theoretical aspects of our modelisation (so that no prior knowledge in graph theory is required to attend this presentation). Then we will explain how we can rely on graph theory to create a model of the lexical data as a graph that takes into account the traditional analysis of 文讀音 and 白讀音. Once the model is created, we will show how it can be analysed and explored in search of lexical strata using community detection and advanced visualisation tools.

Exposé au colloquium du DEC (ENS): Mark Steedman

Mark Steedman, personnalité reconnue en linguistique formelle et en TAL, va présenter des travaux dans le cadre du colloquium du DEC (ENS), mardi prochain 10 mars. L'exposé est intitulé "Statistical Parsing and Interpretation for Jazz Chord Sequences".


Mardi 10 mars, 11h30-13h00, salle Langevin, 29, rue d'Ulm.

Abstract:
The paper describes work with Mark Granroth-Wilding on the problem of parsing and interpreting chord sequences using a grammar of tonal harmony. The grammar is drawn from the same "nearly context-free" class that is strongly adequate for natural languages, and supports a model theory of harmony. Though the grammar is much smaller than language grammars, the degree of ambiguity is much greater, in the sense that any chord can have an unboundedly large number of increasingly preposterous interpretations. Parsing requires the use of a supervised statistical model to limit search, of the same kind that is required for parsing natural language at scale. We evaluate its performance on held-out data against a baseline Markov model, which it outperforms, showing that the grammar is doing useful cognitive work.

http://www.cognition.ens.fr/ColloquiumAgenda.html


mardi 17 février 2015

Recrutements au centre de traduction des organes de l'Union européenne

Centre de traduction des organes de l'Union européenne (Luxembourg) organise une procédure de sélection afin de constituer une liste de réserve pour le recrutement (contrat de longue durée) d’agents contractuels polyvalents en qualité d’agents techniques de traduction, pour répondre aux besoins de mon service, la section Support linguistique et technologique du département Support à la traduction.

http://cdt.europa.eu/FR/jobs/Pages/Jobs-opportunities.aspx

la date limite pour l'inscription en ligne est fixée au 23 février 2015 et non au 13 février 2015, contrairement à ce qui est indiqué dans l'offre d'emploi en français (fichier au format pdf).  


On me signale aussi l'ouverture de postes de stagiaire au sein du Centre de traduction des organes de l'Union européenne.

http://cdt.europa.eu/FR/jobs/Pages/Trainee-positions.aspx

mardi 10 février 2015

Trouver le bon stage

Le SAOIP organise des nouveaux ateliers "Trouver le bon stage" animés par le bureau des stages.
Attention, les places sont limitées à 15 étudiants par atelier !


Prochaines dates :

FÉVRIER 2015 :
Mardi 3 février 13h30 à 16h
Jeudi 5 févier 10h30 à 13h
Vendredi 6 février 9h30 à 12h
Mardi 10 février 9h à 11h30
Jeudi 12 février 14h à 16h30
Mardi 17 février 16h à 18h30
Mercredi 18 février 14h30 à 17h
Vendredi 20 février 11h à 13h30
Mardi 24 février 14h30 à 17h
Mercredi 25 février 17h30 à 20h
Vendredi 27 février 13h30 à 16h


Ateliers Diderot Avenirs

jeudi 5 février 2015

On recherche volontaires locuteurs natifs du mandarin

Pour un projet de recherche en linguistique à Paris Diderot, on recherche des des volontaires natifs du mandarin pour passer une expérience qui a comme sujet le rôle de la mémoire de travail dans la production et réception des phrases. Cela se déroule au bâtiment Olympe de Gouges (Paris 13e).

Les volontaires chinois doivent avoir comme langue maternelle le mandarin et non le cantonais. Comme l'expérience est en mandarin, il n'y a pas de niveau requis en français.

L'expérience, en mandarin consiste en trois étapes :
  • une expérience de Eye-Tracking (enregistrement des mouvements oculaires)
  • un test de mémoire
  • un test de fluence verbale                                                                       
L'expérience durera environ 40 minutes et chaque participant sera payé 8 euros. Les résultats resteront bien entendu confidentiels.
Les expériences ont lieu en ce moment même à l'université et les horaires sont à définir avec les participants.                                                              
                                                                                                   
Les personnes intéressées sont priées de contacter par mail celine.pozniak@gmail.com avec comme objet : expérience linguistique

Cette expérience ne concerne pas les personnes ayant déjà fait uneexpérience de deux heures en début d'année.

mardi 3 février 2015

Poste de doctorant à Lund (linguistique française)

L'université de Lund et le Centre de langues et de littérature mettent au concours un poste de doctorant en linguistique française à 100% pendant 4 ans, à commencer le 1er septembre 2015.
Date limite de candidature : le 2 mars 2015

Le plan d'étude spécifie les types de profils souhaités : le profil de Linguistique Française concerne les différentes variantes et usages du français. La recherche peut être aussi bien synchronique que diachronique, et porter sur des aspects relevant de la sémantique, de la syntaxe, de l'analyse de discours, de la politique linguistique, de l'apprentissage et de l'enseignement des langues.

Pour plus d'information (critère d'admission, éligibilité, etc.) se reporter au document suivant.

Portail de recrutement

mercredi 28 janvier 2015

Attention aux éditeurs-prédateurs

De plus en plus de jeunes docteurs sont tentés par une publication de leur thèse auprès d'éditeurs peu scrupuleux qui leur proposent, en quelques clics, et avec un délai de quelques semaines, une publication de leur thèse et l'obtention d'un numéro ISSN.

Il est important de rappeler que ce type de publication, où la qualité du travail n'est pas évaluée par des pairs, où le travail d'édition matérielle lui-même est réduit au minimum (en général le fichier PDF soumis est publié sans révision), n'est jamais considéré comme une publication scientifique, et ne peut que nuire aux auteurs (perte de copyright, frais indus, perte de réputation).

Pendant la dernière session de qualification au CNU, j'ai pu constater que le nombre de candidats abusés par ces éditeurs augmente, et je ne peux qu'inviter les auteurs à faire preuve de discernement et à se renseigner avant de s'embarquer, par exemple en consultant l'article suivant.

[edit 18/02] En voici un par exemple qui prétend procéder à une évaluation par des pairs alors que c'est plus que douteux : www.sciencepublishinggroup.com.

[edit 27/02] En voici encore un autre, qui n'hésite pas à proclamer sur sa page web: "publish your paper! It's free" : www.publicscienceframework.org.

[edit 17/05] Encore un autre qui fait du harcèlement en exploitant les listes de conférenciers de conférences récentes: là encore, on y annonce que pour les membres, la publication est gratuite dans 27 revues scientifiques : www.aascit.org

Méfiance, méfiance !