Papers

Publications HAL du projet européen COMPRISE

2021

Journal articles

titre
MasakhaNER: Named entity recognition for African languages
auteur
David Adelani, Jade Abbott, Graham Neubig, Daniel d’Souza, Julia Kreutzer, Constantine Lignos, Chester Palen-Michel, Happy Buzaaba, Shruti Rijhwani, Sebastian Ruder, Stephen Mayhew, Israel Abebe Azime, Shamsuddeen Muhammad, Chris Chinenye Emezue, Joyce Nakatumba-Nabende, Perez Ogayo, Anuoluwapo Aremu, Catherine Gitau, Derguene Mbaye, Jesujoba Alabi, Seid Yimam, Tajuddeen Rabiu Gwadabe, Ignatius Ezeani, Rubungo Niyongabo, Jonathan Mukiibi, Verrah Otiende, Iroro Orife, Davis David, Samba Ngom, Tosin Adewumi, Paul Rayson, Mofetoluwa Adeyemi, Gerald Muriuki, Emmanuel Anebi, Chiamaka Chukwuneke, Nkiruka Odu, Eric Wairagala, Samuel Oyerinde, Clemencia Siro, Tobius Saul Bateesa, Temilola Oloyede, Yvonne Wambui, Victor Akinode, Deborah Nabagereka, Maurice Katusiime, Ayodele Awokoya, Mouhamadane Mboup, Dibora Gebreyohannes, Henok Tilaye, Kelechi Nwaike, Degaga Wolde, Abdoulaye Faye, Blessing Sibanda, Orevaoghene Ahia, Bonaventure Dossou, Kelechi Ogueji, Ibrahima Thierno, Abdoulaye Diallo, Adewale Akinfaderin, Tendai Marengereke, Salomey Osei
article
Transactions of the Association for Computational Linguistics, The MIT Press, 2021, ⟨10.1162/tacl⟩
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-03350962/file/adelani_TACL2021.pdf BibTex
titre
Monolingual and cross-lingual intent detection without training data in target languages
auteur
Jurgita Kapočiūtė-Dzikienė, Askars Salimbajevs, Raivis Skadiņš
article
Electronics, MDPI, 2021, 10, ⟨10.3390/electronics10121412⟩
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-03351013/file/kapociute-dzikiene_Electronics2021.pdf BibTex
titre
Anonymisation and re-identification risk for voice data
auteur
Alvaro Moretón, Ariadna Jaramillo
article
European Data Protection Law Review, Lexxion, 2021, 7, pp.274 – 284. ⟨10.21552/edpl/2021/2/20⟩
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-03285763/file/moreton_EDPL2021.pdf BibTex

Conference papers

titre
Preventing author profiling through zero-shot multilingual back-translation
auteur
David Adelani, Miaoran Zhang, Xiaoyu Shen, Ali Davody, Thomas Kleinbauer, Dietrich Klakow
article
2021 Conference on Empirical Methods in Natural Language Processing (EMNLP), Nov 2021, Punta Cana, Dominica
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-03350906/file/adelani_EMNLP2021.pdf BibTex
titre
The effect of domain and diacritics in Yorùbá-English neural machine translation
auteur
David Adelani, Dana Ruiter, Jesujoba Alabi, Damilola Adebonojo, Adesina Ayeni, Mofetoluwa Adeyemi, Ayodele Awokoya, Cristina Espana-Bonet
article
18th Biennial Machine Translation Summit, Aug 2021, Orlando, United States
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-03350967/file/adelani_MTSummit2021.pdf BibTex
titre
Anonymous speaker clusters: Making distinctions between anonymised speech recordings with clustering interface
auteur
Benjamin O’Brien, Natalia Tomashenko, Anaïs Chanclu, Jean-François Bonastre
article
INTERSPEECH 2021, Aug 2021, Brno, Czech Republic
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-03267084/file/Linkablity_INTERSPEECH_2021.pdf BibTex

Preprints, Working Papers, …

titre
Benchmarking and challenges in security and privacy for voice biometrics
auteur
Jean-Francois Bonastre, Hector Delgado, Nicholas Evans, Tomi Kinnunen, Kong Aik Lee, Xuechen Liu, Andreas Nautsch, Paul-Gauthier Noe, Jose Patino, Md Sahidullah, Brij Mohan Lal Srivastava, Massimiliano Todisco, Natalia Tomashenko, Emmanuel Vincent, Xin Wang, Junichi Yamagishi
article
2021
Accès au bibtex
https://arxiv.org/pdf/2109.00281 BibTex
titre
Enhancing Speech Privacy with Slicing
auteur
Mohamed Maouche, Brij Mohan Lal Srivastava, Nathalie Vauquier, Aurélien Bellet, Marc Tommasi, Emmanuel Vincent
article
2021
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-03369137/file/main.pdf BibTex
titre
Training RNN Language Models on Uncertain ASR Hypotheses in Limited Data Scenarios
auteur
Imran Sheikh, Emmanuel Vincent, Irina Illina
article
2021
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-03327306/file/cn2lm_manuscript.pdf BibTex
titre
Transformer versus LSTM Language Models Trained on Uncertain ASR Hypotheses in Limited Data Scenarios
auteur
Imran Sheikh, Emmanuel Vincent, Irina Illina
article
2021
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-03362828/file/ICASSP2022_Transformer_LM_01102021.pdf BibTex
titre
Privacy and utility of x-vector based speaker anonymization
auteur
Brij Mohan Lal Srivastava, Mohamed Maouche, Md Sahidullah, Emmanuel Vincent, Aurélien Bellet, Marc Tommasi, Natalia Tomashenko, Xin Wang, Junichi Yamagishi
article
2021
Accès au bibtex
BibTex
titre
Supplementary material to the paper The VoicePrivacy 2020 Challenge: Results and findings
auteur
Natalia Tomashenko, Xin Wang, Emmanuel Vincent, Jose Patino, Brij Mohan Lal Srivastava, Paul-Gauthier Noé, Andreas Nautsch, Nicholas Evans, Junichi Yamagishi, Benjamin O’Brien, Anaïs Chanclu, Jean-François Bonastre, Massimiliano Todisco, Mohamed Maouche
article
2021
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-03335126/file/VoicePrivacy_supplementary.pdf BibTex
titre
The VoicePrivacy 2020 Challenge: Results and findings
auteur
Natalia Tomashenko, Xin Wang, Emmanuel Vincent, Jose Patino, Brij Mohan Lal Srivastava, Paul-Gauthier Noé, Andreas Nautsch, Nicholas Evans, Junichi Yamagishi, Benjamin O’Brien, Anaïs Chanclu, Jean-François Bonastre, Massimiliano Todisco, Mohamed Maouche
article
2021
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-03332224/file/VoicePrivacyCSL_hal.pdf BibTex
titre
Adapting Language Models When Training on Privacy-Transformed Data
auteur
Mehmet Ali Tugtekin Turan, Dietrich Klakow, Emmanuel Vincent, Denis Jouvet
article
2021
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-03189354/file/Paper_1854.pdf BibTex

2020

Journal articles

titre
How can private information recorded by voice-enabled systems be identified?
auteur
Álvaro Moretón, Ariadna Jaramillo
article
European Data Protection Law Review, Lexxion, 2020, 6 (3), pp.464-469. ⟨10.21552/edpl/2020/3/17⟩
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-02909106/file/moreton_EDPL20.pdf BibTex
titre
Peut-on faire confiance aux IA ?
auteur
Emmanuel Vincent
article
The Conversation, The Conversation France, 2020
Accès au bibtex
BibTex

Conference papers

titre
Privacy guarantees for de-identifying text transformations
auteur
David Adelani, Ali Davody, Thomas Kleinbauer, Dietrich Klakow
article
INTERSPEECH 2020, Oct 2020, Shanghai, China
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-02907939/file/adelani_IS20.pdf BibTex
titre
Distant supervision and noisy label learning for low resource named entity recognition: A study on Hausa and Yorùbá
auteur
David Ifeoluwa Adelani, Michael Hedderich, Dawei Zhu, Esther van den Berg, Dietrich Klakow
article
ICLR Workshops (AfricaNLP & PML4DC 2020), Apr 2020, Addis Ababa, Ethiopia
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-03359111/file/adelani_AfricaNLP2020.pdf BibTex
titre
Data augmentation for pipeline-based speech translation
auteur
Diego Alves, Askars Salimbajevs, Mārcis Pinnis
article
9th International Conference on Human Language Technologies – the Baltic Perspective (Baltic HLT 2020), Sep 2020, Kaunas, Lithuania
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-02907053/file/Data_Augmentation_for_Pipeline_Based_Speech_Translation.pdf BibTex
titre
Private Protocols for U-Statistics in the Local Model and Beyond
auteur
James Bell, Aurélien Bellet, Adrià Gascón, Tejas Kulkarni
article
AISTATS 2020 – 23rd International Conference on Artificial Intelligence and Statistics, Aug 2020, Palermo, Italy
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-02310236/file/aistats20_privacy.pdf BibTex
titre
Who started this rumor? Quantifying the natural differential privacy guarantees of gossip protocols
auteur
Aurélien Bellet, Rachid Guerraoui, Hadrien Hendrikx
article
DISC 2020 – 34th International Symposium on Distributed Computing, Oct 2020, Freiburg / Virtual, Germany
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-02166432/file/1902.07138%20%281%29.pdf BibTex
titre
Transfer learning and distant supervision for multilingual Transformer models: A study on African languages
auteur
Michael Hedderich, David Adelani, Dawei Zhu, Jesujoba Alabi, Udia Markus, Dietrich Klakow
article
2020 Conference on Empirical Methods in Natural Language Processing (EMNLP), Nov 2020, Punta Cana, Dominica
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-03350901/file/hedderich_EMNLP2020.pdf BibTex
titre
Assessing Unintended Memorization in Neural Discriminative Sequence Models
auteur
Mossad Helali, Thomas Kleinbauer, Dietrich Klakow
article
23rd International Conference on Text, Speech and Dialogue, Sep 2020, Brno, Czech Republic
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-02880581/file/HelaliM%2B20.pdf BibTex
titre
A comparative study of speech anonymization metrics
auteur
Mohamed Maouche, Brij Mohan Lal Srivastava, Nathalie Vauquier, Aurélien Bellet, Marc Tommasi, Emmanuel Vincent
article
INTERSPEECH 2020, Oct 2020, Shanghai, China
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-02907918/file/anonymization_metrics_IS2020.pdf BibTex
titre
Using privacy-transformed speech in the automatic speech recognition acoustic model training
auteur
Askars Salimbajevs
article
9th International Conference on Human Language Technologies – the Baltic Perspective (Baltic HLT 2020), Sep 2020, Kaunas, Lithuania
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-02907056/file/Voice_privacy_transform_ASR.pdf BibTex
titre
On semi-supervised LF-MMI training of acoustic models with limited data
auteur
Imran Sheikh, Emmanuel Vincent, Irina Illina
article
INTERSPEECH 2020, Oct 2020, Shanghai, China
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-02907924/file/is20_wsl_310720.pdf BibTex
titre
The COMPRISE Cloud Platform
auteur
Raivis Skadiņš, Askars Salimbajevs
article
1st International Workshop on Language Technology Platforms, May 2020, Marseille, France
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-02557954/file/COMPRISE%20cloud%20at%20IWLTP%202020.pdf BibTex
titre
Evaluating Voice Conversion-based Privacy Protection against Informed Attackers
auteur
Brij Mohan Lal Srivastava, Nathalie Vauquier, Md Sahidullah, Aurélien Bellet, Marc Tommasi, Emmanuel Vincent
article
ICASSP 2020 – 45th International Conference on Acoustics, Speech, and Signal Processing, IEEE Signal Processing Society, May 2020, Barcelona, Spain. pp.2802-2806
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-02355115/file/ppvc_final.pdf BibTex
titre
Design Choices for X-vector Based Speaker Anonymization
auteur
Brij Mohan Lal Srivastava, Natalia Tomashenko, Xin Wang, Emmanuel Vincent, Junichi Yamagishi, Mohamed Maouche, Aurélien Bellet, Marc Tommasi
article
INTERSPEECH 2020, International Speech Communication Association (ISCA), Oct 2020, Shanghai, China
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-02610447/file/design_choices_cameraready.pdf BibTex
titre
Investigating the Impact of Pre-trained Word Embeddings on Memorization in Neural Networks
auteur
Aleena Thomas, David Adelani, Ali Davody, Aditya Mogadala, Dietrich Klakow
article
23rd International Conference on Text, Speech and Dialogue, Sep 2020, brno, Czech Republic
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-02880590/file/ThomasA%2B20.pdf BibTex
titre
Introducing the VoicePrivacy initiative
auteur
Natalia Tomashenko, Brij Mohan Lal Srivastava, Xin Wang, Emmanuel Vincent, Andreas Nautsch, Junichi Yamagishi, Nicholas Evans, Jose Patino, Jean-François Bonastre, Paul-Gauthier Noé, Massimiliano Todisco
article
INTERSPEECH 2020, Oct 2020, Shanghai, China
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-02562199/file/IS_2020_VP_challenge_camera_ready.pdf BibTex
titre
Achieving Multi-Accent ASR via Unsupervised Acoustic Model Adaptation
auteur
Mehmet Ali Tuğtekin Turan, Emmanuel Vincent, Denis Jouvet
article
INTERSPEECH 2020, Oct 2020, Shanghai, China
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-02907929/file/cameraReady_2742.pdf BibTex
titre
Fully Decentralized Joint Learning of Personalized Models and Collaboration Graphs
auteur
Valentina Zantedeschi, Aurélien Bellet, Marc Tommasi
article
AISTATS 2020 – The 23rd International Conference on Artificial Intelligence and Statistics, Aug 2020, Palerme / Virtual, Italy
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-03100057/file/aistats20_graph.pdf BibTex

Poster communications

titre
Distributed Differentially Private Averaging with Improved Utility and Robustness to Malicious Parties
auteur
César Sabater, Aurélien Bellet, Jan Ramon
article
NeurIPS 2020 workshop on Privacy Preserving Machine Learning – PriML and PPML Joint Edition, Dec 2020, Vancouver (Virtual Workshop), Canada
Accès au bibtex
https://arxiv.org/pdf/2006.07218 BibTex
titre
Échange de bruit corrélé pour le calcul distribué de moyenne avec garanties de confidentialité différentielle
auteur
César Sabater, Aurélien Bellet, Jan Ramon
article
Conférence sur l’Apprentissage Automatique 2020, Jun 2020, Vannes (Virtual), France
Accès au bibtex
https://arxiv.org/pdf/2006.07218 BibTex

Preprints, Working Papers, …

titre
Privacy Amplification by Decentralization
auteur
Edwige Cyffers, Aurélien Bellet
article
2020
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-03100005/file/2012.05326.pdf BibTex
titre
Distributed Differentially Private Averaging with Improved Utility and Robustness to Malicious Parties
auteur
César Sabater, Aurélien Bellet, Jan Ramon
article
2020
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-03100019/file/2006.07218.pdf BibTex

2019

Conference papers

titre
Privacy-Preserving Adversarial Representation Learning in ASR: Reality or Illusion?
auteur
Brij Mohan Lal Srivastava, Aurélien Bellet, Marc Tommasi, Emmanuel Vincent
article
INTERSPEECH 2019 – 20th Annual Conference of the International Speech Communication Association, Sep 2019, Graz, Austria
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-02166434/file/srivastava_IS19.pdf BibTex

Comments are closed.