Program - Dataset Creation for Lower-Resourced Languages 2022 within LREC2022

LREC 2022 Proceedings Home | Workshops | LREC 2022 WEBSITE | ELRA WEBSITE

Dataset Creation for Lower-Resourced Languages 2022 within LREC2022

PROGRAM

	SyntAct: A Synthesized Database of Basic Emotions Felix Burkhardt, Florian Eyben and Björn Schuller
	Data Sets of Eating Disorders by Categorizing Reddit and Tumblr Posts: A Multilingual Comparative Study Based on Empirical Findings of Texts and Images Christina Baskal, Amelie Elisabeth Beutel, Jessika Keberlein, Malte Ollmann, Esra Üresin, Jana Vischinski, Janina Weihe, Linda Achilles and Christa Womser-Hacker
	Construction and Validation of a Japanese Honorific Corpus Based on Systemic Functional Linguistics Muxuan Liu and Ichiro Kobayashi
	Building an Icelandic Entity Linking Corpus Steinunn Rut Friðriksdóttir, Valdimar Ágúst Eggertsson, Benedikt Geir Jóhannesson, Hjalti Daníelsson, Hrafn Loftsson and Hafsteinn Einarsson
	Crawling Under-Resourced Languages - a Portal for Community-Contributed Corpus Collection Erik Körner, Felix Helfer, Christopher Schröder, Thomas Eckart and Dirk Goldhahn
	Fine-grained Entailment: Resources for Greek NLI and Precise Entailment Eirini Amanaki, Jean-Philippe Bernardy, Stergios Chatzikyriakidis, Robin Cooper, Simon Dobnik, Aram Karimi, Adam Ek, Eirini Chrysovalantou Giannikouri, Vasiliki Katsouli, Ilias Kolokousis, Eirini Chrysovalantou Mamatzaki, Dimitrios Papadakis, Olga Petrova, Erofili Psaltaki, Charikleia Soupiona, Effrosyni Skoulataki and Christina Stefanidou
	Words.hk: A Comprehensive Cantonese Dictionary Dataset with Definitions, Translations and Transliterated Examples Chaak-ming Lau, Grace Wing-yan Chan, Raymond Ka-wai Tse and Lilian Suet-ying Chan
	LiSTra Automatic Speech Translation: English to Lingala Case Study Salomon Kabongo Kabenamualu, Vukosi Marivate and Herman Kamper
	Ara-Women-Hate: An Annotated Corpus Dedicated to Hate Speech Detection against Women in the Arabic Community Imane Guellil, Ahsan Adeel, Faical Azouaou, Mohamed Boubred, Yousra Houichi and Akram Abdelhaq Moumna
	Word-level Language Identification Using Subword Embeddings for Code-mixed Bangla-English Social Media Data Aparna Dutta