Program - The Third Ukrainian Natural Language Processing Workshop

The Third Ukrainian Natural Language Processing Workshop

PROGRAM

Saturday, May 25, 2024
	09:00–10:30 Morning session 1: New Datasets # %chair1 Mariana Romanyshyn
09:10–09:25	A Contemporary News Corpus of Ukrainian (CNC-UA): Compilation, Annotation, Publication Stefan Fischer, Kateryna Haidarzhyi, Jörg Knappen, Olha Polishchuk, Yuliya Stodolinska and Elke Teich
09:25–09:40	Introducing the Djinni Recruitment Dataset: A Corpus of Anonymized CVs and Job Postings Nazarii Drushchak and Mariana Romanyshyn
09:40–09:55	Creating Parallel Corpora for Ukrainian: A German-Ukrainian Parallel Corpus (ParaRook\|\|DE-UK) Maria Shvedova and Arsenii Lukashevskyi
09:55–10:10	Introducing NER-UK 2.0: A Rich Corpus of Named Entities for Ukrainian Dmytro Chaplynskyi and Mariana Romanyshyn
	10:30–11:00 Coffee break
	11:00–13:00 Morning session 2: New Directions # %chair1 Oleksii Ignatenko
11:00–11:20	Instant Messaging Platforms News Multi-Task Classification for Stance, Sentiment, and Discrimination Detection Taras Ustyianovych and Denilson Barbosa
11:20–11:35	Setting up the Data Printer with Improved English to Ukrainian Machine Translation Yurii Paniv, Dmytro Chaplynskyi, Nikita Trynus and Volodymyr Kyrylov
11:35–11:55	Automated Extraction of Hypo-Hypernym Relations for the Ukrainian WordNet Nataliia Romanyshyn, Dmytro Chaplynskyi and Mariana Romanyshyn
11:55–12:10	Ukrainian Visual Word Sense Disambiguation Benchmark Yurii Laba, Yaryna Mohytych, Ivanna Rohulia, Halyna Kyryleyza, Hanna Dydyk-Meush, Oles Dobosevych and Rostyslav Hryniv
	13:00–14:00 Lunch
	14:00–16:00 Afternoon session: LLMs for Ukrainian # %chair1 Mariana Romanyshyn
14:00–14:15	The UNLP 2024 Shared Task on Fine-Tuning Large Language Models for Ukrainian Mariana Romanyshyn, Oleksiy Syvokon and Roman Kyslyi
14:15–14:35	Fine-Tuning and Retrieval Augmented Generation for Question Answering Using Affordable Large Language Models Tiberiu Boros, Radu Chivereanu, Stefan Dumitrescu and Octavian Purcaru
14:35–14:55	From Bytes to Borsch: Fine-Tuning Gemma and Mistral for the Ukrainian Language Representation Artur Kiulian, Anton Polishko, Mykola Khandoga, Oryna Chubych, Jack Connor, Raghav Ravishankar and Adarsh Shirawalmath
14:55–15:15	Spivavtor: An Instruction Tuned Ukrainian Text Editing Model Aman Saini, Artem Chernodub, Vipul Raheja and Vivek Kulkarni
15:15–15:35	Eval-UA-tion 1.0: Benchmark for Evaluating Ukrainian (Large) Language Models Serhii Hamotskyi, Anna-Izabella Levbarg and Christian Hänig
15:35–15:55	LiBERTa: Advancing Ukrainian Language Modeling through Pre-training from Scratch Mykola Haltiuk and Aleksander Smywiński-Pohl
	16:00–16:30 Coffee break
	16:30–18:00 Afternoon session: LLMs for Ukrainian # %chair1 Oleksii Ignatenko
16:30–16:45	Entity Embellishment Mitigation in LLMs Output with Noisy Synthetic Dataset for Alignment Svitlana GALESHCHUK
16:45–17:00	Language-Specific Pruning for Efficient Reduction of Large Language Models Maksym Shamrai

The Third Ukrainian Natural Language Processing Workshop

Saturday, May 25, 2024