Entity

WhoSaidIt: Human-LLM Collaborative Annotation for Text-Based Multilingual Speaker-Attribute Classification

Annotating speaker attributes from text is inherently ambiguous, particularly in multilingual settings where demographic and social cues are implicit and culturally variable. We propose a human-large language model (LLM) collaborative re-annotation framework for stabilizing multilingual speaker-attribute labels under practical resource constraints. Starting from a noisy corpus, we use LLMs to surface recurring annotation rationales through iterative interaction with experts, and apply disagreeme

Paper · arXiv

cs.CL

Authors: Lingyu Gao, Will Monroe, David Smith, Meghan Jemison, Jackie Lee
Published: 2026-05-25

Abstract ↗

via arXiv · 2605.2607