Entity

MedCase-Structured: A Text-to-FHIR Dataset for Benchmarking Diagnostic Reasoning in Clinically Realistic EHR Settings

Large language models (LLMs) show promise for clinical reasoning and decision support, but evaluation in realistic, electronic health record-congruent settings remains limited. Existing benchmarks often rely on static datasets or unstructured inputs that do not reflect the structured, interoperable data formats used in clinical systems. We introduce a pipeline for generating clinically realistic HL7 FHIR R4 bundles from unstructured text, enabling controllable evaluation of clinical decision sup

Paper · arXiv

cs.CL

Authors: Valentina Bui Muti, Eugénie Dulout, Ziquan Fu
Published: 2026-05-28
Categories: cs.CLcs.AI

Abstract ↗

via arXiv · 2605.30295