GiCCS: A German in-Context Conversational Similarity Benchmark

Asaadi, Shima; Kolagar, Zahra; Liebel, Alina; Zarcone, Alessandra

Langanzeige der Metadaten

DC Element	Wert	Sprache
dc.contributor.author	Asaadi, Shima	-
dc.contributor.author	Kolagar, Zahra	-
dc.contributor.author	Liebel, Alina	-
dc.contributor.author	Zarcone, Alessandra	-
dc.date.accessioned	2022-12-15T10:45:35Z	-
dc.date.available	2022-12-15T10:45:35Z	-
dc.date.issued	2022-10-31	-
dc.identifier.uri	https://fordatis.fraunhofer.de/handle/fordatis/293	-
dc.identifier.uri	http://dx.doi.org/10.24406/fordatis/226	-
dc.description.abstract	The Semantic textual similarity (STS) task is commonly used to evaluate the semantic representations that language models (LMs) learn from texts, under the assumption that good-quality representations will yield accurate similarity estimates. When it comes to estimating the similarity of two utterances in a dialogue, however, the conversational context plays a particularly important role. We argue for the need of benchmarks specifically created using conversational data in order to evaluate conversational LMs in the STS task. We introduce GiCCS, a first conversational STS evaluation benchmark for German. We collected the similarity annotations for GiCCS using best-worst scaling and presenting the target items in context, in order to obtain highly-reliable context-dependent similarity scores. We present benchmarking experiments for evaluating LMs on capturing the similarity of utterances. Results suggest that pretraining LMs on conversational data and providing conversational context can be useful for capturing similarity of utterances in dialogues. GiCCS will be publicly available to encourage benchmarking of conversational LMs.	en
dc.language.iso	de	en
dc.rights.uri	https://creativecommons.org/licenses/by-nc-nd/3.0/	en
dc.subject	STS	en
dc.subject	semantic textual similarity	en
dc.subject	conversational dataset	en
dc.subject	STS benchmark	en
dc.title	GiCCS: A German in-Context Conversational Similarity Benchmark	en
dc.type	Textual Data	en
dc.contributor.funder	Bundesministerium für Wirtschaft und Klimaschutz BMWK (Deutschland)	en
fordatis.bibliographicCitation.doi	10.5281/zenodo.7266256	en
fordatis.bibliographicCitation.issued	2022-10-31	-
fordatis.bibliographicCitation.place	The GEM 💎 Workshop at EMNLP 2022	en
fordatis.bibliographicCitation.uri	https://zenodo.org/record/7266256#.Y2OmG8HMKbs	en
fordatis.institute	IIS Fraunhofer-Institut für Integrierte Schaltungen	en
fordatis.rawdata	false	en
fordatis.sponsorship.projectid	FKZ 01MK19011	en
fordatis.sponsorship.projectname	SPEAKER	en
Enthalten in den Sammlungen:	Fraunhofer-Institut für Integrierte Schaltungen IIS

Dateien zu dieser Ressource:

Datei	Beschreibung	Größe	Format
GiCCS.zip	A German in-Context Conversational Similarity Benchmark	26,35 kB	ZIP	Öffnen/Download

Zur Kurzanzeige

Diese Ressource wurde unter folgender Copyright-Bestimmung veröffentlicht: Lizenz von Creative Commons