Langanzeige der Metadaten
DC ElementWertSprache
dc.contributor.authorHrycyk, Lianna-
dc.contributor.authorZarcone, Alessandra-
dc.contributor.authorHahn, Luzian-
dc.date.accessioned2021-09-21T07:32:06Z-
dc.date.available2021-09-21T07:32:06Z-
dc.date.issued2021-09-
dc.identifier.urihttps://fordatis.fraunhofer.de/handle/fordatis/213-
dc.identifier.urihttp://dx.doi.org/10.24406/fordatis/140-
dc.description.abstractThe inCLINC dataset (incremental intent annotations of the CLINC dataset) contains 121 distinct utterances (queries directed to a voice assistant) in their complete form and in partial form for a total of 538 utterances, which were labeled with intent categories in a crowdsourcing study by 126 coders. The tagset consisted of 37 intent categories plus one out-of-scope category. Each utterance was annotated by 6 to 9 coders. To refer to inCLINC in any publication, please cite the following paper: Hrycyk, L., Zarcone, A., & Hahn, L. (2021). Not So Fast, Classifier – Accuracy and Entropy Reduction in Incremental Intent Classification. In Proceedings of the 3rd Workshop on NLP for Conversational AI (NLP4ConvAI 2021).en
dc.language.isoenen
dc.rights.urihttps://creativecommons.org/licenses/by/4.0/en
dc.subjectintenten
dc.subjectincrementalityen
dc.subjectdialogue dataen
dc.subjectNLUen
dc.subjectvoice assistantsen
dc.subjectcrowdsourcingen
dc.subject.ddcDDC::400 Spracheen
dc.subject.ddcDDC::000 Informatik, Informationswissenschaft, allgemeine Werkeen
dc.titleinCLINC: incremental intent annotations of the CLINC dataseten
dc.typeTextual Dataen
dc.contributor.funderBundesministerium fur Wirtschaft und Energie BMWi (Deutschland)en
fordatis.instituteIIS Fraunhofer-Institut für Integrierte Schaltungenen
fordatis.project.fhgid210011en
fordatis.rawdatafalseen
fordatis.sponsorship.FundingProgrammeInnovationswettbewerb "Künstliche Intelligenz als Treiber für volkswirtschaftlich relevante Ökosysteme"en
fordatis.sponsorship.projectidFKZ 01MK20011Aen
fordatis.sponsorship.projectnameSPEAKER - Aufbau einer führenden Sprachassistenzplattform ”Made in Germany”en
fordatis.sponsorship.projectacronymSPEAKERen
fordatis.date.start2020-10-
fordatis.date.end2020-12-
Enthalten in den Sammlungen:Fraunhofer-Institut für Integrierte Schaltungen IIS

Dateien zu dieser Ressource:
Datei Beschreibung GrößeFormat 
data_entropy_reduction_majority.csvthe main dataset78,71 kBCSVÖffnen/Download
user_responses.csvall labels assigned to each stimulus85,14 kBCSVÖffnen/Download
README.md2,37 kBUnknownÖffnen/Download


Diese Ressource wurde unter folgender Copyright-Bestimmung veröffentlicht: Lizenz von Creative Commons Creative Commons