Matches in Data.gov.be for { <http://data.gov.be/.well-known/genid/dataset/kulrdr/doi-10-48804/IEKKVZ> ?p ?o ?g. }
Showing items 1 to 33 of
33
with 100 items per page.
- IEKKVZ accessRights PUBLIC @default.
- IEKKVZ bibliographicCitation "Rusci, Manuele; Van hamme, Hugo; Tuytelaars, Tinne, 2024, "Multi-Sensor Voice Command Dataset", https://doi.org/10.48804/IEKKVZ, KU Leuven RDR, V1" @default.
- IEKKVZ contributor 8de7ff736789685e82650573b60983d0ccbeed08 @default.
- IEKKVZ contributor 0000-0003-3307-9723 @default.
- IEKKVZ created "2025-03-24T14:52:07Z" @default.
- IEKKVZ creator 0000-0001-7458-4019 @default.
- IEKKVZ creator 0000-0003-1331-5186 @default.
- IEKKVZ creator 0000-0003-3307-9723 @default.
- IEKKVZ description "Das Repository enthält die Audiodateien, die von einem drahtlosen Audiosensornetzwerk mit 4 Sensoren aufgezeichnet wurden. Insgesamt 20 Freiwillige wurden angewiesen, fünf englische Sprachbefehle ("Lights On", "Lights Off", "Music On", "Music Stop", "Next Song") aus drei verschiedenen Positionen zu wiederholen, für insgesamt 15 Aufnahmen pro Keyword. Nur in wenigen Fällen wird die Anzahl der Proben nach manueller Datenreinigung auf 14 reduziert. Zusätzlich registrierten wir 15 generische gesprochene Äußerungen pro Lautsprecher, z.B. "Set a alarm to 7am", die als negative Beispiele verwendet werden. Bei einer Dauer von 3 Sekunden pro Äußerung haben wir insgesamt 1,5 Stunden Audio pro Sensor gesammelt. Zusätzlich wurden die negativen Daten durch 4,4 Stunden Aufnahmen ergänzt, die durch die Wiedergabe der Audiodateien aus den Test-Clean- und Dev-Clean-Sets von Librispeech unter Verwendung einer Reihe von Lautsprechern erhalten wurden. Die Audiodateien sind unter dem Weblink https://www.openslr.org/12 (dev-clean und test-clean repository) verfügbar, die unter der CC-BY-4.0 Lizenz frei verteilt werden. Jede Aufnahme war auf 3 Sekunden begrenzt, was zu einer Gesamtmenge von 5,9 Stunden Audio pro Sensor in unserem Multisensor-Dataset führte. Dieser Datensatz begünstigt die Untersuchung neuer Spracherkennungsalgorithmen für Audiodaten, die mit einem Netzwerk von intelligenten Audiosensoren mit extrem geringem Stromverbrauch aufgezeichnet wurden. Die Anwendung ist die Sprachbefehlserkennung, auch bekannt als Keyword-Spotting, bei der der Algorithmus einen Sprachbefehl (z.B. "Lights On") erkennen muss, der ihn von anderen Sprachbefehlen oder anderen Audiospuren, d.h. den negativen Daten, unterscheidet. Innerhalb eines drahtlosen Audiosensornetzwerks werden die Spracherkennungsalgorithmen mit den Audiodaten von mehreren Sensoren gespeist, die sich in der Umgebung befinden." @default.
- IEKKVZ description "De repository bevat de audiobestanden die zijn opgenomen vanuit een draadloos audiosensornetwerk van 4 sensoren. In totaal kregen 20 vrijwilligers de opdracht om vijf Engelse spraakopdrachten ("Lights On", "Lights Off", "Music On", "Music Stop", "Next Song") vanuit drie verschillende posities te herhalen, voor een totaal van 15 opnames per trefwoord. Slechts in enkele gevallen wordt het aantal monsters teruggebracht tot 14 na handmatige gegevensreiniging. Daarnaast registreerden we 15 generieke gesproken uitingen per spreker, bijvoorbeeld "Stel een alarm in op 7 uur 's ochtends", die als negatieve voorbeelden worden gebruikt. Gegeven een duur van 3 seconden per uiting, hebben we in totaal 1,5 uur audio per sensor verzameld. Bovendien werden de negatieve gegevens aangevuld met 4,4 uur aan opnames verkregen door de audiobestanden van de test-clean en dev-clean sets van Librispeech opnieuw af te spelen met behulp van een set luidsprekers. De audiobestanden zijn beschikbaar via de weblink https://www.openslr.org/12 (dev-clean en test-clean repository), die vrij worden verspreid onder de CC-BY-4.0 licentie. Elke opname was beperkt tot 3 seconden, wat leidde tot een totale hoeveelheid van 5,9 uur audio per sensor in onze multi-sensor dataset. Deze dataset is voorstander van het onderzoek naar nieuwe spraakherkenningsalgoritmen voor audiogegevens die zijn opgenomen met een netwerk van ultra-low-power slimme audiosensoren. De toepassing is spraakopdrachtherkenning, ook bekend als zoekwoordspotting, waarbij het algoritme een spraakopdracht moet herkennen (bijvoorbeeld "Lights On"), waarbij het wordt onderscheiden van andere spraakopdrachten of andere audiotracks, d.w.z. de negatieve gegevens. Binnen een draadloos audiosensornetwerkscenario worden de spraakherkenningsalgoritmen gevoed met de audiogegevens die zijn opgenomen van meerdere sensoren die zich in de omgeving bevinden." @default.
- IEKKVZ description "Le référentiel comprend les fichiers audio enregistrés à partir d'un réseau de capteurs audio sans fil de 4 capteurs. Au total, 20 volontaires ont reçu l'ordre de répéter cinq commandes vocales anglaises ("Lights On", "Lights Off", "Music On", "Music Stop", "Next Song") à partir de trois positions différentes, pour un total de 15 enregistrements par mot-clé. Seulement dans quelques cas, le nombre d'échantillons est réduit à 14 après le nettoyage manuel des données. De plus, nous avons enregistré 15 énoncés oraux génériques par locuteur, par exemple, « Définir une alarme à 7 heures du matin », qui sont utilisés comme exemples négatifs. Compte tenu d'une durée de 3 secondes par énoncé, nous avons collecté un total de 1,5 heure d'audio par capteur. De plus, les données négatives ont été augmentées de 4,4 heures d'enregistrements obtenus en rejouant les fichiers audio des ensembles test-clean et dev-clean de Librispeech à l'aide d'un ensemble de haut-parleurs. Les fichiers audio sont disponibles à partir du lien web https://www.openslr.org/12 (dev-clean et test-clean repository), qui sont distribués gratuitement sous la licence CC-BY-4.0. Chaque enregistrement a été limité à 3 secondes, ce qui a donné un total de 5,9 heures d'audio par capteur dans notre ensemble de données multi-capteurs. Cet ensemble de données favorise l'étude de nouveaux algorithmes de reconnaissance vocale pour les données audio enregistrées avec un réseau de capteurs audio intelligents de très faible puissance. L'application est la reconnaissance de commande vocale, également connue sous le nom de repérage de mot-clé, où l'algorithme doit reconnaître une commande vocale (par exemple "Lights On"), la distinguant des autres commandes vocales ou d'autres pistes audio, c'est-à-dire les données négatives. Dans un scénario de réseau de capteurs audio sans fil, les algorithmes de reconnaissance vocale sont alimentés avec les données audio enregistrées à partir de plusieurs capteurs, situés dans l'environnement." @default.
- IEKKVZ description "The repository includes the audio files recorded from a wireless audio sensor network of 4 sensors. A total of 20 volunteers were instructed to repeat five English voice commands ("Lights On", "Lights Off", "Music On", "Music Stop", "Next Song") from three different positions, for a total of 15 recordings per keyword. Only in a few cases, the number of samples is reduced to 14 after manual data cleaning. Additionally, we registered 15 per-speaker generic spoken utterances, e.g., "Set an alarm to 7am", which are used as negative examples. Given a duration of 3 seconds per utterance, we collected a total of 1.5 hours of audio per sensor. Additionally, the negative data were augmented with 4.4 hours of recordings obtained by replaying the audio files from the test-clean and dev-clean sets of Librispeech using a set of speakers. The audio files are available from the weblink https://www.openslr.org/12 (dev-clean and test-clean repository), which are freely distributed under the CC-BY-4.0 license. Every recording was limited to 3 seconds, leading to a total amount of 5.9 hours of audio per sensor in our multi-sensor dataset. This dataset favors the investigation of new speech recognition algorithms for audio data recorded with a network of ultra-low-power smart audio sensors. The application is voice command recognition, also known as keyword spotting, where the algorithm must recognize a voice command (e.g. "Lights On"), distinguishing it from other voice commands or other audio tracks, i.e. the negative data. Within a wireless audio sensor network scenario, the speech recognition algorithms are fed with the audio data recorded from multiple sensors, which are located in the environment." @default.
- IEKKVZ identifier "doi:10.48804/IEKKVZ" @default.
- IEKKVZ issued "2025-03-24T14:52:14Z" @default.
- IEKKVZ modified "2025-03-24T14:52:14Z" @default.
- IEKKVZ publisher 0419052173 @default.
- IEKKVZ rights 6d51dc06b8b7fdd7d566101cfd3cfaf7ed5a97d2 @default.
- IEKKVZ title "Gegevensset voor spraakcommando's met meerdere sensoren" @default.
- IEKKVZ title "Jeu de données de commande vocale multicapteurs" @default.
- IEKKVZ title "Multi-Sensor Voice Command Dataset" @default.
- IEKKVZ title "Multi-Sensor-Sprachbefehlsdatensatz" @default.
- IEKKVZ citedBy genid68329 @default.
- IEKKVZ citedBy genid68330 @default.
- IEKKVZ type Dataset @default.
- IEKKVZ contactPoint genid68332 @default.
- IEKKVZ keyword "keyword spotting" @default.
- IEKKVZ keyword "multi sensor" @default.
- IEKKVZ keyword "voice command recognition" @default.
- IEKKVZ keyword "wireless audio sensor network" @default.
- IEKKVZ landingPage IEKKVZ @default.
- IEKKVZ theme TECH @default.
- IEKKVZ version "1" @default.
- IEKKVZ isFundedBy genid68331 @default.