Matches in Data.gov.be for { <http://data.gov.be/.well-known/genid/dataset/kulrdr/doi-10-48804/YAMJUS> ?p ?o ?g. }
Showing items 1 to 29 of
29
with 100 items per page.
- YAMJUS accessRights PUBLIC @default.
- YAMJUS bibliographicCitation "De Troij, Robbert; Van de Velde, Freek, 2025, "Replication data for: "The crystallization of language over time"", https://doi.org/10.48804/YAMJUS, KU Leuven RDR, V2" @default.
- YAMJUS created "2025-09-30T15:54:29Z" @default.
- YAMJUS creator 0000-0002-5256-9288 @default.
- YAMJUS creator 0000-0003-3050-2207 @default.
- YAMJUS description "Ce dépôt contient les données et le script R accompagnant l'article "La cristallisation du langage au fil du temps" (en cours d'examen). Les jeux de données sont stockés au format txt (tab-delimited) et rds dans le dossier /data. Les fichiers ngrams_lemma.txt et ngrams_pos.txt contiennent des trigrammes de lemme et de partie de parole et des informations de fréquence extraites du corpus C-CLAMP (1850-1999; Piersoul et coll. 2021). Ces fichiers sont utilisés pour calculer les mesures d'association des trigrammes avec le code R dans 01_data_preparation.R. Le fichier 02_analyses.R contient le code R utilisé pour modéliser la cohérence interne des trigrammes à travers le temps à l'aide de modèles mixtes linéaires et additifs généralisés, et évaluer leur distribution au moyen de l'entropie de Shannon et de Kullback-Leibler Divergence." @default.
- YAMJUS description "Deze repository bevat de gegevens en het R-script bij het artikel "De kristallisatie van taal in de loop van de tijd" (onder voorbehoud). De datasets worden opgeslagen in txt (tab-gescheiden) en rds formaat in de /data map. De bestanden ngrams_lemma.txt en ngrams_pos.txt bevatten lemma- en spraaktrigrammen en frequentie-informatie uit het C-CLAMP corpus (1850-1999; Piersoul et al. 2021). Deze bestanden worden gebruikt om de associatiemaatstaven van de trigrammen te berekenen met de R-code in 01_data_preparation.R. Het bestand 02_analyses.R bevat de R-code die wordt gebruikt om de interne samenhang van de trigrammen door de tijd te modelleren met behulp van gegeneraliseerde lineaire en additieve gemengde modellen en de verdeling ervan te beoordelen door middel van Shannon's entropie en Kullback-Leibler Divergence." @default.
- YAMJUS description "Dieses Repository enthält die Daten und das R-Skript, die dem Papier "The crystallization of language over time" (Die Kristallisation der Sprache im Laufe der Zeit) beigefügt sind (wird derzeit überprüft). Die Datensätze werden im Format txt (tab-delimited) und rds im Ordner /data gespeichert. Die Dateien ngrams_lemma.txt und ngrams_pos.txt enthalten Lemma- und Sprachteiltrigramme sowie Frequenzinformationen, die aus dem C-CLAMP-Korpus (1850-1999; Piersoul et al. 2021). Diese Dateien werden verwendet, um die Assoziationsmaße der Trigramme mit dem R-Code in 01_data_preparation.R zu berechnen.Die Datei 02_analyses.R enthält den R-Code, der verwendet wird, um die interne Kohärenz der Trigramme durch die Zeit mit verallgemeinerten linearen und additiven Mischmodellen zu modellieren und ihre Verteilung anhand von Shannons Entropie und Kullback-Leibler Divergenz zu bewerten." @default.
- YAMJUS description "This repository contains the data and R script accompanying the paper "The crystallization of language over time" (under review). The datasets are stored in txt (tab-delimited) and rds format in the /data folder. The files ngrams_lemma.txt and ngrams_pos.txt contain lemma and part-of-speech trigrams and frequency information culled from the C-CLAMP corpus (1850-1999; Piersoul et al. 2021). These files are used to calculate the trigrams' association measures with the R code in 01_data_preparation.R. The file 02_analyses.R contains the R code used to model the trigrams' internal coherence through time using generalized linear and additive mixed models, and assess their distribution by means of Shannon's entropy and Kullback-Leibler Divergence." @default.
- YAMJUS identifier "doi:10.48804/YAMJUS" @default.
- YAMJUS issued "2025-10-01T09:47:45Z" @default.
- YAMJUS modified "2025-10-01T09:47:45Z" @default.
- YAMJUS publisher 0419052173 @default.
- YAMJUS subject "Languages and literary studies" @default.
- YAMJUS title "Données de réplication pour: "La cristallisation du langage au fil du temps"" @default.
- YAMJUS title "Replicatiegegevens voor: "De kristallisatie van taal in de loop van de tijd"" @default.
- YAMJUS title "Replication data for: "The crystallization of language over time"" @default.
- YAMJUS title "Replikationsdaten für: "Die Kristallisation der Sprache im Laufe der Zeit"" @default.
- YAMJUS type Dataset @default.
- YAMJUS contactPoint genid68577 @default.
- YAMJUS keyword "collocational strength (ΔP)" @default.
- YAMJUS keyword "corpus linguistics" @default.
- YAMJUS keyword "entropy" @default.
- YAMJUS keyword "mixed models" @default.
- YAMJUS keyword "n-grams" @default.
- YAMJUS landingPage YAMJUS @default.
- YAMJUS theme SOCI @default.
- YAMJUS theme TECH @default.
- YAMJUS version "2" @default.