Matches in Data.gov.be for { <http://data.gov.be/.well-known/genid/dataset/ucl/doi-10-14428/DVN/DMYIHZ> ?p ?o ?g. }
Showing items 1 to 28 of
28
with 100 items per page.
- DMYIHZ accessRights PUBLIC @default.
- DMYIHZ bibliographicCitation "Bogaert, Jérémie; Escouflaire, Louis, 2024, "Corpus InfOpinion-RTBF", https://doi.org/10.14428/DVN/DMYIHZ, Open Data @ UCLouvain, V1" @default.
- DMYIHZ created "2024-11-06T12:09:42Z" @default.
- DMYIHZ creator a025548809a14272d00c3ab621fea4df5d8e7ad9 @default.
- DMYIHZ creator e42a714654e03c8262ec879029b3b4903540221c @default.
- DMYIHZ description "Bogaert, J., Escouflaire, L., de Marneffe, M. C., Descampe, A., Standaert, F. X. und Fairon, C. (2023). TIPECS: Eine Korpusreinigungsmethode mit maschinellem Lernen und qualitativer Analyse. In: International Conference on Corpus Linguistics (JLC). Bitte lesen Sie die "Nutzungsbedingungen"-Datei, bevor Sie den Korpus verwenden. Werte in der CSV-Datei werden durch das Zeichen " ⁇ " getrennt. Das InfOpinion-Korpus besteht aus 10.000 Artikeln, die zwischen 2012 und 2021 zum Infor- mation-Feed des RTBF-Korpus veröffentlicht wurden. Es handelt sich um einen ausgewogenen Datensatz, der zum einen 5.000 Artikel enthält, die vom RTBF als „Op-eds“ („Chroniques“) oder „ Opinions“ eingestuft wurden, und zum anderen 5.000 Artikel, die nach dem Zufallsprinzip aus den Kategorien Belgien, Welt und Gesellschaft ausgewählt wurden und ähnliche Themen behandeln wie die in der Kategorie „Op-eds“ erörterten. Jeder Artikel im InfOpinion-Korpus enthält mehrere Schichten von Metadaten, die weiter unten beschrieben werden (Escouflaire et al., 2024): ID, Titel, Veröffentlichungsdatum, Signatur, Feed, Kategorie und Stichwort. Eine zusätzliche Spalte ist dem Genre (oder der Klasse) des Artikels gewidmet, bei dem es sich entweder um Informationen oder um Meinungen handelt. Dieses Korpus wurde für die Ausbildung und Bewertung eines Klassifikationsmodells erstellt, das zwischen Stücken aus dem journalistischen Meinungsgenre (wie Editorials, Kommentare, Rezensionen), die als subjektiv gelten, und Stücken aus dem Informationsgenre (Presseagenturen, Nachrichtenartikel) unterscheidet, die objektivere Texte sein sollen (Grosse, 2001). Diese binäre Kategorisierung beruht ausschließlich auf der Anmerkung der Artikel durch das RTBF als Meinung oder Information." @default.
- DMYIHZ description "Bogaert, J., Escouflaire, L., de Marneffe, M. C., Descampe, A., Standaert, F. X., & Fairon, C. (2023). TIPECS: A corpus cleaning method using machine learning and qualitative analysis. In International Conference on Corpus Linguistics (JLC). Please read the "Terms of use" file before using the corpus. Values in the CSV file are separated by the character "|". The InfOpinion corpus consists of 10,000 articles published between 2012 and 2021 on the infor- mation feed of the RTBF Corpus. It is a balanced dataset containing on the one hand 5,000 articles classified by the RTBF as Op-eds (“Chroniques”) or Opinions, and on the other hand 5,000 articles randomly selected from the Belgium, World, and Society categories, which tackle similar topics to those discussed in the Op-eds category. Each article in the InfOpinion corpus has multiple layers of metadata, which are described further in (Escouflaire et al., 2024) : ID, title, publication date, signature, feed, category and keyword. An additional column is devoted to the article’s genre (or class), which is either information or opinion. This corpus was built for training and evaluating a classification model distinguishing between pieces from the journalistic opinion genre (such as editorials, commentaries, reviews), which are considered to be subjective, and pieces belonging to the information genre (press agency dispatches, news articles), meant to be more objective texts (Grosse, 2001). This binary categorization relies solely on the articles’ annotation by the RTBF as either opinion or information." @default.
- DMYIHZ description "Bogaert, J., Escouflaire, L., de Marneffe, M. C., Descampe, A., Standaert, F. X., & Fairon, C. (2023). TIPECS: Een corpus reinigingsmethode met behulp van machine learning en kwalitatieve analyse. Internationale conferentie over Corpus Linguistics (JLC). Lees het bestand "Gebruiksvoorwaarden" voordat u het corpus gebruikt. Waarden in het CSV-bestand worden gescheiden door het teken " ⁇ ". Het InfOpinion corpus bestaat uit 10.000 artikelen gepubliceerd tussen 2012 en 2021 over de infor-mation feed van de RTBF Corpus. Het is een evenwichtige dataset met enerzijds 5 000 artikelen die door de RTBF zijn geclassificeerd als “op-eds” (“Chroniques”) of “Advies”, en anderzijds 5 000 artikelen die willekeurig zijn geselecteerd uit de categorieën België, Wereld en Maatschappij, die vergelijkbare onderwerpen behandelen als die welke in de categorie “op-eds” worden besproken. Elk artikel in het InfOpinion corpus heeft meerdere lagen metagegevens, die verder worden beschreven in (Escouflaire et al., 2024): ID, titel, publicatiedatum, handtekening, feed, categorie en trefwoord. Een extra kolom is gewijd aan het genre (of de klasse) van het artikel, namelijk informatie of mening. Dit corpus werd gebouwd voor het trainen en evalueren van een classificatiemodel dat onderscheid maakt tussen stukken uit het journalistieke opiniegenre (zoals redactionele artikelen, commentaren, recensies), die als subjectief worden beschouwd, en stukken die behoren tot het informatiegenre (persagentschappen, nieuwsartikelen), bedoeld om meer objectieve teksten te zijn (Grosse, 2001). Deze binaire indeling is uitsluitend gebaseerd op de annotatie van de artikelen door de RTBF als mening of informatie." @default.
- DMYIHZ description "Bogaert, J., Escouflaire, L., de Marneffe, M. C., Descampe, A., Standaert, F. X., et Fairon, C. (2023). TIPECS : Une méthode de nettoyage de corpus utilisant l'apprentissage automatique et l'analyse qualitative. Conférence internationale sur la linguistique du corpus (JLC). Veuillez lire le fichier « Conditions d'utilisation » avant d'utiliser le corpus. Les valeurs du fichier CSV sont séparées par le caractère " ⁇ ". Le corpus InfOpinion se compose de 10 000 articles publiés entre 2012 et 2021 sur le flux infor- mation de la RTBF Corpus. Il s’agit d’un ensemble de données équilibré contenant, d’une part, 5 000 articles classés par la RTBF comme chroniques ou opinions et, d’autre part, 5 000 articles sélectionnés au hasard dans les catégories Belgique, Monde et Société, qui abordent des sujets similaires à ceux abordés dans la catégorie éditoriale. Chaque article du corpus InfOpinion comporte plusieurs couches de métadonnées, qui sont décrites plus en détail dans (Escouflaire et al., 2024): ID, titre, date de publication, signature, flux, catégorie et mot clé. Une colonne supplémentaire est consacrée au genre (ou à la classe) de l’article, qui est soit une information, soit une opinion. Ce corpus a été construit pour la formation et l'évaluation d'un modèle de classification distinguant les articles du genre de l'opinion journalistique (tels que les éditoriaux, les commentaires, les revues), qui sont considérés comme subjectifs, et les articles appartenant au genre de l'information (dépêches d'agences de presse, articles de presse), destinés à être des textes plus objectifs (Grosse, 2001). Cette catégorisation binaire repose uniquement sur l’annotation des articles par la RTBF en tant qu’opinion ou information." @default.
- DMYIHZ identifier "doi:10.14428/DVN/DMYIHZ" @default.
- DMYIHZ issued "2024-11-06T12:33:39Z" @default.
- DMYIHZ language ENG @default.
- DMYIHZ modified "2024-11-06T12:33:39Z" @default.
- DMYIHZ publisher 0419052272 @default.
- DMYIHZ subject "Social Sciences" @default.
- DMYIHZ title "Corpus InfOpinion-RTBF" @default.
- DMYIHZ title "Corpus InfOpinion-RTBF" @default.
- DMYIHZ title "Corpus InfOpinion-RTBF" @default.
- DMYIHZ title "Corpus InfOpinion-RTBF" @default.
- DMYIHZ citedBy genid69108 @default.
- DMYIHZ type Dataset @default.
- DMYIHZ contactPoint genid69109 @default.
- DMYIHZ distribution EZKE5S @default.
- DMYIHZ distribution PQ7RJ5 @default.
- DMYIHZ landingPage DMYIHZ @default.
- DMYIHZ theme SOCI @default.
- DMYIHZ theme TECH @default.
- DMYIHZ version "1" @default.