Accueil
Événements
2024-11-11

Atelier "Structures de données et nettoyages des données textuelles"

Yann Audin (doctorant en humanités numériques à l'Université de Montréal et responsable de projets à la Chaire de recherche du Canada sur les écritures numériques) animera une série de trois ateliers sur le traitement automatique des langues.

Le troisième atelier, "Structures de données et nettoyage des données textuelles", s'adresse aux personnes ayant des bases en Python et qui désirent apprendre à nettoyer les données textuelles et utiliser les formats de données JSON, csv et XML. Cette session reprendra les thèmes des ateliers précédents en analysant les conséquences épistémiques des différentes structures de données, et les présuppositions linguistiques de la racinisation et de la lemmatisation.

Durant cet atelier, les personnes participantes seront amenées à analyser un texte littéraire de leur choix à l'aide des bibliothèques Python Spacy et NLTK. De plus, elles apprendront à transformer un texte en données textuelles en fonction de leurs intérêts de recherche.

Python est utilisé dans les domaines du traitement automatique de la langue, de l'enseignement de la programmation, de l'intelligence artificielle, en programmation scientifique, en développement web, et bien d'autres. Ce langage dit de haut niveau est particulièrement lisible pour les humains, ce qui contribue à sa popularité. De plus, Python est distribué sous une licence très permissive, et est supportée par une forte et vaste communauté de pratique qui développe des bibliothèques pour presque n'importe quelle situation.

Cet atelier aura lieu le 11 novembre 2024 au CRIHN, salle C-8132, 3150 rue Jean Brillant, Université de Montréal de 10h30 à midi.

Le téléchargement d'une version récente d'Anaconda est recommandé, mais non nécessaire.

{ "lang": "fr", "plausible_domain": "ecrituresnumeriques.ca", "plausible_api_host": "https://plausible.ecrituresnumeriques.ca", "id": 1581, "settings_id": 1, "languages_code": "fr", "site_title": "Chaire de recherche du Canada sur les écritures numériques", "site_description": "Chaire de recherche du Canada sur les écritures numériques, portée par Marcello Vitali-Rosati et son équipe.", "feature_image": null, "site_email": "crc.ecrituresnumeriques@gmail.com", "site_address_html": "Université de Montréal Pavillon Lionel Groulx 8e étage Local C8041 3150, rue Jean Brillant Montréal (QC) H3T 1N8 Canada", "site_phone": "(+1) 514 343 5665", "site_rights": "© 2024 Chaire de recherche du Canada sur les écritures numériques. Certains droits réservés.", "site_social_accounts": [ { "label": "Mastodon", "icon": "mastodon", "url": "https://mamot.fr/@ENumeriques" }, { "label": "X/Twitter", "icon": "twitter", "url": "https://twitter.com/ENumeriques" }, { "label": "Zotero", "url": "https://www.zotero.org/groups/critures_numriques/items", "icon": "zotero" }, { "label": "GitLab", "icon": "gitlab", "url": "https://gitlab.huma-num.fr/ecrinum/" }, { "label": "GitHub", "icon": "github", "url": "https://github.com/Ecrituresnumeriques" }, { "label": "Facebook", "icon": "facebook", "url": "https://www.facebook.com/Chaire-de-recherche-du-Canada-sur-les-%C3%A9critures-num%C3%A9riques-439923422871073/" }, { "label": "Instagram", "icon": "instagram", "url": "https://www.instagram.com/enumeriques/" }, { "label": "Internet Archive", "url": "https://archive.org/details/@crc_sur_les_critures_num_riques", "icon": "archive" }, { "label": "Nakala", "icon": "archive", "url": "https://nakala.fr/collection/10.34847/nkl.55b04ql2" }, { "label": "Dépôt Papyrus", "url": "https://papyrus.bib.umontreal.ca/xmlui/browse?type=affiliation&value=Universit%C3%A9%20de%20Montr%C3%A9al.%20Chaire%20de%20recherche%20du%20Canada%20sur%20les%20%C3%A9critures%20num%C3%A9riques", "icon": "udem" }, { "label": "YouTube", "icon": "youtube", "url": "https://www.youtube.com/channel/UC5LIw0dopbSSgqI2zdIi84w" } ], "site_menu_main": [ { "label": "La chaire", "items": [ { "label": "À propos", "url": "/fr/a-propos" }, { "label": "L’équipe", "url": "/fr/equipe" } ] }, { "label": "Activités", "items": [ { "label": "Projets", "url": "/fr/projets" }, { "label": "Événements", "url": "/fr/evenements" }, { "label": "Publications (Zotero)", "url": "https://www.zotero.org/groups/322999/critures_numriques/library", "external": true } ] }, { "label": "Thèmes et concepts", "items": [ { "label": "Axes de recherche", "url": "/fr/axes-de-recherche" }, { "label": "Champs de recherche", "url": "/fr/champs-de-recherche" }, { "label": "Objets de recherche", "url": "/fr/objets-de-recherche" }, { "label": "Concepts clés", "url": "/fr/concepts-cles" } ] } ], "site_menu_secondary": [ { "label": "English", "url": "/en" } ], "site_menu_footer": [ { "label": "À propos", "url": "/fr/a-propos" }, { "label": "Projets", "url": "/fr/projets" }, { "label": "Stylo", "external": true, "url": "https://stylo.huma-num.fr/" }, { "label": "Sens public", "url": "https://www.sens-public.org/", "external": true }, { "label": "Revue3.0", "external": true, "url": "https://revue30.org/" }, { "label": "Revue 2.0", "external": true, "url": "https://revue20.ecrituresnumeriques.ca/" }, { "label": "Anthologie grecque", "url": "https://anthologiegrecque.org", "external": true }, { "label": "Skholé", "external": true, "url": "https://skhole.ecrituresnumeriques.ca/" } ], "site_header_image_id": "ab46faac-9b3b-4025-9991-a61587f3cd71", "site_long_description": "Nous vivons désormais dans un espace numérique. Cet espace est fait d'écriture. Nos identités sont de l'écriture – profils, entrées dans des bases de données, lignes de codes –, nos actions sont de l'écriture – à partir des clics jusqu'à l'achat d'un livre ou à la planification d'un voyage –, les objets qui nous entourent sont faits d'écriture. La Chaire de recherche du Canada sur les Écritures numériques a pour objectif de proposer une nouvelle lecture et une nouvelle compréhension de cette écriture qui fait désormais notre monde. Sur ce site vous trouverez l'ensemble des projets menés par Marcello Vitali-Rosati et son équipe, les publications des membres de la Chaire et la description de tous les concepts théoriques mobilisés pour nos recherches. ", "site_zotero_group_id": "322999", "site_footer_logos": [ { "directus_files_id": "f096827c-b644-45ed-89a6-e0cb2367006f" }, { "directus_files_id": "f53ad38e-86e6-4656-8915-35f890f8d2fd" }, { "directus_files_id": "41b61cb3-a410-4a81-a591-f943f30aa775" }, { "directus_files_id": "851f10ec-e4ad-4fc2-906c-7385a09af30f" }, { "directus_files_id": "f3a97c97-1f47-46a7-a698-4c99b2fc3689" }, { "directus_files_id": "0d8cf306-5e8c-438e-973a-d27f553addb4" } ], "date_start": "2024-11-11", "date_end": "2024-11-11", "time_start": "10:30:00", "time_end": "12:00:00", "event_type": "workshop", "event_languages": [ "fr" ], "events_id": 791, "title": "Atelier \"Structures de données et nettoyages des données textuelles\"", "slug": "atelier-python-structure", "content_html": "Yann Audin (doctorant en humanités numériques à l'Université de Montréal et responsable de projets à la Chaire de recherche du Canada sur les écritures numériques) animera une série de trois ateliers sur le traitement automatique des langues.\nLe troisième atelier, \"Structures de données et nettoyage des données textuelles\", s'adresse aux personnes ayant des bases en Python et qui désirent apprendre à nettoyer les données textuelles et utiliser les formats de données JSON, csv et XML. Cette session reprendra les thèmes des ateliers précédents en analysant les conséquences épistémiques des différentes structures de données, et les présuppositions linguistiques de la racinisation et de la lemmatisation.\nDurant cet atelier, les personnes participantes seront amenées à analyser un texte littéraire de leur choix à l'aide des bibliothèques Python Spacy et NLTK. De plus, elles apprendront à transformer un texte en données textuelles en fonction de leurs intérêts de recherche.\nPython est utilisé dans les domaines du traitement automatique de la langue, de l'enseignement de la programmation, de l'intelligence artificielle, en programmation scientifique, en développement web, et bien d'autres. Ce langage dit de haut niveau est particulièrement lisible pour les humains, ce qui contribue à sa popularité. De plus, Python est distribué sous une licence très permissive, et est supportée par une forte et vaste communauté de pratique qui développe des bibliothèques pour presque n'importe quelle situation.\nCet atelier aura lieu le 11 novembre 2024 au CRIHN, salle C-8132, 3150 rue Jean Brillant, Université de Montréal de 10h30 à midi.\nLe téléchargement d'une version récente d'Anaconda est recommandé, mais non nécessaire.", "links": null, "description": "Le troisième atelier, \"Structures de données et nettoyage des données textuelles\", s'adresse aux personnes ayant des bases en Python et qui désirent apprendre à nettoyer les données textuelles et utiliser les formats de données JSON, csv et XML.", "location": "CRIHN, salle C-8132, 3150 rue Jean Brillant, Université de Montréal", "legacy_image": "https://donnees.ecrituresnumeriques.ca/assets/93a8cba9-0b1f-461a-9c47-e1b0dcc1f5dc?key=system-medium-cover&modified=2024-11-07T15:37:26.217Z", "legacy_slug": null, "legacy_location": null }