Replies: 2 comments
-
J'ai déplacé ça dans les Discussions dans la catégorie Idées, dans l'idée de laisser les "issues" pour la description des implémentations (donc qu'on a déjà itéré dans les idées et qu'on est plus au clair sur ce qu'on doit faire). |
Beta Was this translation helpful? Give feedback.
-
Introduction : du Book au CorpusLa fonctionnalité Corpus de Stylo remplace l'ancienne fonctionnalité Book qui, comme son nom l'indique, était utilisée pour produire des livres à partir d'un script bash. Grâce à Book, il était possible d'exporter des ensembles d'articles Stylo en un seul document (avec toutes les fonctionnalités que ça implique de calcul de la pagination, de la génération de la table des matières, etc.). C'est à ce stade qu'arrive la fonctionnalité Corpus. Là où Book décrivait l'objet produit par la fonctionnalité, le nom de Corpus est plus vague, c'est un choix volontaire (cf #781) discuté avec toute l'équipe. En comparaison de Book, Corpus offre plusieurs changements structurels :
Ce fonctionnement a été implémenté dans Stylo lors du déploiement de la version 2.1.0 de Stylo. La fonctionnalité Corpus est maintenant dotée d'une structure grâce à laquelle nous pouvons implémenter une variété de comportements et de scénarios d'exports pour créer divers artefacts. Problématisation(version courte) Qu'est-ce qu'un ensemble de documents dans Stylo? (version plus longue) Jusqu'au stade du déploiement de Stylo 2.1.0, l'éditeur de texte n'était pas adapté pour créer des objets à une autre échelle que l'unité éditoriale (un article, un chapitre, etc.). La création d'artefacts à une autre échelle éditoriale usait jusque-là de tweaks pour tordre certaines fonctionnalités déjà existantes. C'est d'ailleurs un comportement que nous souhaitons préserver dans Stylo : Stylo est pensé pour des articles individuels. L'unité est l'article. Cela implique que par exemple des informations sur les numéros se trouvent dans les métadonnées de chaque article. Cette structuration des informations occasionne une perturbation de ce que peut être un document dans Stylo puisque nous retrouvons à l'intérieur de l'espace dédié à l'unité éditoriale des métadonnées destinées à décrire d'autre jeux d'échelle (d'abord le numéro de revue, puis le niveau au-dessus, la revue, voire même un autre niveau encore avec le diffuseur). En ce sens nous pouvons d'abord nous demander ce qu'est un document dans Stylo. Qu'est-ce qu'un document ?La notion de document renvoie à tout une histoire de la documentation. Le document est un objet délicat à définir tant il revêt des formes différentes. D’un point de vue étymologique, le dictionnaire latin-français Gaffiot nous indique que documentum signifie « exemple, modèle, leçon, enseignement, démonstration », définition qui ne fait pas forcément référence à un support de l’information alors que dans son acception plus contemporaine l’on désigne un document par celui-ci. Paul Otlet, une figure importante durant la première documentarisation, a quant à lui défini le document comme suit :
Si l'on continue notre lecture d'Otlet, une page plus loin, il nous donne les éléments consitutifs d'un document, à savoir :
Nous pouvons résumer la pensée d'Otlet par cette dernière citation :
Cette défintion du document fait apparaître des éléments que l'étymologie ne contient pas. Donker Duyvis ajoute même qu'il faut prêter une attention toute particulière à ce que le support, loin d'être neutre dans cette affaire, ne déforme pas la pensée de l'auteur :
Quelques décennies plus tard, en 1951, Suzanne Briet, dans son essai Qu'est-ce que la documentation, semble en décaccord avec Otlet, qu'elle qualifie de «mage», ainsi que son projet d'un Répertoire Bibliographique Universel de «chimère [...] qui n'offrait pas un intérêt comparable au plus localisé des catalogues collectifs». Elle dresse une liste des définitions du document à partir de l'étymologie latine («enseignement ou preuve»), qu'elle complète en citant «une bibliographe contemporaine soucieuse de clarté» : «un document est une preuve à l'appui d'un fait». Elle mentionne également une définition officielle donnée par l'Union Française des Organismes de Documentation : «toute base de connaissance fixée matériellement et susceptible d'être utilisée pour consultation, étude ou preuve». En confrontant ces définitions au regard de la linguistique et de la philosophie, une définition plus abstraite émerge : «tout indice concret ou symbolique, conservé ou enregistré, aux fins de représenter, de reconstituer ou de prouver un phénomène physique ou intellectuel». À partir de cette définition du document, elle utilise l'exemple, aujourd'hui très célèbre, de l'antilope. À la différence d'Otlet, le document de Briet ne correspond pas à l'impression de la volonté d'un auteur sur un support. Que ce soit chez Otlet ou chez Briet, les deux conceptions du document ont en commun de mobiliser une action humaine. Qu'est-ce qu'un document numérique ?En 1997, Buckland s'intéresse aux changements qu'apporte le numérique à la nature de ce document.
Cette conception du document manipulable sur une surface plane est très limitée, et ne permet pas d'y inclure beaucoup d'autres supports que le papier. Seulement, cette page affichée à l'écran n'est ni un objet pérenne, ni un objet manipulable. Pour le dire autrement, Lévy nous dit finalement que ce n'est pas le support qui compte dans la détermination d'un document. En France, au début des années 2000, un collectif de chercheur.e.s se forme sous le nom de Roger T. Pédauque et travaille pendant plusieurs années à la définition du document numérique. Selon Pédauque, le document est composée de 3 dimensions , selon d'où proviennent les chercheurs du collectif:
Cette approches du document sont reformulées par Pédauque au prisme des différentes technologies émergentes dans les années 2000 (Web sémantique notamment). Ainsi, Pédauque remet sur le support sur la table de la discussion et réamorce lui aussi le vieux débat entre Otlet et Briet. Un mouvement similaire à Pédauque émerge en 2001 de l'autre côté de l'Atlantique. Tous ces travaux élargissentla notion de document pour qu'elle englobe le numérique et précisent également les spécificités du document numérique (en tant que type de document) en comprenant certaines propriétés comme l'hypertextualité, etc. Les modèles textuelsL'une des particularités du document numérique est la capacité à représenter et à structurer l'information à l'intérieur d'un espace délimité à partir d'une modélisation textuelle et explicite, que l'on peut déclarer sous forme de balises (markup). Historiquement, les premiers outils d'écriture numérique (Electric Pencil, Roff) n'avait pas d'interface graphique. Ce principe de déclaration des balises ne sert pas uniquement à déclarer des commandes dans le texte. Des applications comme SGML (Standard Generalized Markup Language) en 1986 puis HTML en 1989 (HyperText Markup Language) voient le jour et s'appuient sur la modélisation théorique du texte dans un document OHCO (ordered hierarchy of content object)(DeRose, 1990). Au début des années 2000, ces formats apparaissent trop verbeux. Si le XML permet de faire ces deux choses à la fois, on remarque qu'il y a aussi des pratiques où l'on détache les métadonnées d'un contenu plus textuel (un fichier markdown peut être associé à un fichier de métadonnées yaml). Tous ces formats nous montrent que le document n'est plus seulement "un seul objet" ou tous les feuillets sont assemblé et relié physiquement entre eux. La montée en volume des données durant les années 2000 et l'arrivée du Big Data et des bases de données, qu'elles soient relationnelles ou non, fragmente encore plus les informations. À ce stade, la question du support n'a plus aucun sens, nous dit Bachmimont (2022).
Le document n'est alors plus seulement constitué d'un format d'encodage et d'informations mais de toute le système qui en permet l'existence, allant de l'architecture du micro-processeur, aux systèmes d'indexation et de stockage des informations et des données en passant par les algorithmes qui permettent de les trier, les récupérer, les traiter, et les assembler dans une forme lisible pour les individus. Définir le document dans StyloAu prisme de cette définition du document (numérique), nous pouvons définir le document dans Stylo par une incarnation matérielle formée de :
Ce sont ces médiations dans l'environnement qu'est Stylo qui déterminent le document dans Stylo. Un document comme ce billet de discussion est donc délimité dans Stylo par le texte en Markdown, les métadonnées en YAML : ---
articleslies:
- auteur: ''
title: ''
url: ''
date: '2024-11-01'
director:
- foaf: ''
forname: ''
gender: ''
isni: ''
orcid: ''
surname: ''
viaf: ''
dossier:
- id: ''
title_f: ''
lang: fr
link-citations: true
nocite: '@*'
rights: Creative Commons Attribution-ShareAlike 4.0 International (CC BY-SA 4.0)
title_f: réflexion corpus
translations:
- lang: ''
title: ''
url: ''
translator:
- forname: ''
surname: ''
--- Des éléments tels que Autre élément que nous trouvons dans ce document : une requête query
:
"query updateWorkingVersion($articleId: ID!, $content: WorkingVersionInput!) {\n article(article: $articleId) {\n updateWorkingVersion(content: $content) {\n updatedAt\n }\n }\n}"
variables : {userId: "61d62c4978651b001208b7aa", articleId: "6723a6ab33b8f40011f9c8b6", content: {,…}}
articleId : "6723a6ab33b8f40011f9c8b6"
content : {,…}
md : "## Introduction : du _Book_ au _Corpus_ \n\nLa fonctionnalité [...]
userId : "61d62c4978651b001208b7aa" Les informations sont restructurées par les algorithmes de Stylo et font apparaître de nouvelles notions comme La Pourquoi l'appeler version et non pas copie ? S'il y a une version de travail, c'est pour la distinguer d'autres version que l'utilisateur peut déclarer manuellement via le gestionnaire de version. On pense au protocole distribué comme Dans Stylo, un même document embarque alors plusieurs versions de lui-même (avec ces sources YAML, Markdown, BibTeX) et tout l'historique des modifications que l'on y apporte. Maintenant que nous avons une vue d'ensemble sur ce qu'est un document Stylo, nous nous demandons ce que peut être un ensemble de documents Stylo. Pour le dire autrement, il ne s'agit pas de faire une collection de multiples documents mais de créer un méta-document à partir de plusieurs documents (que l'on considère alors comme des unités documentaires). Par exemple, le livre est une forme méta-documentaire comportant plusieurs documents : des chapitres. Qu'est-ce qu'un ensemble de documents dans Stylo ?Nous avons deux cas d'usages principaux avec des sous-cas:
BibliographieBachimont, B. (2022). Donner du sens aux données : Les ruses du numérique : Les disciplines du document face à la métis du calcul. Interfaces numériques, 11(2), Article 2. https://doi.org/10.25965/interfaces-numeriques.4838 |
Beta Was this translation helpful? Give feedback.
-
Problématique
Qu'est-ce qu'un ensemble de documents Stylo?
Stylo est pensé pour des articles individuels. L'unité est l'article. Cela implique que par exemple des information sur les dossiers se trouvent dans les métadonnées de chaque article.
Mais :
Cas d'usage
Nous avons deux cas d'usages principaux avec des sous-cas:
a. pour un dossier. Exporter un dossier de revue, par exemple en XML Métopes, pour publication en lot
b. pour une revue entière: tous les articles d'une revue, par exemple pour produire automatiquement le site d'une revue
a. pour faire un livre
b. pour faire un mémoire ou une thèse
Question métadonnées
Beta Was this translation helpful? Give feedback.
All reactions