Document : numérisation, structuration, indexation - Spé Systèmes d’Information de Gestion - Terminale STMG

Document : numérisation, structuration, indexation - Spé Systèmes d’Information de Gestion - Terminale STMG

Découvrez ce cours de Spécialité Systèmes d'Information de Gestion pour le Bac STMG, rédigé par notre professeur, sur le chapitre "Document : numérisation, structuration, indexation", issu du thème "La numérisation suffit-elle à valoriser l'information ?"

Ce cours de Spé SIG est composé de 6 parties : une introduction au chapitre, une partie sur la numérisation, une autre sur les documents électroniques, puis sur le cycle de vie des documents; vous étudierez également la gestion électronique des documents (GED) ainsi que le classement à travers les portails, les marques-pages (ou favoris), la syndication de contenu et la notion de curation.

Téléchargez gratuitement ci-dessous ce cours de Spécialité SIG pour le Bac STMG sur le chapitre "Document : numérisation, structuration, indexation".

Document : numérisation, structuration, indexation - Spé Systèmes d’Information de Gestion - Terminale STMG

Le contenu du document

 

INTRODUCTION

Les technologies de l’information et de la communication ne suffisent pas à donner de la valeur à l’abondance et à la diversité des informations qu’elles procurent.

Les donnes deviennent des informations par un processus d’interprétation. Donner du sens aux données pour en faire une information passe par le classement, l’indexation et la création de liens sémantiques.

Ces opérations sont d’autant plus importantes que les informations ne sont pas uniquement produites à partir des données structurées stockées dans les bases de données mais sont aussi contenues dans des sources plus composites et moins structurées que sont les documents.

 

Disposer de documents sous forme numérique permet de les réunir, de les classer, de les conserver puis de les diffuser et les exploiter de façon automatisée. L’étape finale du cycle de vie du document est l’archivage, éventuellement la destruction. Entre la numérisation et la destruction, des traitements mis en œuvre par un ensemble d’outils et de méthodes permettent l’exploitation des ressources documentaires.

On peut considérer qu’un document matérialise la transformation de l’information en ressource pour une personne ou pour une organisation. Son élaboration, son traitement et sa diffusion conditionnent largement son accessibilité et sa capacité à être perçu comme étant pertinent.

 

La numérisation nécessite du matériel couteux qui dépend de la nature du support sur lequel se trouve le document. Ses coûts sont liés à la manipulation des documents originaux, aux capacités de stockage utilisées par certains documents (image, photographies) et à a la nécessite d’une main d’œuvre qualifiée pour effectuer ce travail.

Un document numérisé a la même valeur juridique qu’un écrit sur support papier à condition d’en assurer la traçabilité et la conservation dans des conditions de nature à en garantir l’intégrité.

Dans la mesure où il doit être conservé plusieurs années, il faut veiller à ce que l’évolution technologiques ne soit pas un obstacle à son exploitation future.

 

La Norme NF Z42 013 - ISO 14641-1 propose un ensemble de spécifications techniques et organisationnelles concernant le stockage, la pérennité et l’intégrité des documents numériques. Le Service interministériel des Archives de France diffuse les normes professionnelles en matière de numérisation.

Les droits d’auteur ou d’éditeur sont à prendre en considération lors de la numérisation qui pose un problème particulier compte-tenu de la facilité de diffusion et de reproduction des documents.

 

LA NUMERISATION

La numérisation de l’information consiste à en construire une représentation sous forme numérique stockée dans un fichier informatique (dans un format recouvrant au final un encodage binaire).

 

Un document numérique peut être obtenu de deux façon : 

  • Par numérisation d’un objet réel : scanner un document (dématérialisation) enregistrer un son, prendre une photo… l’information est alors disponible sur un nouveau support, numérique, en plus de son support d’origine.
     
  • Par création de façon native (directement en numérique : traitement de texte, création d’une image…)

 

Les principaux apports de la numérisation sont : 

  • Le coût de stockage réduit (faible prix au Go, faible espace physique mobilisé)
  • Les possibilités de duplication à l’identique et de diffusion élargie (réseau)
  • La circulation rapide des documents (réseau)
  • Les possibilités accrues de traitement de l’information, notamment de façon automatisée,
  • La préservation de certains documents contre les risques d’altération (à condition que la pérennité du stockage soit elle-même assurée).

LES DOCUMENTS ELECTRONIQUES

Si on dépasse la simple dématérialisation sur support numérique, on peut aussi créer des documents électroniques séparant le contenu (information et structure) et la forme (présentation) afin de : 

  • Permettre une exploitation indépendante de la forme et une diffusion sous plusieurs formes (à l’aide par exemple de feuilles de styles)

  • D’indexer le contenu par mots-clés en mode plein texte ou grâce aux métadonnées et donc de faciliter les recherches (indexer un mot consiste à recenser ses occurrences et emplacements).

 

Cette séparation :

  • Est généralement native pour les documents directement créés en numérique
  • Repose pour les documents numérisés sur de la reconnaissance automatique du type de document (à l’aide de logos, code-barres) et de la reconnaissance optique et/ou intelligente de caractères (OCR ou ICR pour l’écriture manuscrite)

 

LE CYCLE DE VIE DES DOCUMENTS

Il est important de distinguer archivage, sauvegarde et stockage : 

  • Le stockage est une considération technique
  • L’archivage est une pratique liée à une volonté de conservation
  • La sauvegarde est une pratique répondant à un objectif de sécurité (dupliquer périodiquement, en des lieux différents)
  • L’archivage et la sauvegarde font tous deux appels à du stockage (de même que l’utilisation courante)
  • L’archivage sécurisé fait appel à la sauvegarde

 

Tout au long de ce cycle de vie, il faut pouvoir assurer la confidentialité, l’intégrité, la disponibilité et l’imputabilité des documents, cela requiert des moyens spécifiques lorsque ces documents sont électroniques.

Cycle de vie d'un document - Cours Spécialité Systèmes d'Information de Gestion - Bac STMG

 

LA GESTION ELECTRONIQUE DES DOCUMENTS (GED)

La GED est un ensemble de méthodes et technologies (matérielles et logicielles) : 

 

  • Appliquant les principes du cycle de vie aux documents électroniques
  • Permettant de tirer parti du format numérique (workflow, travail collaboratif, suivi des versions, indexation automatique, moteur de recherche, …)

 

 

Au-delà de la gestion des informations transversales aux processeur, la GED peut participer à la capitalisation et au management des connaissances.

 

Ces solutions de viennent indispensables du fait de l’abondance de documents électroniques de toute forme (courriels, factures, …) pour une gestion efficace du patrimoine informationnel. Les solutions et projets de GED apportent des gains quantitatifs et qualitatifs dont le retour sur investissement est mesurable et en général rapide.

 

LE CLASSEMENT

Selon certaines sources, le volume des données numériques dans le monde double tous les 18 mois (selon la règle des trois V : vitesse, volume, variété).

Cette croissance fait passer le web (et les SI) d’un web de l’information et de la connaissance à un web de données.

Tout comme le pétrole qui doit être raffiné, ces données ne produisent une richesse que si elles sont traitées afin d’en tirer de nouvelles informations et connaissances. Il faut donc gérer ce data deluge et le gisement du Big data.

Il convient donc d’organiser ces informations et ces données pour optimiser la recherche dans l’intérêt : 

 

  • De l’utilisateur pour trouver les formations pertinentes quant à ses besoins
  • De producteur qui a priori souhaite la diffusion et la valorisation de son travail

 

 

La notion d’hypertexte a été décrite dès 1965 par le sociologue américain Ted Nelson et mise en œuvre avec le web dans les années 80. L’hypertexte permet un web de documents (liés entre eux), l’enjeu est maintenant de passer à un web de données et d’informations.

 

Les informations peuvent être classées à l’aide de différents procédés :

 

LES PORTAILS

Les portails regroupant de façon thématique des liens vers d’autres sites : ces portails ont d’abord été constitué par une « autorité » (Yahoo) puis sont apparues, dans le cadre du web 2.0, des possibilités de constituer des portails personnalisés (netvibes, Google).

 

LES MARQUES-PAGES OU FAVORIS

 

  • Personnels : mémorisés par le navigateur de l’utilisateur (leur portabilité sur n’importe quel poste étant maintenant possible)
      
  • Partagés : en ligne pour en faire bénéficier d’autres. Ces applications de social bookmarking permettent aux utilisateurs de catégoriser les marques-pages à l’aide de mots-clés et de les noter, des algorithmes peuvent ensuite tisser des liens entre eux et faire ressortir les plus pertinents.

 

 

LA SYNDICATION DE CONTENU

La syndication de contenu introduit un aspect dynamique en informant des nouveautés d’un site sans avoir la nécessité de s’y rendre (flux RSS)

 

LA CURATION

 

  • La curation consiste à sélectionner et éditorialiser des contenus se rapportant à un thème pour les partager et les mettre en valeur.

 

Ces procédés essentiellement humains doivent permettre : 

 

  • Des gains de temps (mutualisation de recherche et sélection déjà effectuées)
  • Donner du sens par un classement thématique
  • Faire émerger par son aspect humain des contenus ignorés ou non mis en valeur par les moteurs de recherche.

 

Fin de l'extrait

Vous devez être connecté pour pouvoir lire la suite

Télécharger ce document gratuitement

Donne ton avis !

Rédige ton avis

Votre commentaire est en attente de validation. Il s'affichera dès qu'un membre de Bac STMG le validera.
Attention, les commentaires doivent avoir un minimum de 50 caractères !
Vous devez donner une note pour valider votre avis.

Nos infos récentes du Bac STMG

Communauté au top !

Vous devez être membre de digiSchool bac STMG

Pas encore inscrit ?

Ou identifiez-vous :

Mot de passe oublié ?