Comprendre les informations stockées électroniquement

A working knowledge of electronically stored information (ESI) is foundational for effective, efficient, and comprehensive planning and execution of all electronic discovery tasks. This short, non-all inclusive overview highlights key definitions, descriptions, and attributes related to ESI and may be beneficial for legal and information technology professionals as they consider ESI in the conduct of data and legal discovery.

en flag
nl flag
fr flag
de flag
pt flag
es flag

Un aperçu de Rob Robinson

Comprendre l'information stockée électroniquement — Les éléments de l'ESI (1)

Qu'est-ce que l'information stockée électroniquement ?

L'information stockée électroniquement, ou ESI, est décrite par le GEDM comme étant des renseignements stockés électroniquement sur des types de supports énumérables, quel que soit le format original dans lequel elle a été créée. (2)

Les Règles fédérales de procédure civile 26 et 34, qui entrent en vigueur le 1er décembre 2006, utilisent le terme général « renseignements stockés électroniquement » pour identifier une catégorie distincte d'information qui, avec les « documents » et les « objets tangibles », est assujettie à des droits et obligations relatifs à la communication préalable. (3)

Qu'est-ce que l'information ?

Du point de vue technologique, l'information est définie comme la synthèse des données. Techniquement, les données sont des faits bruts et des chiffres qui sont traités en information, tels que des résumés et des totaux. Mais étant donné que l'information peut aussi constituer les données brutes pour l'emploi ou la personne suivante, les deux termes ne peuvent pas être définis avec précision et les deux sont utilisés de manière interchangeable.

Qu'est-ce que les données ?

Information factuelle, en particulier l'information organisée pour analyse ou utilisée pour raisonner ou prendre des décisions.

Informatique. Informations numériques ou autres représentées sous une forme apte à être traitées par un ordinateur.

Portée des données (Quelle est la portée des données en question ?)

Portée de l'entité - Entités qui ont pu impliquer des personnes dans la création, l'examen ou la réponse de données pouvant contenir des renseignements pertinents pour la question à l'étude.

Portée du dépositaire - Personnes qui peuvent avoir participé à la création, à l'examen ou à la réponse de données pouvant contenir des renseignements pertinents pour la question à l'étude.

Portée du délégué des données - Personnes qui ont des responsabilités en matière de gestion de la technologie de l'information pour les entités et les personnes jugées liées à la question à l'étude ou pour les personnes qui conservent des droits d'accès aux applications et à l'équipement utilisés par ces entités et organisations.

Portée géographique - Les lieux géographiques des entités et des personnes qui peuvent avoir participé à la création, à l'examen et/ou à la réponse de communications et/ou de documents pertinents à la question en cause, ainsi que les lieux de l'équipement utilisé pour appuyer la création, la transmission, l'examen et le stockage de ces communications et/ou documents.

Échéancier Portée - Période pendant laquelle des renseignements pertinents ont pu être créés, examinés ou traités pour la question à l'étude.

Volume Portée - Volume estimatif de données pouvant contenir des renseignements pertinents pour la question à l'étude.

Structure des données (Quelle est la structure des données ?)

Non structuré - Les données non structurées (ou informations non structurées) font référence à des masses d'informations numériques (habituellement) dans lesquelles chaque bit d'information n'a pas de format et de signification assignés. Des exemples de « données non structurées » peuvent inclure l'audio, la vidéo et le texte non structuré comme le corps d'un courriel ou d'un document de traitement de texte. Les données non structurées représentent environ 80 % des données d'entreprise. (4)

Structuré - Les données structurées (ou informations structurées) font référence à des masses d'informations numériques (habituellement) dans lesquelles chaque bit d'information a un format et une signification assignés. Des exemples de « données structurées » peuvent inclure une base de données telle que SQL ou une feuille de calcul telle qu'Excel. Les données structurées représentent environ 20 % des données d'entreprise.

Format des données (Quel est le format des données ?)

Image fixe - Images qui transmettent leur signification en termes visuels, par exemple images picturales, photographies, affiches, graphiques, diagrammes, dessins architecturaux documentaires. Les formats de ces images peuvent être bitmappés (parfois appelés raster), vectoriels ou une combinaison des deux. Une image bitmappée est un tableau de points (généralement appelés pixels, à partir d'éléments d'image, en se référant à l'affichage de l'écran), le type d'image produit par un appareil photo numérique ou un scanner. Les images vectorielles sont constituées d'objets évolutifs (lignes, courbes et formes) définis en termes mathématiques, souvent avec des insertions typographiques.

Son - Contenu sonore indépendant des médias qui peut être divisé en deux sous-catégories de formats. La première sous-catégorie comprend les formats qui représentent le son enregistré, souvent appelé son de forme d'onde. Ces formats sont utilisés pour des applications comme les enregistrements de musique populaire, les livres enregistrés et les histoires orales numériques. La deuxième sous-catégorie comprend les formats qui fournissent des données pour soutenir la construction dynamique du son grâce à des combinaisons de logiciels et de matériels. Ce logiciel comprend des séquenceurs et des trackers qui utilisent des données qui contrôlent le démarrage et l'arrêt des éléments sonores individuels, des attributs tels que le volume et la hauteur, et d'autres effets qui doivent être appliqués aux éléments sonores. Les éléments sonores peuvent être de courtes sections de son de forme d'onde (parfois appelées échantillons ou boucles) ou des éléments de données qui caractérisent un son de sorte qu'un synthétiseur (qui peut être dans un logiciel ou un matériel) ou un générateur de son (généralement du matériel) puisse produire le son réel. Les données sont rassemblées lors de la lecture du fichier, c'est-à-dire que les sons sont générés dynamiquement lors de l'exécution. Cette deuxième sous-catégorie est parfois appelée audio structuré.

Image en mouvement - Une variété de formats d'image en mouvement numériques indépendants des médias et de leurs implémentations. Certains formats, par exemple QuickTime et MPEG-4, permettent une très large gamme d'implémentations par rapport à MPEG-2, un format d'encodage dont les implémentations possibles sont relativement plus limitées.

Textuel - Les œuvres de contenu constituées principalement de texte.

Archive Web - Contenu dans des formats pouvant contenir les résultats d'une analyse d'un site Web ou d'un ensemble de sites Web, action dynamique résultant de l'utilisation d'un progiciel qui appelle les pages Web et les capture sous la forme diffusée aux utilisateurs.

Générique - Contenu dans des formats génériques largement acceptables, incluant, sans s'y limiter, les spécifications pour les wrappers (par exemple, RIFF et ISO_BMFF), les formats de regroupement (par exemple, METS et AES-31) et les codages (par exemple, UTF-8 et IEEE 754 1985).

État des données (Quel est l'état des données ?)

État actif - Les données actives sont des informations résidant sur les disques durs ou les lecteurs optiques des systèmes informatiques, qui sont facilement visibles par le système d'exploitation ou le logiciel d'application avec lequel elles ont été créées et qui sont immédiatement accessibles aux utilisateurs sans suppression, modification ou reconstruction.

État statique - Les données statiques (ou données d'archivage) sont des informations qui ne sont pas directement accessibles à l'utilisateur d'un système informatique, mais que l'organisation conserve à des fins de stockage et de tenue de dossiers à long terme. Les données statiques peuvent être écrites sur des supports amovibles tels qu'un CD, un support magnéto-optique, une bande ou un autre périphérique de stockage électronique, ou peuvent être conservées sur des disques durs du système dans des formats compressés.

État résiduel : Les données résiduelles (parfois appelées « données ambiantes ») font référence à des données qui ne sont pas actives sur un système informatique. Les données résiduelles comprennent les données trouvées sur l'espace libre des médias, les données trouvées dans l'espace libre des fichiers et les données contenues dans des fichiers qui ont été supprimées fonctionnellement en ce sens qu'elles ne sont pas visibles à l'aide de l'application avec laquelle le fichier a été créé, sans avoir recours à des techniques d'annulation ou de récupération de données spéciales.

Réseau de données (Comment se connecter aux données ?)

Non-réseau : les données ne sont pas interconnectées à un groupe d'ordinateurs.

Réseau d'espace personnel (PAN) : Un réseau d'espace personnel (PAN) est un réseau informatique utilisé pour la communication entre les périphériques informatiques proches d'une personne. Quelques exemples de périphériques pouvant être utilisés dans un PAN sont les imprimantes, les télécopieurs, les téléphones, les PDA ou les scanners. La portée d'un PAN est généralement à environ 20-30 pieds (environ 4-6 mètres). Les PAN peuvent être utilisés pour la communication entre les différents appareils (communication intrapersonal), ou pour la connexion à un réseau de niveau supérieur et à Internet (liaison montante).

Réseau local (LAN) : Réseau couvrant une petite zone géographique, comme une maison, un bureau ou un immeuble. Les réseaux locaux actuels sont plus susceptibles d'être basés sur la technologie Ethernet.

Réseau local sans fil (WLAN) : Méthode de distribution sans fil pour deux appareils ou plus qui utilisent des ondes radio haute fréquence et comprennent souvent un point d'accès à Internet.

Réseau de zone de campus (CAN) : Réseau qui relie deux réseaux locaux ou plus, mais qui est limité à une zone géographique spécifique et contiguë, comme un campus universitaire, un complexe industriel ou une base militaire. Un CAN peut être considéré comme un type de MAN (réseau métropolitain), mais il est généralement limité à une zone plus petite qu'un MAN typique.

Réseau métropolitain (MAN) : Un réseau métropolitain est un réseau qui relie au moins deux réseaux locaux ou des réseaux de campus, mais qui ne s'étend pas au-delà des limites de la ville, de la ville ou de la région métropolitaine immédiate. Plusieurs routeurs, commutateurs et concentrateurs sont connectés pour créer un MAN.

Réseau étendu (RE) : Un réseau étendu (RE) est un réseau de communications de données qui couvre une zone géographique relativement vaste (c.-à-d., d'une ville à l'autre et d'un pays à un autre pays) et qui utilise souvent des installations de transmission fournies par des entreprises de télécommunication, comme les compagnies de téléphone.

Interréseau : deux ou plusieurs réseaux ou segments de réseau connectés à l'aide d'appareils fonctionnant à la couche 3 (la couche « réseau ») du modèle de référence de base OSI, tel qu'un routeur. Toute interconnexion entre ou entre des réseaux publics, privés, commerciaux, industriels ou gouvernementaux peut également être définie comme un interréseau. Dans la pratique moderne, les réseaux interconnectés utilisent le protocole Internet. Il existe au moins trois variantes d'un interréseau, selon qui administre et qui y participe :

+ Intranet : Un intranet est un ensemble de réseaux interconnectés, utilisant le protocole Internet et utilisant des outils basés sur IP tels que les navigateurs Web, qui sont sous le contrôle d'une seule entité administrative. Cette entité administrative ferme l'intranet au reste du monde et n'autorise que des utilisateurs spécifiques. Le plus souvent, un intranet est le réseau interne d'une entreprise ou d'une autre entreprise.

+ Extranet : Un extranet est un réseau ou un interréseau dont la portée est limitée à une seule organisation ou entité, mais qui a également des connexions limitées aux réseaux d'un ou de plusieurs autres organisations ou entités de confiance habituellement, mais pas nécessairement, (p. ex., les clients d'une entreprise peuvent avoir accès à une partie de son intranet créant ainsi un extranet, alors que les clients ne peuvent pas être considérés comme « fiables » du point de vue de la sécurité). Techniquement, un extranet peut également être classé comme un réseau CAN, MAN, WAN ou un autre type de réseau, bien que, par définition, un extranet ne puisse pas être constitué d'un seul réseau local ; il doit avoir au moins une connexion avec un réseau externe.

+ « Internet » : Un interréseau spécifique, constitué d'une interconnexion mondiale de réseaux gouvernementaux, universitaires, publics et privés basés sur le Réseau de l'Agence de Projets de Recherche Avancée (ARPANET) développé par l'ARPA du Département de la Défense des États-Unis — également hébergé sur le World Wide Web (WWW) et référencé comme « Internet » avec un « I » majuscule pour le distinguer des autres interréseaux génériques.

Les intranets et les extranets peuvent avoir ou non des connexions à Internet. S'il est connecté à Internet, l'intranet ou l'extranet est généralement protégé contre l'accès à partir d'Internet sans autorisation appropriée. Internet lui-même n'est pas considéré comme faisant partie de l'intranet ou de l'extranet, bien qu'Internet puisse servir de portail pour l'accès à des parties d'un extranet.

Réseau de stockage de données (Comment accéder aux données Active State ?)

Stockage à connexion directe (DAS) : Le stockage à connexion directe (DAS) fait référence à un système de stockage numérique directement relié à un serveur ou à une station de travail, sans réseau de stockage entre les deux. Il s'agit d'un retronym, principalement utilisé pour différencier le stockage non réseau du SAN et du NAS.

Stockage en réseau (NAS) : Le stockage en réseau (NAS) est un stockage de données informatiques de niveau fichier connecté à un réseau informatique fournissant un accès aux données à des clients réseau hétérogènes.

Réseau de zone de stockage (SAN) : Un réseau de zone de stockage (SAN) est une architecture permettant de connecter des périphériques de stockage d'ordinateurs distants (tels que des baies de disques, des librairies de bandes et des librairies optiques) aux serveurs de telle sorte que, au système d'exploitation, les périphériques apparaissent comme connectés localement.

Média de stockage de données (Comment conserver les données d'état statique ?)

Média de stockage semi-conducteur (cartes mémoire, clés USB, PDA, lecteurs audio numériques, appareils photo numériques, téléphones portables, photocopieurs, disques durs à semi-conducteurs)

Média de stockage à base magnétique (disquette, disque dur, bande magnétique)

Média de stockage optique et magnéto-optique (CD, CD-ROM, DVD, BD-R, BD-RE, DVD HD, CD-R, DVD-R, DVD+R, CD-RW, DVD-RW, DVD+RW, DVD-RAM, UDO)

Volume de données (Combien de données seront traitées ?)

Non compressé - Données n'ayant pas subi un processus de transformation d'une représentation à une autre, représentation plus petite à partir de laquelle l'original, ou une approximation proche, peut être récupéré.

Comprimée - Données ayant subi un processus de transformation d'une représentation à une autre, représentation plus petite à partir de laquelle l'original, ou une approximation proche, peut être récupéré.

Chiffrement des données (les données sont-elles cryptées ?)

Données non cryptées - Données qui n'ont pas fait l'objet d'une procédure qui rend le contenu d'un message ou d'un fichier informatique inintelligible pour quiconque n'est pas autorisé à le lire. Les données sont codées mathématiquement avec une chaîne de caractères appelée clé de chiffrement des données.

Données cryptées - Données ayant subi une procédure qui rend le contenu d'un message ou d'un fichier informatique inintelligible pour quiconque n'est pas autorisé à le lire. Les données sont codées mathématiquement avec une chaîne de caractères appelée clé de chiffrement des données.

Format du code de données (Quelles sont les capacités nécessaires pour afficher les informations ?)

Unicode Support - Unicode Support fournit un numéro unique pour chaque personnage, quelle que soit la plate-forme, quel que soit le programme, quelle que soit la langue.

Prise en charge non Unicode - Le format de code de données ne fournit pas de numéro unique pour chaque personnage, quelle que soit la plate-forme, le programme ou la langue.

Sortie des données (Comment les rapports de données ou les fichiers seront-ils fournis au demandeur ?)

Formats de fichier natifs : les fichiers produits dans le format qu'ils ont été créés et maintenus sont connus sous le nom de production native. Dans une production native, les documents MS Word sont produits sous forme de fichiers .doc, les fichiers MS Excel sont produits sous forme de fichiers .xls et les fichiers Adobe sont produits sous forme de fichiers .pdf, etc. Le format natif est souvent recommandé pour les fichiers qui n'ont pas été créés pour l'impression, tels que les feuilles de calcul et les petites bases de données. Pour certains types de fichiers, le format natif peut être le seul moyen de produire adéquatement les documents.

Formats quasi natifs : Certains fichiers, y compris la plupart des e-mails, ne peuvent pas être examinés en vue de leur production et/ou produits sans une forme quelconque de conversion. La plupart des fichiers de courrier électronique doivent être extraits et convertis en fichiers individuels pour l'examen et la production de documents. Par conséquent, le format d'origine est modifié et ils ne sont plus au format natif. Il n'existe pas de format standard pour les productions de fichiers quasi natives. Les fichiers sont généralement convertis dans un format de texte structuré tel que .html ou xml. Ces formats ne nécessitent pas de logiciel spécial pour la visualisation. Les autres formats de messagerie courants incluent .msg et .eml.

Formats quasi-papier : ESI peut également être produit dans un format quasi-papier. Le rendu d'une image est le processus de conversion ESI ou de numérisation du papier en un fichier numérique non modifiable. Au cours de ce processus, une « photo » est prise du fichier tel qu'il existe ou existerait en format papier. En fonction des paramètres d'impression du document, de l'imprimante ou de l'ordinateur, les données peuvent être modifiées ou manquantes dans l'image. Une expertise dans le domaine de la découverte électronique et des outils de rendu d'image est nécessaire pour minimiser ce risque.

Formats de papier : Une production de papier est exactement ce que cela ressemble : le papier est produit sous forme de papier ou ESI est imprimé sur papier et le papier est produit. Comme pour la conversion en image, l'impression de documents sur papier peut entraîner des données manquées ou modifiées. Lors de la production d'ESI sur papier, il est recommandé d'utiliser une personne ayant une expertise dans le domaine de la découverte électronique et des outils de rendu d'image afin de minimiser ce risque pendant le processus d'impression ou de rendu d'image.

Exigences en matière de stockage des données (Comment les données seraient-elles stockées après avoir été prises en compte ?)

Hot - Les données sont stockées dans un état actif et sont immédiatement accessibles aux utilisateurs finaux.

Chaud - Les données sont stockées dans un état actif qui n'est pas immédiatement accessible aux utilisateurs finaux.

Froid - Les données sont stockées dans un état statique.

Destruction - Les données sont détruites.

Au fur et à mesure que l'on commence à comprendre ces dispositions de stockage, on peut alors commencer à attribuer des valeurs économiques (temps/argent) aux approches potentielles pour obtenir les données et les rendre accessibles à toutes les parties concernées par une question particulière. La détermination et la compréhension de la valeur économique peuvent également servir de base à la discussion, depuis la position de savoir si l'ESI est accessible ou non de façon raisonnable à partir d'une affaire. une perspective juridique spécifique.

Cadre d'orientation technologique ESI

Création - permet la création d'ESI.

Connectivité - infrastructure qui relie les nœuds de communication et de stockage ESI.

Communication - permet la diffusion et la collaboration de l'ESI.

Conduite (Gestion) — permet la gestion fonctionnelle de l'ESI.

Comprendre l'information stockée électroniquement - Examen

Quelles sont les catégories générales d'ESI par rapport à l'examen ESI ?

Accessible* : « Les informations jugées « accessibles » sont stockées dans un format facilement utilisable. » (Zubulake c. UBS Warburg)

Accès déraisonnable : Information non stockée dans un format raisonnablement utilisable.

Quelles sont les répercussions potentielles sur la préservation et la production de l'IES accessible ou non accessible ?

Accessible - Besoin de préserver et de produire.

Accès déraisonnable - Nécessité de préserver et de comprendre les exigences relatives à la production.

Quels médias électroniques devraient-ils être examinés pour l'ESI* ?

Données en ligne actives (généralement accessibles)

Données Nearline (généralement accessibles)

Stockage/Archives hors ligne (parfois accessible, parfois déraisonnablement accessible)

Bandes de sauvegarde (généralement accessibles de manière déraisonnable)

Données effacées, fragmentées ou endommagées (généralement déraisonnablement accessibles)

* Le continuum d'accessibilité n'est pas défini dans le FRCP car il peut changer au fil du temps.

Comprendre les informations stockées électroniquement - Experts

Pourquoi le besoin de désigner des experts en e-Discovery pour les enquêtes et les litiges ?

Permet la sélection d'un conseiller principal de découverte électronique pour l'avocat responsable.

Permet de choisir un agent de liaison pour la découverte électronique pour la coordination et la communication.

Permet la sélection et la formation proactives d'experts de la règle 30b) 6).

Qui pourrait être sélectionné en tant qu'expert/liaison de la découverte électronique ?

Avocat (avocat interne ou externe)

Maître spécial nommé par la Cour

Consultant tiers

Employé de l'entreprise/de l'organisation

Quelles sont les caractéristiques typiques d'un expert en e-Discovery ?

Connaissance technique des systèmes et capacités électroniques du parti.

Compréhension technique de la découverte électronique.

Connaissance et capacité d'établir une « chaîne de contrôle » pour toutes les ESI.

Préparé à participer au règlement des litiges et aux litiges relatifs à la découverte électronique.

Contenu élaboré à l'origine pour fournir un aperçu général de l'information stockée par voie électronique à l'intention des personnes chargées de la planification de l'article 26 f) du Règlement fédéral.

(1) Robinson, R. (2009). Considérant Meet and Confer. 1re éd. [ebook] Orange Legal Technologies. Disponible à : [Consulté le 25 août 2018].

(2) EDRM.net. (2018). ESI/Informations stockées électroniquement. [en ligne] Disponible à l'adresse suivante : [Consulté le 25 août 2018].

(3) Hedges, R., Rothstein, B. et Wiggins, E. (2017). Managing Discovery of Electronic Information, 3e éd. [ebook] Washington, DC : Federal Judicial Center, p. 3. Disponible à : [Consulté le 25 août 2018].

(4) Rizkallah, J. (2017). Le problème des données volumineuses (non structurées). [en ligne] Forbes.com. Disponible à : [Consulté le 25 août 2018].

De Russie (et de Chine) avec amour ? Revue annuelle du National Cyber Security Centre du Royaume-Uni

According to the NCSC Annual Review, China remained a highly sophisticated...

Nouveaux guides du gouvernement fédéral sur les incidents de cybersécurité et la réponse aux vulnérabilités

According to Matt Hartman, Deputy Executive Assistant Director for Cybersecurity, "The...

Une montée en fléau de la cybercriminalité ? Le rapport annuel sur les menaces de l'ENISA — 9e édition

According to EU Agency for Cybersecurity Executive Director Juhan Lepassaar, “Given...

Vous envisagez Zero Trust ? Rapport sur les cyberévénements de novembre 2021 du CCDOE de l'OTAN

Computer security professionals love to say that there is no such...

Epiq acquiert Simplex

According to the release, the acquisition will increase the overall scale...

Une piste solide ? Fichiers KLDiscovery pour l'offre publique initiale

On Tuesday, November 23, 2021, KLDiscovery took a strong step toward...

Modus obtient la facilité de fonds de roulement de J.P. Morgan

According to Steven Horan, Chairman, and CEO of Modus, “Having the...

Fusion de découverte pilotée et innovante

According to the announcement, Silver Oak Services Partners, a private equity...

Une application composite de taille de marché eDiscovery : aperçu mondial des logiciels et services 2021-2026

From market retraction in 2020 to resurgence in 2021, the worldwide...

Une nouvelle ère dans l'e-Discovery ? Encadrer la croissance du marché à travers l'objectif de six époques

There are many excellent resources for considering chronological and historiographical approaches...

Un mashup de taille de marché électronique : 2020-2025 Présentation mondiale des logiciels et des services

While the Compound Annual Growth Rate (CAGR) for worldwide eDiscovery software...

Réinitialiser la ligne de base ? Ajustements de taille de marché eDiscovery pour 2020

An unanticipated pandemeconomic-driven retraction in eDiscovery spending during 2020 has resulted...

Cinq bonnes lectures sur la cybersécurité, les données et la découverte juridique pour novembre 2021

From worldwide eDiscovery market sizing and discovery intelligence to cybersecurity playbooks...

Cinq bonnes lectures sur la cybersécurité, les données et la découverte juridique pour octobre 2021

From artificial intelligence and predictive coding to eDiscovery business confidence and...

Cinq bonnes lectures sur la cybersécurité, les données et la découverte juridique pour septembre 2021

From countering ransomware to predictive coding and packaged services, the September...

Cinq bonnes lectures sur les cyberdonnées, les données et la découverte juridique pour août 2021

From the interplay of digital forensics in eDiscovery to collecting online...

Réalité alternative ? Résultats de l'enquête sur les prix de l'eDiscovery

Based on the complexity of data and legal discovery, it is...

Le calme avant la tempête ? Dix-huit observations sur la confiance des entreprises d'eDiscovery à l'automne 2021

In the fall of 2021, 71.2% of survey respondents felt that...

Aide recherchée ? Problèmes affectant les performances de l'entreprise eDiscovery : aperçu de l'automne 2021

In the fall of 2021, 27.4% of respondents viewed lack of...

La période des récoltes ? Mesures opérationnelles d'eDiscovery à l'automne 2021

In the fall of 2021, 67 eDiscovery Business Confidence Survey participants...