Mon. Jun 27th, 2022
    en flag
    nl flag
    fr flag
    de flag
    pt flag
    es flag

    Una visión general de Rob Robinson

    Comprensión de la información almacenada electrónicamente — Elementos de ESI (1)

    ¿Qué es la información almacenada electrónicamente?

    La EDRM describe la información almacenada electrónicamente, o ESI, como información almacenada electrónicamente en tipos de medios enumerables, independientemente del formato original en el que se creó. (2)

    Las Reglas Federales de Procedimiento Civil 26 y 34, en vigor desde el 1 de diciembre de 2006, utilizan el amplio término «información almacenada electrónicamente» para identificar una categoría distinta de información que, junto con «documentos» y «cosas tangibles», está sujeta a derechos y obligaciones de descubrimiento. (3)

    ¿Qué es Información?

    Desde una perspectiva tecnológica, la información se define como el resumen de los datos. Técnicamente, los datos son hechos y cifras sin procesar que se procesan en información, como resúmenes y totales. Pero dado que la información también puede ser los datos brutos para el siguiente trabajo o persona, los dos términos no se pueden definir con precisión, y ambos se usan indistintamente.

    ¿Qué son los datos?

    Información fáctica, especialmente información organizada para análisis o utilizada para razonar o tomar decisiones.

    Ciencias de la Computación. Información numérica u otra información representada en una forma adecuada para su procesamiento por ordenador.

    Alcance de los datos (¿Cuál es el alcance de los datos en cuestión?)

    Ámbito de la Entidad - Entidades que pueden haber tenido personas involucradas en la creación, revisión o respuesta de datos que pueden contener información relevante para el asunto en cuestión.

    Ámbito del custodio - Personas que pueden haber participado en la creación, revisión o respuesta de datos que pueden contener información relevante para el asunto en cuestión.

    Ámbito de Data Steward - Personas que tienen responsabilidades de gestión de Tecnología de la Información para las entidades y personas que se determina que están relacionadas con el asunto en cuestión o personas que mantienen derechos de acceso a las aplicaciones y equipos utilizados por estas entidades y organizaciones.

    Alcance geográfico - Las ubicaciones geográficas de las entidades e individuos que pueden haber participado en la creación, revisión y/o respuesta de comunicaciones y/o documentos relevantes para el asunto en cuestión, así como las ubicaciones del equipo utilizado para apoyar la creación, transmisión, revisión y almacenamiento de estas comunicaciones y/o documentos.

    Ámbito del marco temporal - El período de tiempo en el que la información pertinente puede haber sido creada, revisada o respondida para el asunto en cuestión.

    Alcance del volumen: volumen estimado de datos que puede contener información relevante para el asunto en cuestión.

    Estructura de datos (¿Cuál es la estructura de los datos?)

    No estructurado: los datos no estructurados (o información no estructurada) se refieren a masas de (generalmente) información digital en las que cada bit de información no tiene un formato asignado y significado. Ejemplos de «datos no estructurados» pueden incluir audio, vídeo y texto no estructurado, como el cuerpo de un correo electrónico o un documento de procesador de textos. Los datos no estructurados representan aproximadamente el 80% de los datos empresariales. (4)

    Estructurado - Los datos estructurados (o información estructurada) se refieren a masas de (generalmente) información digital en la que cada bit de información tiene un formato asignado y significado. Ejemplos de «datos estructurados» pueden incluir una base de datos como SQL o una hoja de cálculo como Excel. Los datos estructurados representan aproximadamente el 20% de los datos empresariales.

    Formato de datos (¿Cuál es el formato de los datos?)

    Imagen fija - Imágenes que transmiten su significado en términos visuales, por ejemplo imágenes pictóricas, fotografías, carteles, gráficos, diagramas, dibujos arquitectónicos documentales. Los formatos de estas imágenes pueden ser mapeados de bits (a veces llamados ráster), vectoriales o alguna combinación de las dos. Una imagen de mapa de bits es una matriz de puntos (generalmente llamados píxeles, de elementos de imagen, cuando se hace referencia a la visualización de pantalla), el tipo de imagen producida por una cámara digital o un escáner. Las imágenes vectoriales se componen de objetos escalables (líneas, curvas y formas) definidos en términos matemáticos, a menudo con inserciones tipográficas.

    Sonido: contenido de sonido independiente de los medios que se puede dividir en dos subcategorías de formato. La primera subcategoría consiste en formatos que representan el sonido grabado, a menudo llamado sonido de forma de onda. Estos formatos se utilizan para aplicaciones como grabaciones musicales populares, libros grabados e historias orales digitales. La segunda subcategoría consiste en formatos que proporcionan datos para apoyar la construcción dinámica del sonido a través de combinaciones de software y hardware. Este software incluye secuenciadores y rastreadores que utilizan datos que controlan cuándo los elementos de sonido individuales deben iniciarse y detenerse, atributos como el volumen y el tono, y otros efectos que deben aplicarse a los elementos de sonido. Los elementos de sonido pueden ser secciones cortas de sonido de forma de onda (a veces llamadas muestras o bucles) o elementos de datos que caracterizan un sonido para que un sintetizador (que puede estar en software o hardware) o generador de sonido (normalmente hardware) pueda producir el sonido real. Los datos se reúnen cuando se reproduce el archivo, es decir, los sonidos se generan dinámicamente en tiempo de ejecución. Esta segunda subcategoría a veces se llama audio estructurado.

    Moving Image - Una variedad de formatos de imagen en movimiento digitales independientes de los medios y sus implementaciones. Algunos formatos, por ejemplo, QuickTime y MPEG-4, permiten una amplia gama de implementaciones en comparación con, por ejemplo, MPEG-2, un formato de codificación cuyas posibles implementaciones están relativamente más restringidas.

    Textual - El contenido funciona que consiste principalmente en texto.

    Archivo Web: contenido en formatos que pueden contener los resultados de un rastreo de un sitio Web o un conjunto de sitios Web, una acción dinámica resultante del uso de un paquete de software que llama a páginas Web y las captura en el formulario distribuido a los usuarios.

    Genérico - Contenido en formatos genéricos ampliamente aceptables para incluir pero no limitado a especificaciones para envoltorios (por ejemplo, RIFF e ISO_BMFF), formatos de agrupamiento (por ejemplo, METS y AES-31) y codificaciones (por ejemplo, UTF-8 e IEEE 754 1985).

    Estado de datos (¿Cuál es el estado de los datos?)

    Estado activo - Datos activos es información que reside en los discos duros o unidades ópticas de los sistemas informáticos, que es fácilmente visible para el sistema operativo o software de aplicación con el que fue creado y es inmediatamente accesible para los usuarios sin eliminación, modificación o reconstrucción.

    Estado estático: datos estáticos (o datos de archivo) es información que no es accesible directamente para el usuario de un sistema informático, pero que la organización mantiene para fines de almacenamiento y mantenimiento de registros a largo plazo. Los datos estáticos pueden escribirse en medios extraíbles como un CD, un medio magneto-óptico, una cinta u otro dispositivo de almacenamiento electrónico, o pueden conservarse en discos duros del sistema en formatos comprimidos.

    Estado residual: Datos residuales (a veces denominados «Datos ambientales») se refieren a datos que no están activos en un sistema informático. Los datos residuales incluyen los datos encontrados en el espacio libre de medios; los datos encontrados en el espacio de espacio de archivo; y los datos dentro de archivos que se han eliminado funcionalmente, ya que no son visibles utilizando la aplicación con la que se creó el archivo, sin el uso de undelete o técnicas especiales de recuperación de datos.

    Red de datos (¿Cómo se «Conecta» a los datos?)

    Sin red: los datos no están interconectados con un grupo de equipos.

    Red de área personal (PAN): Una red de área personal (PAN) es una red informática utilizada para la comunicación entre dispositivos informáticos cercanos a una persona. Algunos ejemplos de dispositivos que se pueden utilizar en un PAN son impresoras, máquinas de fax, teléfonos, PDA o escáneres. El alcance de un PAN suele estar dentro de unos 20-30 pies (aproximadamente 4-6 metros). Los PAN pueden utilizarse para la comunicación entre los dispositivos individuales (comunicación intrapersonal), o para conectarse a una red de nivel superior e Internet (enlace ascendente).

    Red de área local (LAN): red que cubre un área geográfica pequeña, como un hogar, una oficina o un edificio. Es más probable que las LAN actuales se basen en tecnología Ethernet.

    Red de área local inalámbrica (WLAN): método de distribución inalámbrica para dos o más dispositivos que utilizan ondas de radio de alta frecuencia y a menudo incluyen un punto de acceso a Internet.

    Red de área de campus (CAN): red que conecta dos o más LAN pero que está limitada a un área geográfica específica y contigua, como un campus universitario, un complejo industrial o una base militar. Un CAN puede considerarse un tipo de MAN (red de área metropolitana), pero generalmente se limita a un área que es más pequeña que un MAN típico.

    Red de área metropolitana (MAN): Una red de área metropolitana es una red que conecta dos o más redes de área local o redes de área de campus, pero no se extiende más allá de los límites de la ciudad, ciudad o área metropolitana inmediata. Múltiples enrutadores, conmutadores y concentradores están conectados para crear un MAN.

    Red de área amplia (WAN): Una WAN es una red de comunicaciones de datos que cubre un área geográfica relativamente amplia (es decir, una ciudad a otra y un país a otro) y que a menudo utiliza instalaciones de transmisión proporcionadas por operadores comunes, como compañías telefónicas.

    InterNetwork: dos o más redes o segmentos de red conectados mediante dispositivos que operan en la capa 3 (la capa «red») del Modelo básico de referencia OSI, como un router. Cualquier interconexión entre o entre redes públicas, privadas, comerciales, industriales o gubernamentales también puede definirse como una interconexión. En la práctica moderna, las redes interconectadas usan el Protocolo de Internet. Hay al menos tres variantes de una interconexión, dependiendo de quién administra y quién participa en ellas:

    + Intranet: Una intranet es un conjunto de redes interconectadas, utilizando el Protocolo de Internet y utiliza herramientas basadas en IP como navegadores web, que están bajo el control de una sola entidad administrativa. Esa entidad administrativa cierra la intranet al resto del mundo y sólo permite usuarios específicos. Normalmente, una intranet es la red interna de una empresa u otra empresa.

    + Extranet: Una extranet es una red o interred que tiene un alcance limitado a una sola organización o entidad pero que también tiene conexiones limitadas a las redes de una o más otras generalmente, pero no necesariamente, organizaciones o entidades de confianza (por ejemplo, los clientes de una empresa pueden tener acceso a alguna parte de su intranet creando así una extranet, mientras que al mismo tiempo los clientes no pueden ser considerados «de confianza» desde el punto de vista de la seguridad). Técnicamente, una extranet también puede clasificarse como CAN, MAN, WAN u otro tipo de red, aunque, por definición, una extranet no puede consistir en una sola LAN; debe tener al menos una conexión con una red externa.

    + «Internet»: Interred específica, que consiste en una interconexión mundial de redes gubernamentales, académicas, públicas y privadas basadas en la Red de Agencias de Proyectos de Investigación Avanzada (ARPANET) desarrollada por ARPA del Departamento de Defensa de los Estados Unidos — también hogar de la World Wide Web (WWW) y referida a como el «Internet» con un «I» mayúscula para distinguirlo de otras interredes genéricas.

    Las intranets y extranets pueden tener o no conexiones a Internet. Si está conectado a Internet, la intranet o la extranet están generalmente protegidos para que no se pueda acceder desde Internet sin la debida autorización. La Internet en sí misma no se considera parte de la intranet o la extranet, aunque Internet puede servir de portal para acceder a partes de una extranet.

    Red de almacenamiento de datos (¿Cómo se llega a los datos de estado activo?)

    Almacenamiento con conexión directa (DAS): El almacenamiento con conexión directa (DAS) se refiere a un sistema de almacenamiento digital conectado directamente a un servidor o estación de trabajo, sin una red de almacenamiento intermedio. Es un retrónimo, utilizado principalmente para diferenciar el almacenamiento de información no conectado a la red de SAN y NAS.

    Almacenamiento conectado a la red (NAS): El almacenamiento conectado a la red (NAS) es un almacenamiento de datos de computadora a nivel de archivo conectado a una red informática que proporciona acceso a los datos a clientes de red heterogéneos.

    Red de área de almacenamiento (SAN): una red de área de almacenamiento (SAN) es una arquitectura para conectar dispositivos de almacenamiento remoto de equipos (como arreglos de discos, bibliotecas de cintas y discos ópticos) a servidores de tal manera que, para el sistema operativo, los dispositivos aparezcan como conectados localmente.

    Medios de almacenamiento de datos (¿Cómo se mantienen los datos de estado estático?)

    Medios de almacenamiento basados en semiconductores (tarjetas de memoria, unidades flash USB, PDA, reproductores de audio digital, cámaras digitales, teléfonos móviles, copiadoras, discos duros de estado sólido)

    Medios de almacenamiento basados en magnético (disquete, disco duro, cinta magnética)

    Medios de almacenamiento ópticos y magneto-ópticos (CD, CD-ROM, DVD, BD-R, BD-RE, HD DVD, CD-R, DVD-R, DVD+R, CD-RW, DVD-RW, DVD+RW, DVD-RAM, UDO)

    Volumen de datos (¿Con cuántos datos se actuarán?)

    Sin comprimir - Datos que no han sufrido un proceso de transformación de una representación a otra, representación menor a partir de la cual se puede recuperar el original, o una aproximación cercana a ella.

    Comprimido - Datos que han sido sometidos a un proceso de transformación de una representación a otra, representación menor de la que se puede recuperar el original, o una aproximación cercana a ella.

    Cifrado de datos (¿Se cifran los datos?)

    Datos no cifrados - Datos que no han sido sometidos a un procedimiento que hace que el contenido de un mensaje o archivo informático sea ininteligible para cualquier persona que no esté autorizada a leerlo. Los datos se codifican matemáticamente con una cadena de caracteres llamada clave de cifrado de datos.

    Datos cifrados - Datos que han sido sometidos a un procedimiento que hace que el contenido de un mensaje o archivo informático sea ininteligible para cualquier persona que no esté autorizada a leerlo. Los datos se codifican matemáticamente con una cadena de caracteres llamada clave de cifrado de datos.

    Formato de código de datos (¿Qué capacidades se necesitarán para mostrar información?)

    Soporte Unicode - Soporte Unicode proporciona un número único para cada carácter, sin importar cuál sea la plataforma, sin importar cuál sea el programa, sin importar cuál sea el idioma.

    Compatibilidad no Unicode: Formato de código de datos no proporciona un número único para cada carácter, independientemente de la plataforma, el programa o el idioma.

    Salida de datos (¿Cómo se proporcionarán los informes o archivos de datos al solicitante?)

    Formatos de archivo nativos: Los archivos producidos en el formato en el que fueron creados y mantenidos se conocen como producción nativa. En una producción nativa, los documentos de MS Word se producen como archivos.doc, los archivos de MS Excel se producen como archivos.xls, y los archivos de Adobe se producen como archivos.pdf, etc. El formato nativo se recomienda a menudo para archivos que no se crearon para imprimir, como hojas de cálculo y bases de datos pequeñas. Para algunos tipos de archivo, el formato nativo puede ser la única forma de producir adecuadamente los documentos.

    Formatos casi nativos: algunos archivos, incluida la mayoría de los correos electrónicos, no pueden revisarse para su producción y/o producción sin algún tipo de conversión. La mayoría de los archivos de correo electrónico deben extraerse y convertirse en archivos individuales para la revisión y producción de documentos. Como resultado, el formato original se altera y ya no están en formato nativo. No existe un formato estándar para producciones de archivos casi nativas. Normalmente, los archivos se convierten a un formato de texto estructurado como .html o xml. Estos formatos no requieren software especial para su visualización. Otros formatos comunes de correo electrónico incluyen .msg y .eml.

    Formatos Near-Paper: ESI también se puede producir en formato casi papel. Renderizar una imagen es el proceso de convertir ESI o escanear papel en un archivo digital no editable. Durante este proceso, se toma una «imagen» del archivo tal como existe o existiría en formato papel. En función de la configuración de impresión en el documento, la impresora o el equipo, los datos pueden ser alterados o faltados en la imagen. La experiencia en el campo del descubrimiento electrónico y las herramientas de representación de imágenes son necesarias para minimizar este riesgo.

    Formatos de papel: Una producción de papel es justo lo que suena: el papel se produce como papel o ESI se imprime en papel y el papel se produce. Al igual que con la conversión a imagen, la impresión de documentos en papel puede dar lugar a la pérdida o alteración de datos. Al producir ESI en papel, se recomienda utilizar a alguien con experiencia en el campo de las herramientas de e-discovery y renderizado de imágenes para minimizar este riesgo durante el proceso de impresión o representación de imágenes.

    Requisitos de almacenamiento de datos (¿Cómo se almacenarán los datos después de que se actuen?)

    Hot: los datos se almacenan en un estado activo y son inmediatamente accesibles para los usuarios finales.

    Caliente: los datos se almacenan en un estado activo que no es inmediatamente accesible para los usuarios finales.

    Frío - Los datos se almacenan en un estado estático.

    Destruct - Los datos se destruyen.

    A medida que uno comienza a entender estas disposiciones de almacenamiento, uno puede comenzar a asignar valores económicos (tiempo/dinero) a los enfoques potenciales para obtener los datos y ponerla a disposición de todas las partes involucradas en un asunto específico. Desde extremadamente generales y subjetivos en un extremo del espectro hasta muy específicos y objetivos en el otro, la determinación y comprensión del valor económico también puede servir de base para discutir desde una posición de saber si la EIE es accesible o no razonablemente accesible desde un caso. perspectiva jurídica específica.

    Marco de enfoque tecnológico ESI

    Creación - permite la creación de ESI.

    Conectividad: infraestructura que conecta los nodos de comunicación y almacenamiento de información de ESI.

    Comunicación: permite la difusión y la colaboración sobre ESI.

    Conducta (Gestión): permite la gestión del área funcional de ESI.

    Descripción de la información almacenada electrónicamente - Examen

    ¿Cuáles son las categorías generales de ESI en relación con el examen ESI?

    Accessible*: «La información considerada 'accesible' se almacena en un formato fácilmente utilizable». (Zubulake c. UBS Warburg)

    Accesible irrazonablemente: Información no almacenada en un formato razonablemente utilizable.

    ¿Cuáles son las posibles implicaciones para la preservación y la producción de un ESI accesible/no accesible?

    Accesible - Necesidad de preservar y producir.

    Accesible irrazonablemente - Necesidad de preservar y comprender los requisitos para la producción.

    ¿Qué medios electrónicos pueden ser necesarios para examinar la EIE?

    Datos activos en línea (normalmente accesibles)

    Datos cercanos (normalmente accesibles)

    Almacenamiento/Archivos sin conexión (a veces accesibles, a veces irrazonablemente accesibles)

    Cintas de backup (normalmente accesible irrazonablemente)

    Datos borrados, fragmentados o dañados (normalmente accesibles irrazonablemente)

    * El Continuum de Accesibilidad no está definido en el FRCP, ya que puede cambiar con el tiempo.

    Descripción de la información almacenada electrónicamente - Expertos

    ¿Por qué la necesidad de determinar expertos en eDiscovery para investigaciones y litigios?

    Permite la selección de un asesor principal de eDiscovery para el abogado responsable del registro.

    Permite la selección de un enlace o facilitador de eDiscovery para la coordinación y la comunicación.

    Permite la selección proactiva y la formación de expertos de la Regla 30 (b) (6).

    ¿Quién podría ser seleccionado como experto en eDiscovery o enlace?

    Abogado (Asesor interno o externo)

    Magistrado especial designado por el tribunal

    Consultor de terceros

    Empresa/Organización Empleado

    ¿Cuáles son las características típicas de un enlace experto en eDiscovery?

    Familiaridad técnica con los sistemas y capacidades electrónicos de las partes.

    Comprensión técnica de eDiscovery.

    Familiaridad y capacidad para establecer «cadena de custodia» para todos los ESI.

    Preparado para participar en la resolución de disputas y litigios de eDiscovery.

    Contenido desarrollado originalmente para proporcionar una visión general de la información almacenada electrónicamente para quienes llevan a cabo la planificación de la Regla Federal 26 (f) «Meet and Confer».

    (1) Robinson, R. (2009). Considerando Meet and Confer. 1ª ed. [ebook] Tecnologías legales Orange. Disponible en: [Accedido 25 ago. 2018].

    (2) Edrm.net. (2018). ESI/Información almacenada electrónicamente. [online] Disponible en: [Accedido 25 ago. 2018].

    (3) Hedges, R., Rothstein, B. y Wiggins, E. (2017). Gestión del Descubrimiento de Información Electrónica. 3ª ed. [ebook] Washington, DC: Federal Judicial Center, p.3. Disponible en: [Accedido 25 ago. 2018].

    (4) Rizkallah, J. (2017). El problema de datos grandes (no estructurados). [en línea] Forbes.com. Disponible en: [Accedido 25 ago. 2018].

    Primeras lecciones de la guerra cibernética: un nuevo informe de Microsoft sobre la defensa de Ucrania

    According to a new report from Microsoft, the Russian invasion relies...

    ¿De la continuidad a la cultura? Preservar y proteger los datos del sector público y privado de Ucrania

    Highlighted by ComplexDiscovery prior to the start of the current Ukrainian...

    ¿Está considerando modelos de políticas de control de Blockchain para sistemas de control de acceso (NIST)

    As current information systems and network architectures evolve to be more...

    ¿Amigos en lugares bajos? El informe de investigaciones de violación de datos de 2022 de Verizon

    The 15th Annual Data Breach Investigations Report (DBIR) from Verizon looked...

    TCDI adquirirá la práctica de eDiscovery de Aon

    According to TCDI Founder and CEO Bill Johnson, “For 30 years,...

    Smarsh adquirirá TeleMessage

    “As in many other service industries, mobile communication is ubiquitous in...

    ¿Un trimestre histórico? DISCO anuncia los resultados financieros del primer trimestre de 2022

    According to Kiwi Camara, Co-Founder and CEO of DISCO, “This quarter...

    ¿Eres nuevo de Nuix? Presentación y actualización comercial de la Conferencia Macquarie Australia 2022

    From a rebalanced leadership team to three concurrent horizons to drive...

    ¿En movimiento? Cinética del mercado de eDiscovery para 2022: cinco áreas de interés

    Recently ComplexDiscovery was provided an opportunity to share with the eDiscovery...

    ¿Confiar en el proceso? Datos de costos, gastos y tareas de procesamiento de eDiscovery 2021

    Based on the complexity of cybersecurity, information governance, and legal discovery,...

    ¿El resumen del año? Puntos de datos de costos, gastos y tareas de revisión de eDiscovery 2021

    Based on the complexity of cybersecurity, information governance, and legal discovery,...

    Una mirada 2021 a la colección de eDiscovery: puntos de datos de tareas, gastos y costos

    Based on the complexity of cybersecurity, information governance, and legal discovery,...

    Cinco excelentes lecturas sobre descubrimiento cibernético, de datos y legal para junio de 2022

    From eDiscovery ecosystem players and pricing to data breach investigations and...

    Cinco excelentes lecturas sobre descubrimiento cibernético, de datos y legal para mayo de 2022

    From eDiscovery pricing and buyers to cyberattacks and incident response, the...

    Cinco excelentes lecturas sobre el descubrimiento cibernético, de datos y legal para abril de 2022

    From cyber attack statistics and frameworks to eDiscovery investments and providers,...

    Cinco excelentes lecturas sobre el descubrimiento cibernético, de datos y legal para marzo de 2022

    From new privacy frameworks and disinformation to business confidence and the...

    ¿Caliente o no? Encuesta de confianza empresarial de eDiscovery de verano de 2022

    Since January 2016, 2,701 individual responses to twenty-six quarterly eDiscovery Business...

    ¿Inflexión o deflexión? Una descripción general agregada de ocho encuestas semestrales de precios de eDiscovery

    Initiated in the winter of 2019 and conducted eight times with...

    ¿Alimentar el frenesí? Resultados de la encuesta de precios de eDiscovery de verano

    Initiated in the winter of 2019 and conducted eight times with...

    ¿Oleada o derroche? Dieciocho observaciones sobre la confianza empresarial de eDiscovery en la primavera de 2022

    In the spring of 2022, 63.5% of survey respondents felt that...