Noções básicas sobre informações armazenadas eletronicamente

A working knowledge of electronically stored information (ESI) is foundational for effective, efficient, and comprehensive planning and execution of all electronic discovery tasks. This short, non-all inclusive overview highlights key definitions, descriptions, and attributes related to ESI and may be beneficial for legal and information technology professionals as they consider ESI in the conduct of data and legal discovery.

en flag
nl flag
fr flag
de flag
pt flag
es flag

Uma visão geral de Rob Robinson

Entendendo as informações armazenadas eletronicamente — os elementos da ESI (1)

O que são informações armazenadas eletronicamente?

As informações armazenadas eletronicamente, ou ESI, são descritas pelo EDRM como informações armazenadas eletronicamente em tipos de mídia enumeráveis, independentemente do formato original em que foram criadas. (2)

As Regras Federais de Processo Civil 26 e 34, vigentes a partir de 1º de dezembro de 2006, usam o termo amplo “informações armazenadas eletronicamente” para identificar uma categoria distinta de informações que, juntamente com “documentos” e “coisas tangíveis”, estão sujeitas a direitos e obrigações de descoberta. (3)

O que é Informação?

Do ponto de vista tecnológico, a informação é definida como a síntese de dados. Tecnicamente, os dados são fatos brutos e números que são processados em informações, como resumos e totais. Mas uma vez que a informação também pode ser os dados brutos para o próximo trabalho ou pessoa, os dois termos não podem ser definidos com precisão, e ambos são usados de forma intercambiável.

O que são dados?

Informações factuais, especialmente informações organizadas para análise ou usadas para raciocinar ou tomar decisões.

Ciência da Computação. Informações numéricas ou outras representadas sob uma forma adequada para processamento por um computador.

Escopo de dados (Qual é o escopo dos dados em questão?)

Escopo da Entidade - Entidades que podem ter tido indivíduos envolvidos na criação, revisão ou resposta de dados que podem conter informações relevantes para o assunto em questão.

Escopo de custódia - Indivíduos que podem ter estado envolvidos na criação, revisão ou resposta de dados que podem conter informações relevantes para o assunto em questão.

Escopo do Steward de Dados - Indivíduos que têm responsabilidades de gestão de Tecnologia da Informação para as entidades e indivíduos determinados a estar relacionados com o assunto em questão ou indivíduos que mantêm direitos de acesso aos aplicativos e equipamentos utilizados por essas entidades e organizações.

Âmbito Geográfico - As localidades geográficas das entidades e indivíduos que possam ter estado envolvidos na criação, revisão e/ou resposta de comunicações e/ou documentos relevantes para o assunto em questão, bem como as localidades dos equipamentos utilizados para apoiar a criação, transmissão, revisão e armazenamento de essas comunicações e/ou documentos.

Escopo do Período de Tempo - O período em que informações relevantes podem ter sido criadas, revisadas ou respondidas para o assunto em questão.

Escopo do Volume - O volume estimado de dados que podem conter informações relevantes para o assunto em questão.

Estrutura de dados (Qual é a estrutura dos dados?)

Não estruturados - Dados não estruturados (ou informações não estruturadas) referem-se a massas de (geralmente) informações digitais em que cada bit de informação não tem um formato e significado atribuídos. Exemplos de “dados não estruturados” podem incluir áudio, vídeo e texto não estruturado, como o corpo de um e-mail ou documento de processador de texto. Dados não estruturados representam aproximadamente 80% dos dados corporativos. (4)

Estruturado - Dados estruturados (ou informação estruturada) refere-se a massas de (geralmente) informações digitais em que cada bit de informação tem um formato e significado atribuídos. Exemplos de “dados estruturados” podem incluir um banco de dados como SQL ou uma planilha como o Excel. Os dados estruturados representam aproximadamente 20% dos dados corporativos.

Formato de Dados (Qual é o formato dos dados?)

Imagem Estática - Imagens que transmitem seu significado em termos visuais, por exemplo, imagens pictóricas, fotografias, cartazes, gráficos, diagramas, desenhos arquitetônicos documentais. Formatos para essas imagens podem ser bitmap (às vezes chamado raster), vetor ou alguma combinação dos dois. Uma imagem bitmap é uma matriz de pontos (geralmente chamados de pixels, de elementos de imagem, quando se refere a exibição de tela), o tipo de imagem produzida por uma câmera digital ou um scanner. As imagens vetoriais são constituídas por objetos escaláveis — linhas, curvas e formas — definidos em termos matemáticos, muitas vezes com inserções tipográficas.

Som - Conteúdo de som independente de mídia que pode ser dividido em duas sub-categorias de formato. A primeira subcategoria consiste em formatos que representam som gravado, muitas vezes chamado de som de forma de onda. Tais formatos são empregados para aplicações como gravações musicais populares, livros gravados e histórias orais digitais. A segunda subcategoria consiste em formatos que fornecem dados para suportar a construção dinâmica do som através de combinações de software e hardware. Esse software inclui sequenciadores e rastreadores que usam dados que controlam quando elementos sonoros individuais devem iniciar e parar, atributos como volume e pitch e outros efeitos que devem ser aplicados aos elementos sonoros. Os elementos sonoros podem ser seções curtas de som de forma de onda (às vezes chamados de amostras ou loops) ou elementos de dados que caracterizam um som para que um sintetizador (que pode estar em software ou hardware) ou gerador de som (geralmente hardware) possam produzir o som real. Os dados são reunidos quando o arquivo é reproduzido, ou seja, os sons são gerados dinamicamente em tempo de execução. Esta segunda subcategoria às vezes é chamada de áudio estruturado.

Moving Image - Uma variedade de formatos de imagem digital em movimento independentes de mídia e suas implementações. Alguns formatos, por exemplo, QuickTime e MPEG-4, permitem uma ampla gama de implementações em comparação com, digamos, MPEG-2, um formato de codificação cujas possíveis implementações são relativamente mais restritas.

Textual - Trabalhos de conteúdo consistindo principalmente de texto.

Arquivo Web - Conteúdo em formatos que podem conter os resultados de um rastreamento de um site ou conjunto de sites da Web, uma ação dinâmica resultante do uso de um pacote de software que chama páginas da Web e as captura na forma disseminada aos usuários.

Genérico - Conteúdo em formatos genéricos amplamente aceitáveis para incluir, mas não limitado a, especificações para wrappers (por exemplo, RIFF e ISO_BMFF), formatos de agrupamento (por exemplo, METS e AES-31) e codificações (por exemplo, UTF-8 e IEEE 754 1985).

Estado dos dados (Qual é o estado dos dados?)

Estado ativo - Dados ativos são informações que residem nos discos rígidos ou unidades ópticas de sistemas informáticos, que são facilmente visíveis para o sistema operacional ou software de aplicação com o qual foram criados e são imediatamente acessíveis aos usuários sem exclusão, modificação ou reconstrução.

Estado estático - Dados estáticos (ou Dados de arquivo) são informações que não são diretamente acessíveis ao usuário de um sistema de computador, mas que a organização mantém para fins de armazenamento e manutenção de registros de longo prazo. Os dados estáticos podem ser gravados em mídia removível, como CD, mídia magneto-óptica, fita ou outro dispositivo de armazenamento eletrônico, ou podem ser mantidos em discos rígidos do sistema em formatos compactados.

Estado Residual: Dados residuais (às vezes referidos como “Dados Ambientes”) refere-se a dados que não estão ativos em um sistema de computador. Os dados residuais incluem dados encontrados no espaço livre de mídia; dados encontrados no espaço de folga de arquivos; e dados dentro de arquivos que foram funcionalmente excluídos, pois não são visíveis usando o aplicativo com o qual o arquivo foi criado, sem o uso de técnicas especiais de recuperação de dados undelete ou de dados.

Rede de dados (Como é que se “conecta” aos dados?)

Não em rede: os dados não estão interligados a um grupo de computadores.

Rede de Área Pessoal (PAN): Uma rede de área pessoal (PAN) é uma rede de computadores usada para comunicação entre dispositivos de computador próximos de uma pessoa. Alguns exemplos de dispositivos que podem ser usados em um PAN são impressoras, máquinas de fax, telefones, PDAs ou scanners. O alcance de um PAN é tipicamente dentro de cerca de 20-30 pés (aproximadamente 4-6 metros). As PANs podem ser usadas para comunicação entre os dispositivos individuais (comunicação intrapessoal), ou para conexão com uma rede de nível superior e a Internet (um uplink).

Rede Local (LAN): Uma rede que cobre uma pequena área geográfica, como uma casa, um escritório ou um edifício. As LANs atuais são mais prováveis de serem baseadas na tecnologia Ethernet.

Rede local sem fio (WLAN): um método de distribuição sem fio para dois ou mais dispositivos que usam ondas de rádio de alta frequência e muitas vezes incluem um ponto de acesso à Internet.

Rede de Área do Campus (CAN): Uma rede que conecta duas ou mais LANs, mas que é limitada a uma área geográfica específica e contígua, como um campus universitário, complexo industrial ou uma base militar. Um CAN pode ser considerado um tipo de MAN (rede de área metropolitana), mas geralmente é limitado a uma área que é menor do que um MAN típico.

Rede de Área Metropolitana (MAN): Uma Rede de Área Metropolitana é uma rede que conecta duas ou mais Redes Locais ou Redes de Área de Campus, mas não se estende além dos limites da cidade imediata, cidade ou área metropolitana. Vários roteadores, switches e hubs estão conectados para criar um MAN.

Rede Wide Area (WAN): Uma WAN é uma rede de comunicações de dados que abrange uma área geográfica relativamente ampla (isto é, uma cidade para outra e um país para outro país) e que muitas vezes utiliza meios de transmissão fornecidos por transportadoras comuns, como empresas telefónicas.

InternetWork: Duas ou mais redes ou segmentos de rede conectados usando dispositivos que operam na camada 3 (a camada “rede”) do Modelo de Referência Básica OSI, como um roteador. Qualquer interconexão entre ou entre redes públicas, privadas, comerciais, industriais ou governamentais também pode ser definida como uma rede de internet. Na prática moderna, as redes interligadas utilizam o Protocolo de Internet. Existem pelo menos três variantes de uma rede de internet, dependendo de quem administra e quem participa delas:

+ Intranet: Uma intranet é um conjunto de redes interconectadas, usando o Protocolo de Internet e usa ferramentas baseadas em IP, como navegadores da Web, que estão sob o controle de uma única entidade administrativa. Essa entidade administrativa fecha a intranet para o resto do mundo e permite apenas usuários específicos. Mais comumente, uma intranet é a rede interna de uma empresa ou outra empresa.

+ Extranet: Uma extranet é uma rede ou rede de rede que é limitada em escopo a uma única organização ou entidade, mas que também tem conexões limitadas com as redes de uma ou mais outras organizações ou entidades geralmente, mas não necessariamente confiáveis (por exemplo, os clientes de uma empresa podem ter acesso a alguma parte de sua intranet criando desta forma uma extranet, enquanto que, ao mesmo tempo, os clientes podem não ser considerados “confiáveis” do ponto de vista da segurança). Tecnicamente, uma extranet também pode ser categorizada como CAN, MAN, WAN ou outro tipo de rede, embora, por definição, uma extranet não possa consistir em uma única LAN; ela deve ter pelo menos uma conexão com uma rede externa.

+ “A Internet”: uma rede de internet específica, que consiste em uma interconexão mundial de redes governamentais, acadêmicas, públicas e privadas com base na Rede Avançada de Projetos de Pesquisa (ARPANET) desenvolvida pela ARPA do Departamento de Defesa dos EUA — também sede da World Wide Web (WWW) e referida como a “Internet” com um “I” maiúsculo para distingui-lo de outras redes genéricas.

Intranets e extranets podem ou não ter conexões com a Internet. Se estiver conectado à Internet, a intranet ou extranet geralmente está protegida de ser acessada a partir da Internet sem a devida autorização. A própria Internet não é considerada parte da intranet ou extranet, embora a Internet possa servir como um portal para acesso a partes de uma extranet.

Rede de armazenamento de dados (como é possível chegar aos dados de estado ativo?)

Direct Attached Storage (DAS): O DAS (Direct-Attached Storage, armazenamento de conexão direta) refere-se a um sistema de armazenamento digital diretamente conectado a um servidor ou estação de trabalho, sem uma rede de armazenamento entre eles. É um retronym, usado principalmente para diferenciar o armazenamento não em rede de SAN e NAS.

Armazenamento conectado à rede (NAS): o armazenamento conectado à rede (NAS) é um armazenamento de dados de computador em nível de arquivo conectado a uma rede de computadores que fornece acesso a dados a clientes de rede heterogêneos.

SAN (Storage Area Network): uma rede de área de armazenamento (SAN) é uma arquitetura para conectar dispositivos de armazenamento de computador remoto (como disk arrays, bibliotecas de fitas e jukeboxes ópticas) a servidores de tal forma que, para o sistema operacional, os dispositivos apareçam como conectados localmente.

Mídia de armazenamento de dados (como se mantém os dados de estado estático?)

Meios de armazenamento baseados em semi condutores (cartões de memória, unidades flash USB, PDAs, leitores de áudio digitais, câmeras digitais, telefones celulares, copiadoras, discos rígidos de estado sólido)

Mídia de armazenamento baseada em magnetismo (disquete, disco rígido, fita magnética)

Mídia de armazenamento óptico e magneto-óptico (CD, CD-ROM, DVD, BD-R, BD-RE, DVD HD, CD-R, DVD-R, DVD+R, CD-RW, DVD-RW, DVD+RW, DVD-RAM, UDO)

Volume de dados (quantos dados serão agidos?)

Descompactado - Dados que não tenham sofrido um processo de transformação de uma representação para outra, representação menor a partir da qual o original, ou uma aproximação próxima a ele, pode ser recuperado.

Compactado - Dados tendo sofrido um processo de transformação de uma representação para outra, representação menor a partir da qual o original, ou uma aproximação próxima a ele, pode ser recuperado.

Criptografia de dados (os dados são criptografados?)

Dados não criptografados - Dados que não tenham sido submetidos a um procedimento que torna o conteúdo de uma mensagem de computador ou arquivo ininteligível para qualquer pessoa que não esteja autorizada a lê-lo. Os dados são codificados matematicamente com uma cadeia de caracteres chamada chave de criptografia de dados.

Dados criptografados - Dados submetidos a um procedimento que torna o conteúdo de uma mensagem de computador ou arquivo ininteligível para qualquer pessoa que não esteja autorizada a lê-lo. Os dados são codificados matematicamente com uma cadeia de caracteres chamada chave de criptografia de dados.

Formato de Código de Dados (Quais recursos serão necessários para exibir informações?)

Suporte Unicode - Suporte Unicode fornece um número único para cada personagem, não importa o que a plataforma, não importa o que o programa, não importa o que o idioma.

Suporte não Unicode - O Formato de Código de Dados não fornece um número exclusivo para cada personagem, independentemente da plataforma, programa ou idioma.

Saída de Dados (Como os relatórios de dados ou arquivos serão fornecidos ao solicitante?)

Formatos de arquivo nativos: arquivos produzidos no formato em que foram criados e mantidos são conhecidos como produção nativa. Em uma produção nativa, documentos do MS Word são produzidos como arquivos.doc, arquivos MS Excel são produzidos como arquivos.xls, e arquivos Adobe são produzidos como arquivos.pdf, etc Formato nativo é muitas vezes recomendado para arquivos que não foram criados para impressão, como planilhas e bancos de dados pequenos. Para alguns tipos de arquivo, o formato nativo pode ser a única maneira de produzir adequadamente os documentos.

Formatos quase nativos: alguns arquivos, incluindo a maioria dos e-mails, não podem ser revisados para produção e/ou produzidos sem alguma forma de conversão. A maioria dos arquivos de e-mail deve ser extraída e convertida em arquivos individuais para revisão e produção de documentos. Como resultado, o formato original é alterado e eles não estão mais no formato nativo. Não existe um formato padrão para produções de arquivos quase nativas. Os arquivos são normalmente convertidos para um formato de texto estruturado, como .html ou xml. Esses formatos não requerem software especial para visualização. Outros formatos de email comuns incluem .msg e.eml.

Formatos Near-Paper: ESI também pode ser produzido em um formato quase papel. Renderizar uma imagem é o processo de converter ESI ou digitalizar papel em um arquivo digital não editável. Durante esse processo, uma “imagem” é tirada do arquivo como ele existe ou existiria em formato de papel. Com base nas configurações de impressão no documento, na impressora ou no computador, os dados podem ser alterados ou ausentes da imagem. Experiência no campo da descoberta eletrônica e ferramentas de renderização de imagens são necessárias para minimizar esse risco.

Formatos de papel: Uma produção de papel é exatamente o que parece: o papel é produzido como papel ou ESI é impresso em papel e o papel é produzido. Tal como acontece com a conversão para imagem, a impressão de documentos em papel pode resultar em dados perdidos ou alterados. Ao produzir ESI em papel, recomenda-se utilizar alguém com experiência no campo de ferramentas de detecção eletrônica e renderização de imagens para minimizar esse risco durante o processo de impressão ou renderização de imagens.

Requisitos de armazenamento de dados (como os dados serão armazenados após serem processados?)

Hot - Os dados são armazenados em um estado ativo e são imediatamente acessíveis aos usuários finais.

Quente - Os dados são armazenados em um estado ativo que não é imediatamente acessível aos usuários finais.

Frio - Os dados são armazenados em um estado estático.

Destruir - Dados destruídos.

À medida que se começa a entender essas disposições de armazenamento, pode-se então começar a atribuir valores econômicos (tempo/dinheiro) às abordagens potenciais para obter os dados e disponibilizá-los para todas as partes envolvidas em um assunto específico. Variando de extremamente geral e subjectivo numa extremidade do espectro a muito específico e objectivo na outra, determinar e compreender o valor económico também pode servir de base para discutir, a partir de uma posição de saber se as ESI são acessíveis ou não razoavelmente acessíveis a partir de um caso. Perspectiva jurídica específica.

Estrutura de foco da tecnologia ESI

Criação - permite a criação de ESI.

Conectividade - infra-estrutura que conecta nós de comunicação e armazenamento de ESI.

Comunicação - permite a divulgação e a colaboração em EEI.

Conduta (Gerenciamento) — permite o gerenciamento de área funcional de ESI.

Noções básicas sobre informações armazenadas eletronicamente - Exame

Quais são as categorias gerais de ESI em relação ao exame ESI?

Acessível*: “As informações consideradas 'acessíveis' são armazenadas em um formato facilmente utilizável.” (Zubulake v. UBS Warburg)

Irazoavelmente acessível: informações não armazenadas em um formato razoavelmente utilizável.

Quais são as potenciais implicações de preservação e produção das ESI acessíveis/não acessíveis?

Acessível - Necessidade de preservar e produzir.

Acessível irracionalmente - Necessidade de preservar e compreender os requisitos para a produção.

Que meios electrónicos podem ter de ser examinados para o ESI*?

Dados on-line ativos (normalmente acessíveis)

Dados nearline (normalmente acessíveis)

Armazenamento/arquivos off-line (às vezes acessíveis, às vezes irracionalmente acessíveis)

Fitas de backup (normalmente não razoavelmente acessíveis)

Dados apagados, fragmentados ou danificados (normalmente não razoavelmente acessíveis)

* Continuum de Acessibilidade não é definido no FRCP, pois pode mudar ao longo do tempo.

Noções básicas sobre informações armazenadas eletronicamente - Especialistas

Por que a necessidade de determinar especialistas em eDiscovery para investigações e litígios?

Permite a seleção de um principal conselheiro de Descoberta Eletrônica para o advogado responsável de registro.

Permite a seleção de um liaison/facilitador de eDiscovery para coordenação e comunicação.

Permite a seleção e treinamento proativos de especialistas da Regra 30, alínea b), ponto 6).

Quem pode ser selecionado como um especialista/ligação de Descoberta Eletrônica?

Advogado (Assessoria interna ou externa)

Tribunal nomeado Mestre Especial

Consultor Terceiro

Funcionário da Empresa/Organização

Quais são as características típicas de um contato especializado de eDiscovery?

Familiaridade técnica com os sistemas eletrônicos e as capacidades do partido.

Compreensão técnica de eDiscovery.

Familiaridade e capacidade de estabelecer “cadeia de custódia” para todas as ESI.

Preparado para participar de resoluções de litígios e litígios de Descoberta Eletrônica.

Conteúdo originalmente desenvolvido para fornecer uma visão geral das informações armazenadas eletronicamente para aqueles que conduzem o planejamento “Meet and Confer” da Regra Federal 26 (f).

(1) Robinson, R. (2009). Considerando Meet and Confer. 1ª ed. [ebook] Laranja Tecnologias Jurídicas. Disponível em: [Acessado 25 Ago. 2018].

(2) EDRM.net. (2018). ESI/Informações armazenadas eletronicamente. [online] Disponível em: [Acessado 25 Ago. 2018].

(3) Hedges, R., Rothstein, B. e Wiggins, E. (2017). Gestão da Descoberta de Informações Eletrónicas. 3rd ed. [ebook] Washington, DC: Centro Judiciário Federal, p.3. Disponível em: [Acessado 25 Ago. 2018].

(4) Rizkallah, J. (2017). O problema de dados grandes (não estruturados). [online] Forbes.com. Disponível em: [Acessado 25 Ago. 2018].

Da Rússia (e da China) com amor? Revisão anual do Centro Nacional de Segurança Cibernética do Reino Unido

According to the NCSC Annual Review, China remained a highly sophisticated...

Novos manuais de resposta a incidentes de segurança cibernética e vulnerabilidade do governo federal

According to Matt Hartman, Deputy Executive Assistant Director for Cybersecurity, "The...

Um aumento na cibercriminalidade? O relatório anual do cenário de ameaças da ENISA - 9ª edição

According to EU Agency for Cybersecurity Executive Director Juhan Lepassaar, “Given...

Considerando Zero Trust? Relatório de eventos cibernéticos de novembro de 2021 da OTAN CCDOE

Computer security professionals love to say that there is no such...

Epiq adquire o Simplex

According to the release, the acquisition will increase the overall scale...

Uma pista forte? Arquivos KLDiscovery para oferta pública inicial

On Tuesday, November 23, 2021, KLDiscovery took a strong step toward...

Modus protege a instalação de capital de giro de J.P. Morgan

According to Steven Horan, Chairman, and CEO of Modus, “Having the...

Fusão de descoberta inovadora e orientada

According to the announcement, Silver Oak Services Partners, a private equity...

Um mashup de tamanho de mercado de eDiscovery: visão geral mundial de software e serviços de 2021-2026

From market retraction in 2020 to resurgence in 2021, the worldwide...

A New Era in eDiscovery? Framing Market Growth Through the Lens of Six Eras

There are many excellent resources for considering chronological and historiographical approaches...

Um Mashup de tamanho do mercado de eDiscovery: 2020-2025 Visão geral mundial de software e serviços

While the Compound Annual Growth Rate (CAGR) for worldwide eDiscovery software...

Redefinindo a linha de base? Ajustes de tamanho do mercado de eDiscovery

An unanticipated pandemeconomic-driven retraction in eDiscovery spending during 2020 has resulted...

Cinco ótimas leituras sobre descoberta cibernética, dados e legal para novembro de 2021

From worldwide eDiscovery market sizing and discovery intelligence to cybersecurity playbooks...

Cinco ótimas leituras sobre descoberta cibernética, de dados e legal para outubro de 2021

From artificial intelligence and predictive coding to eDiscovery business confidence and...

Cinco ótimas leituras sobre descoberta cibernética, de dados e legal para setembro de 2021

From countering ransomware to predictive coding and packaged services, the September...

Cinco ótimas leituras sobre descoberta cibernética, de dados e legal para agosto de 2021

From the interplay of digital forensics in eDiscovery to collecting online...

Realidade alternativa? Resultados da pesquisa de preços do eDiscovery de

Based on the complexity of data and legal discovery, it is...

Calma antes da tempestade? Dezoito observações sobre a confiança dos negócios de eDiscovery no outono de 2021

In the fall of 2021, 71.2% of survey respondents felt that...

Procura-se ajuda? Problemas que afetam o desempenho comercial do eDiscovery: uma visão geral do outono de 2021

In the fall of 2021, 27.4% of respondents viewed lack of...

Tempo de colheita? Métricas operacionais de eDiscovery no outono de 2021

In the fall of 2021, 67 eDiscovery Business Confidence Survey participants...