Puuttuuko jotain? Aiheen mallinnus eDiscoveryssa

The basic idea behind topic modeling, according to eDiscovery expert and author Herbert Roitblat, is that documents consist of words that are derived from some mixture of topics. The goal of eDiscovery, argues the author, is to get the information contained in a collection of documents, not to get the documents themselves. The documents are just a means to reach the information.

en flag
nl flag
et flag
fi flag
fr flag
de flag
pt flag
ru flag
es flag

Toimittajan huomautus: Ediscoveryn kirjoittajana, rahoittajana ja puhujana Herbert Roitblat on teknologiayrittäjä, keksijä ja asiantuntija, joka ei tarvitse esitellä eDiscovery-ekosysteemin vakavia ammattilaisia. Tällä hetkellä hän toimii Mimecastin päätietotieteilijänä ja on tunnustettu asiantuntija aloilla, jotka ulottuvat kognitiivisesta tieteestä ja tiedonhausta eDiscoveryyn ja koneoppimiseen. Tuottelias tutkija ja kirjailija, hänen äskettäin julkaistu paperi tutkimus ajankohtainen mallinnus eDiscovery kiinnittää huomiota hakuprosessin oikeudellisen löytämisen ja korostaa, että tietokoneavusteinen hakuprosessi ei ole vain kohtuullinen, mutta se on myös täydellinen, kun mitataan aiheita. Tämä paperi, joka on jaettu luvalla, on tarkoitettu harkintaasi varten.

Onko jotain, mitä minulta puuttuu? Aiheen mallinnus eDiscoveryssa

Kirjoittaja Herbert Roitblat, Ph.D.

Tiivistelmä

Oikeudellisessa eDiscovery-järjestelmässä osapuolten on etsittävä sähköisesti tallennettuja tietojaan löytääkseen tietyn tapauksen kannalta merkityksellisiä asiakirjoja. Neuvottelut näiden hakujen laajuudesta perustuvat usein pelkoon, että jotain jää väliin. Tämä paperi jatkaa väitettä, että löydön tulisi perustua asian tosiasioiden tunnistamiseen. Jos hakuprosessi on pienempi kuin valmis (jos se on Recall alle 100%), se voi silti olla täydellinen kaikkien asiaankuuluvien käytettävissä olevien aiheiden esittämisessä. Tässä tutkimuksessa Latent Dirichlet Aallokointia käytettiin 100 aiheen tunnistamiseen kaikista tunnetuista asiaankuuluvista asiakirjoista. Asiakirjat luokiteltiin sitten noin 80% Recall (eli 80% asiaankuuluvista asiakirjoista löytyi kategorizer, nimettiin osuma sarja ja 20% jäi, nimetty jäänyt sarja). Huolimatta siitä, että luokitteleja tunnisti vähemmän kuin kaikki asiaankuuluvat asiakirjat, yksilöidyt asiakirjat sisälsivät kaikki aihealueet, jotka on johdettu täydellisistä asiakirjoista. Tämä sama kuvio pidettiin, oliko luokittelija naiivi Bayes-luokittelija koulutettu satunnainen valikoima asiakirjoja tai Support Vector Machine koulutettu Continuous Active Learning (jossa keskitytään arviointi todennäköisimpi-to-be-asiaankuuluviin asiakirjoihin). Kummankaan kategorisaattorin vastaamatta jääneestä joukosta ei tunnistettu aiheita, joita ei jo näkynyt hittijoukossa. Paitsi että tietokoneavusteinen hakuprosessi on kohtuullinen (kuten liittovaltion siviiliprosessilain säännöissä vaaditaan), se on myös täydellinen, kun se mitataan aiheilla.

Täydellisen paperin (PDF) tarkistaminen

Aiheen mallinnus eDiscovery — Herbert Roitblat Ph.D

Lue alkuperäinen paperi ARXIV® (Cornellin yliopisto) kautta

Ylimääräinen lukeminen

Onko kaikki suhteellista? Predictive Cooding Technologies and Protocols Survey - Kevään 2020 tulokset

Alustoista työnkulkuihin: ennustavat koodausteknologiat ja protokollat Survey - Syksyn 2019 tulokset

Lähde: ComplexDiscovery

Ennakoivasta havaitsemisesta tietomurron arviointeihin: arkaluonteisten tietojen etsiminen ja poistaminen Asceman avulla

A steady rise in the number of sensitive data discovery requirements...

Perusviivan nollaaminen? eDiscoveryn markkinakoon mukautukset vuodelle 2020

An unanticipated pandemeconomic-driven retraction in eDiscovery spending during 2020 has resulted...

Uutta NIST:stä: Kyberturvallisuuden ja yritysriskien hallinnan integrointi (ERM)

NIST has released NISTIR 8286, Integrating Cybersecurity and Enterprise Risk Management...

Pilvinen liitto? Seuraavan sukupolven pilvi Euroopalle

According to Thierry Breton, Commissioner for the Internal Market, "Europe needs...

A Running List: Top 100+ eDiscovery Providers

Based on a compilation of research from analyst firms and industry...

eDisclosure Systems Buyers Guide — 2020 Edition (Andrew Haslam)

Authored by industry expert Andrew Haslam, the eDisclosure Buyers Guide continues...

Kisa lähtöviivalle? Viimeaikaiset Secure Remote Review -ilmoitukset

Not all secure remote review offerings are equal as the apparent...

EtäeDiscoveryn ottaminen käyttöön? Tilannekuva DAAasista

Desktop as a Service (DaaS) providers are becoming important contributors to...

Perusviivan nollaaminen? eDiscoveryn markkinakoon mukautukset vuodelle 2020

An unanticipated pandemeconomic-driven retraction in eDiscovery spending during 2020 has resulted...

Kotiin vai pois? eDiscovery Malliston markkinoiden mitoitukseen ja hinnoitteluun liittyvät näkökohdat

One of the key home (onsite) or away (remote) decisions that...

Tarkistuksia ja päätöksiä? Uusia huomioita eDiscovery Secure Remote -arvosteluille

One of the key revision and decision areas that business, legal,...

Makrokatsaus menneisyyteen ja ennustettuun eDiscoveryn markkina-kokoon 2012—2024

From a macro look at past estimations of eDiscovery market size...

Muutoksen kausi? 18 huomautusta eDiscovery Business Luottamus syksyllä 2020

In the fall of 2020, 77.2% of eDiscovery Business Confidence Survey...

Jatkuva tapaus, joka koskee budjettirajoitteita eDiscoveryn liiketoiminnassa

In the fall of 2020, 49.4% of respondents viewed budgetary constraints...

Kirjanpitoa? eDiscoveryn operatiiviset mittarit syksyllä 2020

In the fall of 2020, eDiscovery Business Confidence Survey more...

Peräsimen piteleminen? Syksyn 2020 eDiscovery Business Luottamuskyselyn

This is the twentieth quarterly eDiscovery Business Confidence Survey conducted by...

DISCO nostaa 60 miljoonaa dollaria

According to the media release, DISCO will use this investment to...

Rampiva ja RYABI Groupin yhdistäminen

According to today's announcement, the RYABI Group merger is Rampiva's first...

eDiscovery-yrityskeskittymät, yritysostot ja sijoitukset Q3 2020 -hankkeeseen

From HaystackID and NightOwl Global to Reveal Data and NexLP, the...

Mitratech hankkii Acuity ELM

According to Mike Williams, CEO of Mitratech, “We came to the...

Viisi suurta lukee eDiscovery lokakuussa 2020

From business confidence and captive ALSPs to digital republics and mass...

Viisi suurta lukee eDiscovery syyskuu 2020

From cloud forensics and cyber defense to social media and surveys,...

Viisi suurta lukua eDiscoveryssa elokuulle 2020

From predictive coding and artificial intelligence to antitrust investigations and malware,...

Viisi suurta lukua eDiscovery-ohjelmassa heinäkuulle 2020

From business confidence and operational metrics to data protection and privacy...