Laajemman verkon valaminen? Ennakoiva koodausteknologia ja protokollat -tutkimus — Syksyn 2020 tulokset

The Predictive Coding Technologies and Protocols Survey is a non-scientific semi-annual survey designed to help provide a general understanding of the current application of predictive coding technologies, protocols, workflows, and uses by data discovery and legal discovery professionals.

en flag
nl flag
et flag
fi flag
fr flag
de flag
pt flag
ru flag
es flag

Toimittajan huomautus: Nämä ovat tulokset viidennen puolivuotisen ennustava koodaus Technologies and Protocols Survey toteutti ComplexDiscoveryn. Viidessä kyselyssä on tästä päivästä lähtien saatu yksityiskohtaista palautetta 319 lailliselta, liike-elämän ja teknologian ammattilaiselta tiettyjen koneoppimistekniikoiden käytöstä ennakoivassa koodauksessa. Tutkimukset ovat myös antaneet tietoa näiden koneoppimistekniikoiden käytöstä osana esimerkiksi teknologiaavusteisia arviointiprotokollia.

Kyselyn iteroinnissa oli 85 vastaajaa, ja se keskittyi edelleen ennakoiviin koodaustekniikoihin, protokolliin, työnkulkuihin ja käyttötarkoituksiin eDiscovery-ekosysteemissä. Syksyn 2020 kyselyyn sisältyi myös yksi uusi kysymys ennakoivan koodauksen käytön yleisyydestä eDiscovery-työnkulkujen yhteydessä.

Ennakoiva koodausteknologia ja protokollat syksyllä 2020 -kysely

Predictive Coding Technologies and Protocols Survey on ei-tieteellinen kysely, jonka tarkoituksena on antaa yleinen käsitys ennakoivien koodaustekniikoiden, protokollien ja työnkulkujen käytöstä eDiscovery-ekosysteemissä. Syksy 2020 -kysely oli avoinna 7. elokuuta 2020, aina 14. elokuuta 2020, ja siihen osallistui henkilöitä, joita ComplexDiscovery kutsui osallistumaan suoraan.

Kyselyllä oli kaksi ensisijaista koulutustavoitetta, jotka on suunniteltu antamaan yleinen käsitys ennakoivista koodaustekniikoista ja protokollista:

Mahdollisten ennakoivien koodaustekniikan, protokollan ja työnkulun määritysten konsolidoitu luettelo. Vaikka se ei ole kaiken kattava tai kattava, listaus tarkastettiin valituilla alan ennakoivilla koodausasiantuntijoilla täydellisyyden ja tarkkuuden vuoksi, joten se näyttää olevan kannattavaa käytettäväksi koulutustoimissa.

Kysy eDiscovery-ekosysteemiammattilaisilta heidän mieltymyksistään ja käyttötavoistaan, jotka koskevat ennakoivia koodausalustoja, teknologioita, protokollia, työnkulkuja ja käyttöalueita.

Kysely tarjosi vastaajille mahdollisuuden tarjota ennakoivaa koodauksen taustatietoa, mukaan lukien niiden ensisijainen ennakoiva koodausalusta, sekä esitti viisi erityistä kysymystä vastaajille. Nämä kysymykset ovat:

Kuinka usein käytät ennakoivaa koodausta osana eDiscovery-työnkulkua? (Esiintyvyys)

Mitä ennakoivia koodaustekniikoita eDiscovery-alustasi hyödyntää? (Teknologiat)

Mitä teknologiaavusteisia tarkistusprotokollia käytetään ennakoivan koodauksen toimittamisessa? (Protokollat)

Mikä on ensisijainen teknologia-avusteinen tarkistustyönkulku, jota käytetään ennakoivan koodauksen toimittamisessa? (Työnkulku)

Mitkä ovat alueet, joilla käytät teknologiaavusteisia tarkistustekniikoita, protokollia ja työnkulkuja? (Käyttöalueet)

14. elokuuta 2020 suljettuna syksyllä 2020 tehdyssä kyselyssä oli 85 vastaajaa.

Tärkeimmät tulokset ja havainnot

Ennakoivan koodaustekniikan ja protokollan kyselyyn vastanneiden yleiskatsaus (kuvio 1)

Vastaajista 43,53 prosenttia oli asianajotoimistoista.

Vastaajista 35,29 prosenttia oli ohjelmisto- tai palveluntarjoajaorganisaatioista.

Loput 2,18 prosenttia vastanneista kuului joko konsulttiyritykseen (8,24 prosenttia), yhtiöön (4,71%), valtioon (1,18 prosenttia) tai muuntyyppiseen yksikköön (7,06 prosenttia).

Ensisijainen ennakoiva koodausalusta (kuvio 2)

89,41 prosenttia vastanneista ilmoitti, että heillä on ainakin yksi ensisijainen alusta ennustavaa koodausta varten.

Vastaajien ensisijaiseksi ennakoivaksi koodausalustaksi ilmoitettiin 22 eri alustaa.

Suhteellisuusteoria raportoitiin ensisijaisena ennakoivana koodausalustana 36,47% kyselyyn vastanneista.

Kaksi parasta alustaa ilmoitettiin ensisijaisena ennakoivana koodausalustana 52,94% kyselyyn vastanneista.

10,59 prosenttia vastanneista ilmoitti, ettei heillä ole ensisijaista alustaa ennakoivaan koodaukseen.

Ennakoivan koodauksen käytön esiintyvyys eDiscoveryssa (kuvio 3)

Yli kolmasosa kyselyyn vastanneista (36,47%) ilmoitti käyttäneensä ennustavaa koodausta eDiscovery-työnkulussaan yli 50% ajasta.

80% vastanneista ilmoitti käyttäneensä ennakoivaa koodausta eDiscovery-työnkulussaan vähintään 5% ajasta.

Vain 20% vastanneista ilmoitti käyttäneensä ennustavaa koodausta eDiscovery-työnkulussaan alle 5% ajasta.

Ennakoiva koodaus teknologian työllisyys (kuvio 4)

Active Learning raportoitiin käytetyimmäksi ennakoivaksi koodaustekniikaksi, ja 88,24% vastanneista käytti sitä ennakoivissa koodausponnisteluissaan.

36,47 prosenttia vastanneista ilmoitti käyttäneensä vain yhtä ennakoivaa koodaustekniikkaa ennakoivissa koodausponnisteluissaan.

61,18 prosenttia vastanneista ilmoitti käyttäneensä ennustavassa koodaustoiminnassaan useampaa kuin yhtä ennustavaa koodaustekniikkaa.

2,35 prosenttia vastanneista ei raportoinut käyttämällä mitään erityistä ennakoivaa koodaustekniikkaa.

Teknologiaavusteinen tarkistusprotokollan työllisyys (kuvio 5)

Kaikkia luetteloituja teknologiaavusteisia protokollia ennakoivaan koodaukseen ilmoitettiin käytettävän ainakin yhden kyselyvastaajan käytössä.

Continuous Active Learning® (CAL®) ilmoitettiin käytetyimmäksi ennakoivaksi koodausprotokollaksi, ja 88,24% vastanneista käytti sitä ennakoivissa koodausponnisteluissaan.

49,41 prosenttia vastanneista ilmoitti käyttäneensä vain yhtä ennakoivaa koodausprotokollaa ennakoivissa koodausponnisteluissaan.

48,24 prosenttia vastanneista ilmoitti käyttäneensä ennustavassa koodaustoiminnassaan useampaa kuin yhtä ennustavaa koodausprotokollaa.

2,35% vastanneista ilmoitti, ettei käyttänyt mitään ennakoivaa koodausprotokollaa.

Teknologiaavusteinen tarkastelu Työnkulun työllisyys (kuvio 6)

68,24% vastanneista ilmoitti käyttäneensä Technology-Assisted Review (TAR) 2.0:aa ensisijaisena työnkuluna ennakoivan koodauksen toimituksessa.

8,24% vastanneista ilmoitti käyttäneensä TAR 1.0: tä ja 11,76% vastanneista ilmoitti käyttäneensä TAR 3.0:aa ensisijaisena työnkuluna ennakoivan koodauksen toimituksessa.

11,76% vastanneista ei ilmoittanut TAR 1.0: n, TAR 2.0: n tai TAR 3.0:n käyttämistä ensisijaisena työnkuluna ennakoivan koodauksen toimituksessa.

Teknologiaavusteiset tarkistuskäyttötarkoitukset (kuvio 7)

92,94 prosenttia vastanneista ilmoitti käyttäneensä teknologiaavusteista tarkastelua useammalla kuin yhdellä data-alueella ja oikeudellista löytämistä.

94,12 prosenttia vastanneista ilmoitti käyttäneensä teknisesti avustettua tarkastelua asiaankuuluvien asiakirjojen tunnistamiseksi.

16,47 prosenttia vastanneista ilmoitti käyttäneensä teknologiaavusteista tarkastelua tietohallinnon ja tietojen luovuttamisen yhteydessä.

Kyselykaaviot

(Kaavioita voidaan laajentaa yksityiskohtaiseen katseluun.)

Kuvio 1: Kyselyyn vastanneen yleiskatsaus (tausta)

1-ennakoiva koodaustekniikka-ja-protokollat-Survey-yleiskatsaus-Fall-2020

Kuvio 2: Ensisijaisen ennustavan koodausalustan nimi (tausta)

2-Primary-ennuste-koodaus-alusta-syksy-2020

Kuvio 3: Kuinka usein käytät ennakoivaa koodausta osana eDiscovery-työnkulkua? (Kysymys #1)

3-Ennakoiva koodaus-käyttö-Prevalence-Fall-2020

Kaavio 4: Mitä ennakoivia koodaustekniikoita eDiscovery-alustasi hyödyntää? (Kysymys #2)

4-Ennakoiva koodaustekniikka-Käytetty-syksy-2020

Kuvio 5: Mitä teknologiaavusteisia tarkistusprotokollia käytetään ennakoivan koodauksen toimittamisessa? (Kysymys #3)

5-Teknologia-avustettu tarkistus-protokolla-käyttö-syksy-2020

Kuvio 6: Mikä on ensisijainen teknologia-avusteinen tarkistustyönkulku, jota käytetään ennakoivan koodauksen toimituksessa? (Kysymys #4)

6-Teknologia-avustettu tarkistus-Työnkulku-käyttö-syksy-2020

Kuvio 7: Mitkä ovat alueet, joilla käytät teknologiaavusteisia tarkistustekniikoita, protokollia ja työnkulkuja? (Kysymys #5)

7-Teknologia-avustettu tarkistus-käyttöt-syksy-2020

Ennakoiva koodaustekniikka ja protokollat (Survey Backgrounder)

Kuten The Grossman-Cormack Glossary of Technology-Assisted Review (1) on määritelty, Predictive Coding on toimialakohtainen termi, jota käytetään yleisesti kuvaamaan teknologiaavusteista arviointiprosessia, jossa käytetään koneoppimisalgoritmia, jotta relevantit erottaisiin ei-merkityksellisistä asiakirjoista. asia asiantuntijan koodaus koulutuksen joukko asiakirjoja. Tämä ennakoivan koodauksen määritelmä tarjoaa perustason kuvauksen, joka yksilöi yhden tietyn toiminnon, jota yleisesti hyväksyttyjen koneoppimisalgoritmien yleinen joukko voi käyttää teknologiaavusteisessa tarkastelussa (TAR).

Kun ennakoivan koodauksen tietoisuus ja käyttö on yhä enemmän oikeudellista areenaa, näyttää siltä, että sähköisten löytöjen ammattilaisten on yhä tärkeämpää saada yleinen käsitys teknologioista, joita voidaan toteuttaa sähköisissä löytöalustoissa ennustavan koodauksen helpottamiseksi sähköisesti tallennetut tiedot. Tämä yleinen ymmärrys on olennainen, koska jokaisella mahdollisella algoritmisella lähestymistavalla on tehokkuusetuja ja haittoja, jotka voivat vaikuttaa ennakoivan koodauksen tehokkuuteen ja tehokkuuteen.

Jotta voidaan auttaa kehittämään tätä yleistä ymmärrystä ennakoivista koodaustekniikoista ja tarjota sähköisten löytöjen tarjoajille mahdollisuus jakaa käyttämiään teknologioita ja protokollia alustojensa kanssa ennakoivan koodauksen toteuttamiseksi, seuraavat ennakoivan koodauksen työluettelot -tekniikat ja TAR-protokollat ovat käyttöäsi varten. Ennakoivan koodauksen työnkulkujen ja käyttötarkoitusten työluettelot sisältyvät myös harkintaan, sillä ne auttavat määrittämään, miten ennakoivia koodaustekniikoita ja TAR-protokollia toteutetaan ja käytetään.

Ennakoivien koodaustekniikoiden työluettelo (1,2,3,4)

Ammattijulkaisuihin ja henkilökohtaisiin keskusteluihin perustuvien sähköisten löytöjen asiantuntijoista koottu alla on ei-all inclusive -työluettelo yksilöidyistä koneoppimistekniikoista, joita on sovellettu tai joita voidaan soveltaa eDiscoveryn kurinalaisuuteen helpottaakseen ennakoiva koodaus. Tämä työluettelo on suunniteltu tarjoamaan viitepiste tunnistetuille ennakoiville koodaustekniikoille, ja se voi ajan myötä sisältää lisäyksiä, mukautuksia ja muutoksia, jotka perustuvat näihin valtavirtatekniikoihin soveltavien ja toteuttavien asiantuntijoiden ja organisaatioiden palautteeseen erityisissä eDiscovery-alustoissaan.

Listattu aakkosjärjestyksessä

Aktiivinen oppiminen: Tyypillisesti iteratiivinen prosessi, jossa algoritmia käytetään valitsemaan asiakirjoja, jotka on tarkistettava koulutusta varten strategian perusteella, joka auttaa luokitusalgoritmia oppimaan tehokkaasti.

Päätöspuu: Vaiheittainen menetelmä asiaankuuluvien ja ei-merkityksellisten asiakirjojen erottamiseksi toisistaan riippuen siitä, mitä sanojen yhdistelmää (tai muita ominaisuuksia) ne sisältävät. Päätöspuu, jolla määritetään johdannaisia koskevat asiakirjat, voi ensin määrittää, sisältääkö asiakirjassa sana ”swap”. Jos näin olisi, päätöspuu voisi sitten määrittää, sisältääkö asiakirjassa ”luottoa” ja niin edelleen. Päätöspuu voidaan luoda joko tietotekniikan tai koneoppimisen avulla.

K-lähin naapuri Classifier (K-nN): Luokittelualgoritmi, joka analysoi k-esimerkkiasiakirjat, jotka muistuttavat eniten (lähimpänä) luokiteltavaa asiakirjaa, jotta voidaan määrittää dokumentin paras luokitus. Jos k on liian pieni (esim. k=1), korkeaan takaisinkutsuun pääseminen voi olla äärimmäisen vaikeaa.

Latentti semanttinen analyysi (LSA): Matemaattinen esitys asiakirjoista, joissa käsitellään hyvin korreloivia sanoja (eli sanoja, jotka yleensä esiintyvät samoissa asiakirjoissa) kuin ne ovat tietyssä mielessä samanarvoisia tai vaihdettavissa. Tämän vastaavuuden tai vaihdettavuuden avulla algoritmit voivat tunnistaa dokumentit käsitteellisesti samankaltaisiksi, vaikka ne eivät käyttäisi samoja sanoja (esim. koska synonyymit voivat olla erittäin korreloituneita), vaikka se myös hylkää joitakin mahdollisesti hyödyllisiä tietoja ja voi johtaa ei-toivottuihin tuloksiin, jotka johtuvat väärät korrelaatioita.

Logistinen regressio: Huippuluokan valvottu oppimisalgoritmi koneoppimiseen, joka arvioi sen sisältämien ominaisuuksien perusteella todennäköisyyden sille, että asiakirja on merkityksellinen. Toisin kuin Naïve Bayes, algoritmi, Logistic Regression tunnistaa ominaisuuksia, jotka syrjivät merkityksellisiä ja ei-merkityksellisiä asiakirjoja.

Naive Bayesilainen luokittelu: Järjestelmä, joka tutkii todennäköisyyttä, että uuden asiakirjan jokainen sana on peräisin koulutetusta reagoivasta asiakirjasta tai koulutetuista ei-responsiivisista asiakirjoista. Järjestelmä on sinisilmäinen siinä mielessä, että siinä oletetaan, että kaikki sanat ovat toisistaan riippumattomia.

Neuraaliverkko: An Keinotekoinen hermoverkko (ANN) on laskennallinen malli. Se perustuu biologisten hermoverkkojen rakenteeseen ja toimintoihin. Se toimii kuin tapa, jolla ihmisen aivot käsittelevät tietoa. Se sisältää suuren määrän yhdistettyjä käsittelyyksiköitä, jotka työskentelevät yhdessä tietojen käsittelemiseksi.

Probabilistinen piilevä semanttinen analyysi (PLSA): Tämä on hengeltään samanlainen kuin LSA, mutta siinä käytetään todennäköisyyspohjaista mallia saavuttaakseen tuloksia, joiden odotetaan olevan parempia.

Satunnaiset metsät: Ensemble oppimismenetelmä luokittelua, regressiota ja muita tehtäviä varten, jotka toimivat rakentamalla lukuisia päätöksentekopuita koulutuksen aikana ja antamalla luokan, joka on yksittäisten puiden luokkien (luokittelu) tai keskimääräinen ennustus (regressio). Satunnainen päätös metsät oikea päätös puiden tapa overfit niiden koulutus asettaa.

Relevanssin palaute: Aktiivinen oppimisprosessi, jossa ihmisellä on suurin todennäköisyys merkityksellisyydestä, koodataan ja lisätään koulutusjoukkoon.

Support Vector Machine: Matemaattinen lähestymistapa, joka pyrkii löytämään linjan, joka erottaa reagoivista asiakirjoista, jotta ihanteellisesti kaikki responsiiviset asiakirjat ovat rivin toisella puolella ja kaikki ei-reagoivat ovat toisella puolella.

Yleiset TAR-protokollat (5,6,7,8,9,10)

Lisäksi näitä tekniikoita käytetään yleensä osana TAR-protokollaa, joka määrittää, miten teknologioita käytetään. Esimerkkejä TAR-protokollista ovat:

Listattu aakkosjärjestyksessä

Continuous Active Learning® (CAL®): CAL® -järjestelmässä Maura R. Grossmanin ja Gordon V. Cormackin kehittämä, käyttämä ja puoltama TAR-menetelmä. Peruskoulutusjoukon jälkeen oppija valitsee toistuvasti seuraavat todennäköisimmin merkitykselliset asiakirjat (joita ei ole vielä otettu huomioon) tarkistusta, koodausta ja koulutusta varten, ja jatkaa sitä, kunnes se ei enää löydä asiaankuuluvia asiakirjoja. Toista tarkastelua ei yleensä ole, koska siinä vaiheessa, kun oppija lopettaa oppimisen, kaikki oppijan olennaisiksi katsomat asiakirjat on jo tunnistettu ja tarkistettu manuaalisesti.

Hybrid Multimodal Method: E-Discovery-tiimin (Ralph Losey) kehittämä lähestymistapa, joka sisältää kaikenlaiset hakumenetelmät. Ensisijainen riippuvuus asetetaan ennakoivaan koodaukseen ja korkea-arvoisten asiakirjojen käyttöön jatkuvaan aktiiviseen koulutukseen.

Skaalautuva jatkuva aktiivinen oppiminen (S-CAL): Olennainen ero S-CAL:n ja CAL® :n välillä on se, että S-CALin kohdalla vain rajallinen näyte kustakin peräkkäisestä erästä on valittu merkintöjä varten, ja prosessi jatkuu, kunnes keräys — tai suuri satunnaisnäyte kokoelmasta — on käytetty loppuun. Yhdessä äärelliset otokset muodostavat asiakirjapopulaatiosta ositetun otoksen, josta voidaan johtaa tilastollinen estimaatti ρ.

Simple Active Learning (SAL): SAL-menetelmissä oppija valitsee peruskoulutusjoukon jälkeen opettajan tarkistamat ja koodattavat asiakirjat, joita käytetään koulutusesimerkkeinä, ja jatkaa esimerkkien valitsemista, kunnes se on riittävän koulutettu. Tyypillisesti oppijan valitsemat asiakirjat ovat sellaisia, joista oppija on vähiten varma ja joista se oppii eniten. Kun oppija on riittävän koulutettu, sen jälkeen käytetään jokaisen kokoelman asiakirjan merkitsemiseen. Kuten SPL:ssä, olennaisiksi merkittyjä asiakirjoja tarkastellaan yleensä uudelleen manuaalisesti.

Yksinkertainen passiivinen oppiminen (SPL): Yksinkertaisissa passiivisessa oppimisessa (”SPL”) opettaja (eli ihmisoperaattori) valitsee koulutusesimerkkeinä käytettävät asiakirjat. Oppijaa koulutetaan näiden esimerkkien avulla, ja kun hän on riittävän koulutettu, sitä käytetään jokaisen kokoelman asiakirjan merkitsemiseen asiaankuuluviksi tai ei-relevanttia. Yleensä oppijan olennaisiksi merkitsemät asiakirjat tarkistetaan manuaalisesti. Tämä manuaalinen tarkastelu edustaa pientä murto-osaa kokoelmasta ja siten pientä murto-osaa tyhjentävän manuaalisen tarkastelun ajasta ja kustannuksista.

TAR Työnkulut (11)

TAR-työnkulut edustavat ennakoivien koodaustekniikoiden ja -protokollien käytännön soveltamista ennakoivien koodaustehtävien suorittamiseen. Kolme esimerkkiä TAR-työnkuluista ovat:

TAR 1.0 sisältää harjoitusvaiheen, jota seuraa tarkistusvaihe, jossa ohjausjoukkoa käytetään määrittämään optimaalinen piste, jolloin sinun pitäisi siirtyä koulutuksesta tarkistukseen. Järjestelmä ei enää opi harjoitusvaiheen valmistuttua. Ohjausjoukko on satunnainen joukko asiakirjoja, jotka on tarkistettu ja merkitty merkityksellisiksi tai ei-merkityksellisiksi. Ohjausjoukon asiakirjoja ei käytetä järjestelmän kouluttamiseen. Niiden avulla arvioidaan järjestelmän ennusteita, jotta koulutus voidaan lopettaa, kun lisäkoulutuksen hyödyt eivät enää ole suuremmat kuin lisäkoulutuksen kustannukset. Koulutus voi tapahtua satunnaisesti valituilla asiakirjoilla, joita kutsutaan nimellä Simple Passive Learning (SPL), tai siihen voi liittyä järjestelmän valitsemia dokumentteja oppimistehokkuuden optimoimiseksi. Tämä tunnetaan nimellä Simple Active Learning (SAL).

TAR 2.0 käyttää Continuous Active Learning® (CAL®) -nimistä lähestymistapaa, mikä tarkoittaa, että harjoittelun ja katselun välillä ei ole eroa — järjestelmä jatkaa oppimista koko ajan. Vaikka dokumenttien valitsemiseen voidaan käyttää monia lähestymistapoja, CAL®: n merkittävä osa on monia toistoja, joiden avulla voidaan ennustaa, mitkä asiakirjat ovat todennäköisimmin merkityksellisiä, niiden tarkistaminen ja ennusteiden päivittäminen. Toisin kuin TAR 1.0, TAR 2.0 pyrkii olemaan erittäin tehokas myös silloin, kun esiintyvyys on alhainen. Koska koulutusta ja tarkastelua ei ole erotettu toisistaan, TAR 2.0 ei vaadi ohjausjoukkoa. Ohjausjoukon laatiminen voi edellyttää suuren määrän tarkistamista (erityisesti silloin, kun esiintyvyys on alhainen) ei-merkityksellisten asiakirjojen lukumäärän tarkistamista, joten kontrollisarjojen välttäminen on toivottavaa.

TAR 3.0 vaatii laadukkaan käsitteellisen klusterointialgoritmin, joka muodostaa konseptiavaruudessa suppeasti keskittyneitä kiinteän kokoisia klustereita. Siinä sovelletaan TAR 2.0 -menetelmää vain klusterikeskuksiin, mikä varmistaa, että erilaisia mahdollisesti merkityksellisiä asiakirjoja tarkastellaan uudelleen. Kun relevantteja klusterikeskuksia ei löydy, tarkistettuja klusterikeskuksia käytetään koulutusasiakirjoina, joiden avulla voidaan tehdä ennusteita koko dokumenttipopulaatiolle. Ohjausjoukkoa ei tarvita — järjestelmä on hyvin koulutettu, kun muita relevantteja klusterikeskuksia ei löydy. Tarkastettujen klusterikeskusten analyysi antaa arvion esiintyvyydestä ja ei-merkityksellisten asiakirjojen määrästä, jotka tuotettaisiin, jos asiakirjat tuotettaisiin puhtaasti ennusteiden perusteella ilman ihmisen tarkastelua. Käyttäjä voi päättää tuottaa asiakirjoja (joita ei ole yksilöity mahdollisesti etuoikeutetuiksi) ilman tarkistusta, joka on samanlainen kuin TAR 1.0: n SAL (mutta ilman ohjausjoukkoa), tai hän voi päättää tarkastella asiakirjoja, joilla on liian suuri riski olla merkityksetön (jota voidaan käyttää järjestelmän lisäkoulutuksena eli CAL®). Tärkeintä on, että käyttäjällä on tiedot, jotka hän/hän tarvitsee tehdä päätöksen siitä, miten edetä sen jälkeen, kun olet suorittanut tarkastelun klusterikeskuksista, jotka ovat todennäköisesti merkityksellisiä, ja mitään ei ole tehty ennen kuin päätös mitätöi (vertaa aloittamiseen TAR 1.0, tarkastelemalla ohjausjoukkoa, löytää että ennustukset eivät ole riittävän hyviä dokumenttien tuottamiseen ilman tarkistusta ja vaihtamalla sitten TAR 2.0 -arvoon, mikä tekee ohjausjoukosta käytännöllisesti katsoen hyödyttömän).

TAR Käyttötarkoitukset (12)

TAR-teknologioita, protokollia ja työnkulkuja voidaan käyttää tehokkaasti auttamaan eDiscovery-ammattilaisia suorittamaan monia tietojen etsintä- ja lakisääteisiä etsintätehtäviä. Yhdeksän yleisesti pidettyä esimerkkiä TAR-käytöstä ovat:

Asiaankuuluvien asiakirjojen yksilöinti

Tapausten varhainen arviointi/tutkinta

Priorisointi tarkistusta varten

Luokittelu (ongelmien, luottamuksellisuuden tai yksityisyyden vuoksi)

Oikeusoikeuksien tarkistus

Laadunvalvonta ja laadunvarmistus

Incoming Productionsin tarkastelu

Disposition/tutkimuksen valmistelu

Tietohallinto ja tietojen luovutus

Kyselytiedot (13,14,15,16,17,18, 19)

Viittaukset

(1) Grossman, M. ja Cormack, G. (2013). Grossman-Cormackin sanasto tekniikka-avusteinen arvostelu. [eBook] Liittovaltion tuomioistuinten laki Review. Saatavilla osoitteessa http://www.fclr.org/fclr/articles/html/2010/grossman.pdf [Käytössä 31.8.2018].

(2) Dimm, B. (2018). Ennakoivan koodauksen asiantuntemus. [sähköposti].

(3) Roitblat, H. (2013). Johdatus ennakoivaan koodaukseen. [eBook] Orcatec. Saatavilla osoitteessa: 31. elokuuta 2018].

(4) Tredennick, J. ja Pickens, J. (2017). Syvä oppiminen E-Discovery: Moving Past the Hype. [online] CatalystSecure.com. Saatavilla osoitteessa: 31. elokuuta 2018].

(5) Grossman, M. ja Cormack, G. (2017). Teknologiaavusteinen arvostelu Electronic Discovery -järjestelmässä. [eBook] Saatavilla osoitteessa: 31 Elokuu 2018].

(6) Grossman, M. ja Cormack, G. (2016). Jatkuva aktiivinen oppiminen TAR. [eBook] Käytännön laki. Saatavilla osoitteessa: 31. elokuuta 2018].

(7) Grossman, M. ja Cormack, G. (2016). Jatkuvan aktiivisen oppimisen skaalautuvuus luotettavan korkean takaisinkutsun tekstiluokituksen [eBook] Saatavilla osoitteessa: 3 Sep. 2018].

(8) Losey, R., Sullivan, J. ja Reichenberger, T. (2015). e-Discovery Team TREC 2015 Total Recall Track. [eBook] Saatavilla osoitteessa: 1 syyskuu 2018].

(9) ”Jatkuva aktiivinen oppiminen Maura Grossmanin ja Gordon V. Cormackin tavaramerkki — Rekisterinumero 5876987 — Sarjanumero 86634255። Justian tavaramerkit”. Tavaramerkit.Justia.com, 2020, 12 helmikuu 2020].

(10) ”Maura Grossmanin ja Gordon V. Cormackin tavaramerkki — Rekisterinumero 5876988 — Sarjanumero 86634265። Justian tavaramerkit”. Tavaramerkit.Justia.com, 2020, 12 helmikuu 2020].

(11) Dimm, B. (2016), TAR 3.0 Suorituskyky. [online] Klustify-blogi — eDiscovery, dokumenttien klusterointi, ennakoiva koodaus, tiedonhaku ja ohjelmistokehitys. Saatavilla osoitteessa: 18 Helmikuu 2019].

(12) Electronic Discovery Reference Model (EDRM) (2019). Teknologiaavusteisen tarkistuksen (TAR) ohjeet [online] Saatavilla osoitteessa: 18 Helmikuu 2019].

(13) Dimm, B. (2018). TAR, suhteellisuus ja huonot algoritmit (1-NN). [online] Klustify-blogi — eDiscovery, dokumenttien klusterointi, ennakoiva koodaus, tiedonhaku ja ohjelmistokehitys. Saatavilla osoitteessa: 31. elokuuta 2018].

(14) Robinson, R. (2013). Juoksutulokset: Ennakoiva koodaus Yhden kysymyksen tarjoajan toteutuskysely. [online] ComplexDiscovery: eDiscovery-tiedot. Saatavilla osoitteessa: 31. elokuuta 2018].

(15) Robinson, R. (2018). Juoksulista: Top 100+ eDiscovery-palveluntarjoajat. [online] ComplexDiscovery: eDiscovery-tiedot. Saatavilla osoitteessa: 31. elokuuta 2018].

(16) Robinson, R. (2018) Suhteellisesti ottaen: Ennakoiva koodausteknologiat ja protokollat Survey Tulokset [online] ComplexDiscovery: eDiscovery Information. Saatavilla osoitteessa: 18 Helmikuu 2019].

(17) Robinson, R. (2019) Aktiivisesti oppiminen? Ennakoiva koodausteknologia ja protokollat Survey tulokset [online] ComplexDiscovery: eDiscovery Information. Saatavilla osoitteessa: 22 elokuu 2019]

(18) Robinson, R. (2019) Alustat työnkulkuihin: Ennakoiva koodaus Technologies and Protocols Survey — Syksyn 2019 tulokset [online] ComplexDiscovery: eDiscovery Information. Saatavilla osoitteessa: 12 Helmikuu 2020].

(19) Robinson, R. (2020) Onko se kaikki suhteellista? Ennakoiva koodausteknologiat ja protokollat Survey - Spring Results [online] ComplexDiscovery: eDiscovery Information. Saatavilla osoitteessa: [Pääsy 7. elokuuta 2020].

Napsauttamalla tätä saat lisäyksiä, korjauksia ja päivityksiä.

Lähde: Complexdiscovery

Mitratech hankkii Acuity ELM

According to Mike Williams, CEO of Mitratech, “We came to the...

Veritas hankkii Globanetin

“By integrating Globanet’s technology into our digital compliance portfolio, we’re making...

Viisi suurta lukee eDiscovery syyskuu 2020

From cloud forensics and cyber defense to social media and surveys,...

Muutoksen aika? FTC ehdottaa muutoksia HSR-lakiin ennen sulautumista ilmoittamista koskeviin sääntöihin

The Federal Trade Commission, with the support of the Department of...

A Running List: Top 100+ eDiscovery Providers

Based on a compilation of research from analyst firms and industry...

eDisclosure Systems Buyers Guide — 2020 Edition (Andrew Haslam)

Authored by industry expert Andrew Haslam, the eDisclosure Buyers Guide continues...

Kisa lähtöviivalle? Viimeaikaiset Secure Remote Review -ilmoitukset

Not all secure remote review offerings are equal as the apparent...

EtäeDiscoveryn ottaminen käyttöön? Tilannekuva DAAasista

Desktop as a Service (DaaS) providers are becoming important contributors to...

Kotiin vai pois? eDiscovery Malliston markkinoiden mitoitukseen ja hinnoitteluun liittyvät näkökohdat

One of the key home (onsite) or away (remote) decisions that...

Tarkistuksia ja päätöksiä? Uusia huomioita eDiscovery Secure Remote -arvosteluille

One of the key revision and decision areas that business, legal,...

Makrokatsaus menneisyyteen ja ennustettuun eDiscoveryn markkina-kokoon 2012—2024

From a macro look at past estimations of eDiscovery market size...

eDiscovery Market Size Mashup: 2019-2024 Maailmanlaajuiset ohjelmistot ja palvelut yleiskatsaus

While the Compound Annual Growth Rate (CAGR) for worldwide eDiscovery software...

Juhlava vai restive? Syksyn 2020 eDiscoveryn yritysluottamuskysely

Since January 2016, 2,189 individual responses to nineteen quarterly eDiscovery Business...

Laajemman verkon valaminen? Ennakoiva koodausteknologia ja protokollat -tutkimus — Syksyn 2020 tulokset

The Predictive Coding Technologies and Protocols Survey is a non-scientific semi-annual...

Liiketoiminta epätavallisena? 18 huomautusta eDiscovery Business Luottamuksesta kesällä 2020

Based on the aggregate results of nineteen past eDiscovery Business Confidence...

Kasvava huolenaihe? Talousarviorajoitukset ja eDiscoveryn liiketoiminta

In the summer of 2020, 56% of respondents viewed budgetary constraints...

Mitratech hankkii Acuity ELM

According to Mike Williams, CEO of Mitratech, “We came to the...

Veritas hankkii Globanetin

“By integrating Globanet’s technology into our digital compliance portfolio, we’re making...

eDiscovery lomakauden alas? Macquarie valmistelee Nuixia listautumisantaan

According to John Beveridge, writing for Small Caps, Macquarie holds a...

ayfie hankkia Haive

According to Johannes Stiehler, CEO of ayfie Group AS, “This acquisition...

Viisi suurta lukee eDiscovery syyskuu 2020

From cloud forensics and cyber defense to social media and surveys,...

Viisi suurta lukua eDiscoveryssa elokuulle 2020

From predictive coding and artificial intelligence to antitrust investigations and malware,...

Viisi suurta lukua eDiscovery-ohjelmassa heinäkuulle 2020

From business confidence and operational metrics to data protection and privacy...

Viisi suurta lukua eDiscovery-ohjelmassa kesäkuulle 2020

From collection market size updates to cloud outsourcing guidelines, the June...