Kylmä sää saalis? Ennakoiva koodaustekniikat ja -protokollat -kysely — kevään 2021 tulokset

The Predictive Coding Technologies and Protocols Survey is a non-scientific semi-annual survey designed to help provide a general understanding of the current application of predictive coding technologies, protocols, workflows, and uses by data discovery and legal discovery professionals.

en flag
nl flag
et flag
fi flag
fr flag
de flag
pt flag
ru flag
es flag

Toimittajan huomautus: Nämä ovat ComplexDiscoveryn tekemän kuudennen puolivuotisen ennakoivan koodauksen teknologioiden ja protokollien kyselyn tulokset. Tästä päivästä lähtien kuudessa tutkimuksessa on saatu yksityiskohtaista palautetta 384 lailliselta, liike-elämän ja teknologian ammattilaiselta tiettyjen koneoppimistekniikoiden käytöstä ennustavassa koodauksessa. Tutkimukset ovat myös antaneet tietoa näiden koneoppimistekniikoiden käytöstä osana esimerkiksi teknologiaavusteisia tarkistusprotokollia.

Tutkimuksen iteroinnissa oli 65 vastaajaa ja keskityttiin edelleen ennakoiviin koodaustekniikoihin, protokolliin, työnkulkuihin ja käyttötarkoituksiin koko eDiscovery-ekosysteemissä.

Ennakoiva koodausteknologia ja -protokollat kevät 2021 -kysely

Predictive Coding Technologies and Protocols Survey on ei-tieteellinen tutkimus, jonka tarkoituksena on auttaa ymmärtämään yleisesti ennakoivien koodaustekniikoiden, protokollien ja työnkulkujen käyttöä eDiscovery-ekosysteemissä. Kevään 2021 -kysely oli avoinna 7. helmikuuta 2021 alkaen 18. helmikuuta 2021. Yksilöt kutsuttiin ComplexDiscoveryn suoraan osallistumaan.

Tutkimuksella oli kaksi ensisijaista koulutustavoitetta:

Voit tarjota konsolidoidun luettelon mahdollisista ennustavista koodaustekniikasta, protokollasta ja työnkulun määritelmistä. Vaikka se ei ole all-inclusive tai kattava, listaus tarkasteltiin valikoiduilla teollisuuden ennustava koodaus asiantuntijat täydellisyyttä ja tarkkuutta, joten se näyttää olevan kannattavaa käyttää koulutustoimia.

Kysy eDiscoveryn ekosysteemin ammattilaisilta heidän mieltymyksiään ja käyttötapojaan ennakoivien koodausalustojen, teknologioiden, protokollien, työnkulkujen ja käyttöalueiden osalta.

Kysely tarjosi vastaajille mahdollisuuden tarjota ennakoivaa koodauksen taustatietoa, mukaan lukien heidän ensisijainen ennustava koodausalusta, sekä esitti viisi erityistä kysymystä vastaajille. Nämä kysymykset ovat:

Kuinka usein käytät ennakoivaa koodausta osana eDiscovery-työnkulkuasi? (Esiintyvyys)

Mitä ennakoivia koodaustekniikoita eDiscovery-alustasi hyödyntää? (Teknologiat)

Mitä teknologiaavusteisia tarkistusprotokollia hyödynnetään ennustavan koodauksen toimittamisessa? (Protokollat)

Mikä on ensisijainen teknologiaavusteinen tarkastelun työnkulku, jota käytetään ennakoivan koodauksen toimittamisessa? (Työnkulku)

Mitkä ovat alat, joilla käytät teknologiaavusteisia tarkistustekniikoita, protokollia ja työnkulkuja? (Käyttöalueet)

18. helmikuuta 2020 päättyneessä kevään kyselyssä oli 65 vastaajaa.

Tärkeimmät tulokset ja havainnot

Ennakoivan koodausteknologian ja protokollatutkimuksen vastaajan yleiskatsaus (kuvio 1)

50,77 prosenttia vastanneista oli ohjelmisto- tai palveluntuottajaorganisaatioista.

27,69 prosenttia vastanneista oli asianajotoimistoista.

Loput 21,54 prosenttia vastanneista kuului joko konsultointiin (12,,31%), hallitukseen (4,62), yhtiöön (1,54%) tai muunlaiseen yksikköön (3,08%).

Ensisijainen ennustava koodausalusta (kuvio 2)

Vastaajien ilmoittama ensisijainen ennustava koodausalusta oli 24 eri alustaa.

Suhteellisuusteorian ilmoitti ensisijaisena ennustavana koodausalustana 36,92 prosenttia kyselyyn vastanneista.

Kaksi parasta alustaa ilmoitettiin ensisijaisena ennustavana koodausalustana 53,85 prosenttia kyselyyn vastanneista.

1,54 prosenttia vastanneista ilmoitti, ettei heillä ole ensisijaista alustaa ennustavaan koodaukseen.

Ennakoivan koodauksen käytön levinneisyys eDiscoveryssa (kuvio 3)

Yli kolmasosa kyselyn vastaajista (38,46%) ilmoitti käyttäneensä ennakoivaa koodausta eDiscovery-työnkulussaan yli 50% ajasta.

80 prosenttia vastanneista ilmoitti käyttävänsä ennakoivaa koodausta eDiscovery-työnkulussaan vähintään 5% ajasta.

Vain 20% vastaajista ilmoitti käyttäneensä ennakoivaa koodausta eDiscovery-työnkulussaan alle 5% ajasta.

Ennakoiva koodaustekniikka työllisyys (kuvio 4)

Active Learning raportoitiin käytetyimmäksi ennustavaksi koodaustekniikaksi. 93,21 prosenttia vastanneista käytti sitä ennustavassa koodauspyrkimyksessään.

44,62 prosenttia vastanneista ilmoitti käyttäneensä ennustavassa koodauspyrkimyksissään vain yhtä ennustavaa koodaustekniikkaa.

53,85 prosenttia vastanneista ilmoitti käyttäneensä ennustavassa koodaustoiminnassaan useampaa kuin yhtä ennustavaa koodausteknologiaa.

1,54% vastanneista ei ilmoittanut käyttäessään mitään erityistä ennakoivaa koodaustekniikkaa.

Teknologiaavusteinen tarkistuspöytäkirja Työllisyys (kuvio 5)

Kaikkia edellä mainittuja teknologiaavusteisia protokollia ennakoivaa koodausta varten ilmoitettiin ainakin yhden kyselyyn vastanneen käyttäneen.

Continuous Active Learning® (CAL®) raportoitiin käytetyimmäksi ennustavaksi koodausprotokollaksi. 84,62 prosenttia vasteista käytti sitä ennustavassa koodauspyrkimyksissään.

55,38% vastanneista ilmoitti käyttävänsä ennustavassa koodauspyrkimyksissään vain yhtä ennustavaa koodausprotokollaa.

43,08 prosenttia vastanneista ilmoitti käyttäneensä ennustavassa koodauspyrkimyksissään useampaa kuin yhtä ennustavaa koodausprotokollaa.

1,54% vastanneista ilmoitti käyttämättä mitään ennakoivaa koodausprotokollaa.

Teknologiaavusteinen tarkastelu työnkulun työllisyys (kuvio 6)

72,31% vastanneista ilmoitti käyttävänsä Technology-Assisted Review (TAR) 2.0:aa ensisijaisena työnkuluna ennakoivan koodauksen toimittamisessa.

6, 16% vastaajista ilmoitti käyttävänsä TAR 1.0:aa ja 13,85% vastaajista ilmoitti käyttävänsä TAR 3.0:aa ensisijaisena työnkuluna ennustavan koodauksen toimittamisessa.

7,69% vastanneista ei ilmoittanut käyttävän TAR 1.0-, TAR 2.0- tai TAR 3.0- tai ensisijaisena työnkuluna ennustavan koodauksen toimittamisessa.

Teknologiaavusteiset tarkastelun käyttötarkoitukset (kuvio 7)

87,69 prosenttia vastanneista ilmoitti käyttäneensä teknologiaavusteista tarkastelua useammalla kuin yhdellä tietoalueella ja oikeudellisella löytämisellä.

92,31 prosenttia vastaajista ilmoitti käyttäneensä teknisesti avustettua tarkastusta asiaankuuluvien asiakirjojen tunnistamiseen.

13,85 prosenttia vastaajista ilmoitti käyttäneensä teknologiaavusteista arviointia tietohallinnossa ja tietojen luovuttamisessa.

Kyselykaaviot

(Kaavioita voidaan laajentaa yksityiskohtaista katselua varten.)

Kuvio 1: Kyselyyn vastanneiden yleiskatsaus (tausta)

1 — Ennakoivan koodauksen teknologioiden ja protokollien kyselyn yleiskatsaus — kevät 2021

Kuvio 2: Ensisijaisen ennustavan koodausalustan nimi (tausta)

2 — Ensisijainen ennakoiva koodausalusta — kevät 2021

Kuvio 3: Kuinka usein käytät ennakoivaa koodausta osana eDiscovery-työnkulkua? (Kysymys #1)

3 — Ennakoiva koodauksen käyttö — kevät 2021

Kuvio 4: Mitä ennakoivia koodaustekniikoita eDiscovery-alustasi hyödyntää? (Kysymys #2)

4 - Ennakoiva koodaustekniikan käyttö — kevät 2021

Kuvio 5: Mitä teknologiaavusteisia tarkistusprotokollia hyödynnetään ennustavan koodauksen toimittamisessa? (Kysymys #3)

5 — Teknologia-avusteisen arviointiprotokollan käyttö — kevät 2021

Kuvio 6: Mikä on ensisijainen teknologia-avusteinen tarkastelun työnkulku, jota käytetään ennakoivan koodauksen toimittamisessa? (Kysymys #4)

6 — Teknologiaavusteinen tarkastelu työnkulun käyttö — kevät 2021

Kuvio 7: Mitkä ovat alueet, joilla käytät teknologiaavusteisia tarkistustekniikoita, protokollia ja työnkulkuja? (Kysymys #5)

7 — Teknologiaavusteiset tarkastelun käyttötarkoitukset — kevät 2021

Ennakoiva koodaustekniikat ja -protokollat (Survey Backgrounder)

Kuten Grossman-Cormack Glossary of Technology-Assisted Review (1) määritellään, Predictive Coding on toimialakohtainen termi, jota käytetään yleisesti kuvaamaan teknologiaavusteista arviointiprosessia, jossa käytetään koneoppimisalgoritmia, jotta merkitykselliset ei-merkityksellisistä asiakirjoista voidaan erottaa aiheen perusteella asia asiantuntijan koodaus koulutuksen joukko asiakirjoja. Ennakoivan koodauksen määritelmä antaa peruskuvauksen, joka tunnistaa yhden tietyn toiminnon, jota yleinen joukko yleisesti hyväksyttyjä koneoppimisen algoritmeja voi käyttää teknologiaavusteisessa tarkastelussa (TAR).

Ennakoivan koodauksen tietoisuuden ja käytön kasvaessa oikeudellisella areenalla näyttää siltä, että sähköisten löytöjen ammattilaisten on yhä tärkeämpää saada yleinen käsitys tekniikoista, joita voidaan toteuttaa sähköisissä etsintäalustoissa ennakoivan koodauksen helpottamiseksi sähköisesti tallennettujen tietojen. Tämä yleinen ymmärrys on olennaisen tärkeää, koska jokaisella mahdollisella algoritmisella lähestymistavalla on tehokkuusetuja ja haittoja, jotka voivat vaikuttaa ennustavan koodauksen tehokkuuteen ja tehokkuuteen.

Auttaakseen kehittämään tätä ennustavan koodausteknologian yleistä ymmärrystä ja tarjotakseen sähköisten etsintäpalvelujen tarjoajille mahdollisuuden jakaa teknologioita ja protokollia, joita ne käyttävät alustoillaan ja niiden kanssa ennakoivan koodauksen toteuttamiseksi, seuraavat ennustavan koodauksen työlistat -tekniikat ja TAR-protokollat ovat käytettävissä käyttöäsi varten. Ennakoivan koodauksen työnkulkuja ja käyttötarkoituksia koskevat työluettelot sisältyvät myös harkintasi mukaan, koska ne auttavat määrittämään, miten ennustavat koodaustekniikat ja TAR-protokollat toteutetaan ja käytetään.

Työluettelo ennakoivista koodaustekniikoista (1,2,3,4)

Yhteenlaskettu sähköisten löytöjen asiantuntijoista, jotka perustuvat ammatillisiin julkaisuihin ja henkilökohtaisiin keskusteluihin, jäljempänä on ei-all inclusive -työluettelo yksilöidyistä koneoppimistekniikoista, joita on sovellettu tai joita on mahdollista soveltaa eDiscoveryn kurinalaisuuteen helpottaakseen Ennakoiva koodaus. Tämä työluettelo on suunniteltu tarjoamaan vertailupiste tunnistetuille ennakoiville koodaustekniikoille, ja se voi ajan mittaan sisältää lisäyksiä, mukautuksia ja muutoksia, jotka perustuvat asiantuntijoilta ja organisaatioilta saatuun palautteeseen, jotka soveltavat ja toteuttavat näitä mainstream-tekniikoita erityisissä eDiscovery-alustoissaan.

Luetteloitu aakkosjärjestyksessä

Aktiivinen oppiminen: Prosessi, joka on tyypillisesti iteratiivinen, jossa algoritmia käytetään valitsemaan asiakirjoja, jotka olisi tarkistettava koulutusta varten strategian perusteella, joka auttaa luokitusalgoritmia oppimaan tehokkaasti.

Päätöspuu: Vaiheittainen menetelmä, jolla erotetaan asiaankuuluvat ja ei-merkitykselliset asiakirjat, riippuen siitä, mitä sanojen yhdistelmää (tai muita ominaisuuksia) ne sisältävät. Päätöspuu johdannaisia koskevien asiakirjojen yksilöimiseksi saattaa ensin määrittää, sisältääkö jokin asiakirja sanan ”swap”. Jos näin olisi, Päätöspuu voisi sitten määrittää, sisälsikö asiakirja ”luottoa” ja niin edelleen. Päätöspuu voidaan luoda joko tietotekniikan tai koneoppimisen kautta.

K-lähin Naapuri Classifier (K-NN): Luokitusalgoritmi, joka analysoi k esimerkkiasiakirjoja, jotka ovat eniten samanlaisia (lähin) kuin luokiteltavan asiakirjan, jotta voidaan määrittää paras luokitus asiakirjan. Jos k on liian pieni (esim. k=1), voi korkean takaisinkutsun saavuttaminen olla äärimmäisen vaikeaa.

Piilevä semanttinen analyysi (LSA): Matemaattinen esitys asiakirjoista, jossa käsitellään voimakkaasti korreloivia sanoja (eli sanoja, jotka yleensä esiintyvät samoissa asiakirjoissa) kuin ne ovat tavallaan samanarvoisia tai vaihdettavissa. Tämä vastaavuus tai vaihdettavuus voi sallia, että algoritmit tunnistavat asiakirjat käsitteellisesti samanlaisiksi, vaikka ne eivät käytä samoja sanoja (esimerkiksi, koska synonyymit voivat olla hyvin korreloivia), vaikka se myös hylkää joitakin mahdollisesti hyödyllisiä tietoja ja voi johtaa ei-toivottuihin tuloksiin, jotka johtuvat väärät korrelaatioita.

Logistinen regressio: Koneoppimisen huipputason ohjattu oppimisalgoritmi, joka arvioi dokumentin merkityksen todennäköisyyden sen sisältämien ominaisuuksien perusteella. Toisin kuin Naïve Bayes, algoritmi, Logistic Regression tunnistaa ominaisuuksia, jotka syrjivät merkityksellisten ja ei-merkityksellisten asiakirjojen välillä.

Naïve Bayesian luokittelija: Järjestelmä, joka tutkii todennäköisyyttä, että uuden asiakirjan jokainen sana on peräisin sanasta jakelu, joka on johdettu koulutetusta reagoivasta asiakirjasta tai koulutetuista ei-reagoivista asiakirjoista. Järjestelmä on naiivi siinä mielessä, että se olettaa kaikkien sanojen olevan toisistaan riippumattomia.

Neural Network: An Artificial Nural Network (ANN) on laskennallinen malli. Se perustuu biologisten neuroverkkojen rakenteeseen ja toimintoihin. Se toimii kuin ihmisen aivojen tapa prosessoi tietoa. Se sisältää suuren määrän liitettyjä käsittelyyksiköitä, jotka toimivat yhdessä tietojen käsittelemiseksi.

Todennäköisyysperusteinen latentti semanttinen analyysi (PLSA): Tämä on hengeltään samanlainen kuin LSA, mutta se käyttää todennäköisyysperusteista mallia saavuttaakseen tuloksia, joiden odotetaan olevan parempia.

Satunnaiset metsät: Ensemble oppimismenetelmä luokitusta, regressiota ja muita tehtäviä varten, jotka toimivat rakentamalla lukuisia ratkaisupuita harjoitusaikana ja poistamalla luokan, joka on yksittäisten puiden luokkien (luokittelu) tai keskimääräinen ennustus (regressio). Satunnainen päätös metsät oikea päätös puiden tapana overfitting niiden koulutus asettaa.

Merkityksellinen palaute: Aktiivinen oppimisprosessi, jossa ihminen koodaa dokumentit, joilla on suurin todennäköisyys merkityksellisyydestä, ja lisätään koulutussarjaan.

Tuki Vector Machine: Matemaattinen lähestymistapa, jolla pyritään löytämään linja, joka erottaa reagoiva ei-reagoiva asiakirjoja niin, että ihanteellisesti, kaikki reagoiva asiakirjat ovat toisella puolella linjaa ja kaikki ei-reagoiva niistä ovat toisella puolella.

Yleiset TAR-protokollat (5,6,7,8,9,10)

Lisäksi näitä tekniikoita käytetään yleensä osana TAR-protokollaa, joka määrittää, miten tekniikoita käytetään. Esimerkkejä TAR-protokollista ovat:

Luetteloitu aakkosjärjestyksessä

Continuous Active Learning® (CAL®): CAL® -sovelluksessa Maura R. Grossmanin ja Gordon V. Cormackin kehittämä, käyttämä ja puoltama TAR-menetelmä. Peruskoulutuksen jälkeen oppija valitsee toistuvasti seuraavat olennaiset asiakirjat (joita ei ole vielä otettu huomioon) tarkastelua, koodausta ja koulutusta varten, ja jatkaa sitä, kunnes se ei enää löydä olennaisempia asiakirjoja. Toista tarkastelua ei yleensä ole, koska kun oppija lopettaa oppimisen, kaikki oppijan merkityksellisinä pitämät asiakirjat on jo tunnistettu ja tarkistettu manuaalisesti.

Multimodaalimenetelmä: E-Discovery Teamin (Ralph Losey) kehittämä lähestymistapa, joka sisältää kaikentyyppiset hakumenetelmät. Ensisijainen riippuvuus perustuu ennakoivaan koodaukseen ja korkealuokkaisten asiakirjojen käyttöön jatkuvaan aktiiviseen harjoitteluun.

Skaalautuva jatkuva aktiivinen oppiminen (S-CAL): Oleellinen ero S-CAL:n ja CAL® välillä on se, että S-CAL: lle valitaan vain äärellinen näyte asiakirjoista kustakin peräkkäisestä erästä, ja prosessi jatkuu, kunnes keräys - tai suuri satunnaisnäyte kokoelmasta - loppuu. Äärelliset otokset muodostavat yhdessä asiakirjapopulaatiosta kerrostetun otoksen, josta voidaan johtaa tilastollinen estimaatti ρ.

Simple Active Learning (SAL): SAL-menetelmissä oppija valitsee peruskoulutusjoukon jälkeen dokumentit, joita opettaja tarkastelee ja koodaa, ja käyttää koulutusesimerkkeinä, ja jatkaa esimerkkien valitsemista, kunnes se on riittävän koulutettu. Tyypillisesti oppijan valitsemat asiakirjat ovat niitä, joista oppija on vähiten varma ja joista se oppii eniten. Kun oppijaa on koulutettu riittävästi, sen jälkeen käytetään jokaisen kokoelman dokumentin merkitsemiseen. Kuten SPL-ohjelmalla, merkityksellisiksi merkityt asiakirjat tarkistetaan yleensä manuaalisesti uudelleen.

Yksinkertainen passiivinen oppiminen (SPL): Yksinkertaisissa passiivisessa oppimisessa (”SPL”) menetelmissä opettaja (eli ihmisoperaattori) valitsee koulutusesimerkkeinä käytettävät asiakirjat. Oppijaa koulutetaan näiden esimerkkien avulla, ja kun se on riittävän koulutettu, sitä käytetään merkitsemään kaikki kokoelman dokumentit merkityksellisiksi tai ei-- merkityksellinen. Yleensä oppijan merkityksellisiksi merkitsemät asiakirjat tarkistetaan manuaalisesti uudelleen. Tämä manuaalinen tarkastelu edustaa pientä murto-osaa kokoelmasta ja siten pienen murto-osan tyhjentävän manuaalisen tarkastelun ajasta ja kustannuksista.

TAR työnkulut (11)

TAR-työnkulkuja edustavat ennakoivien koodaustekniikoiden ja -protokollien käytännön soveltamista määrittelemään lähestymistapoja ennakoivien koodaustehtävien suorittamiseen. Kolme esimerkkiä TAR-työnkuluista ovat:

TAR 1.0 sisältää harjoitusvaiheen, jota seuraa tarkistusvaihe, jossa ohjausjoukkoa käytetään määrittämään optimaalinen piste, jolloin sinun pitäisi vaihtaa koulutuksesta tarkasteluun. Järjestelmä ei enää opi, kun harjoitusvaihe on valmis. Ohjausjoukko on satunnainen joukko asiakirjoja, jotka on tarkistettu ja merkitty merkityksellisiksi tai ei-merkityksellisiksi. Ohjausjoukko-asiakirjoja ei käytetä järjestelmän kouluttamiseen. Niiden avulla arvioidaan järjestelmän ennusteita, jotta koulutus voidaan lopettaa, kun lisäkoulutuksen hyödyt eivät enää ole suuremmat kuin lisäkoulutuksen kustannukset. Koulutus voi olla satunnaisesti valituilla asiakirjoilla, joita kutsutaan nimellä Simple Passive Learning (SPL), tai se voi sisältää asiakirjoja, jotka järjestelmä on valinnut oppimisen tehokkuuden optimoimiseksi. Tämä tunnetaan nimellä Simple Active Learning (SAL).

TAR 2.0 käyttää lähestymistapaa nimeltä Continuous Active Learning® (CAL®), mikä tarkoittaa, että koulutusta ja arviota ei eroteta toisistaan — järjestelmä jatkaa oppimistaan kaikkialla. Vaikka monia lähestymistapoja voidaan käyttää asiakirjojen valitsemiseen tarkistettavaksi, CAL® -järjestelmän merkittävä osa on monia toistoja, joilla ennustetaan, mitkä asiakirjat ovat todennäköisimmin merkityksellisiä, tarkistetaan niitä ja päivitetään ennusteita. Toisin kuin TAR 1.0, TAR 2.0 on yleensä erittäin tehokas myös silloin, kun levinneisyys on vähäistä. Koska koulutusta ja tarkastelua ei ole erotettu toisistaan, TAR 2.0 ei vaadi ohjausjoukkoa. Ohjausjoukon tuottaminen voi edellyttää suuren (erityisesti silloin, kun esiintyvyys on vähäistä) ei-merkityksellisten asiakirjojen lukumäärää, joten kontrolliryhmien välttäminen on toivottavaa.

TAR 3.0 edellyttää korkealaatuista käsitteellistä klusterointialgoritmia, joka muodostaa konseptiavaruuteen kapeasti keskittyneitä klustereita. Se soveltaa TAR 2.0 -menetelmää vain klusterikeskuksiin, mikä varmistaa, että erilaisia mahdollisesti merkityksellisiä asiakirjoja tarkistetaan. Kun merkityksellisiä klusterikeskuksia ei löydy, tarkistettuja klusterikeskuksia käytetään koulutusasiakirjoina, jotta ne voivat tehdä ennusteita koko dokumenttipopulaatiolle. Ohjausjoukkoa ei tarvita — järjestelmä on hyvin koulutettu, kun muita relevantteja klusterikeskuksia ei löydy. Tarkasteltujen klusterikeskusten analyysi antaa arvion epäolennaisten asiakirjojen esiintyvyydestä ja lukumäärästä, jotka tuotettaisiin, jos asiakirjat tuotettaisiin puhtaasti ennusteiden perusteella ilman ihmisen tarkastelua. Käyttäjä voi päättää tuottaa asiakirjoja (joita ei ole tunnistettu mahdollisesti etuoikeutetuiksi) ilman tarkistusta, joka on samanlainen kuin TAR 1.0: n SAL (mutta ilman ohjausjoukkoa), tai hän voi päättää tarkistaa asiakirjoja, joilla on liian suuri riski olla merkityksetön (joita voidaan käyttää järjestelmän lisäkoulutuksena eli CAL®). Tärkeintä on, että käyttäjällä on tiedot, joita hän tarvitsee tehdä päätöksen siitä, miten edetä sen jälkeen, kun on suoritettu uudelleen tarkastelu klusterikeskuksia, jotka ovat todennäköisesti merkityksellisiä, ja mitään ennen tätä kohtaa ei mitätöidä päätöksellä (vertaa aloittamaan TAR 1.0, tarkistamalla ohjausjoukko, löytää että ennustukset eivät riitä tuottamaan asiakirjoja ilman tarkistusta ja siirtyvät sitten TAR 2.0:aan, mikä tekee ohjausasetuksesta käytännöllisesti katsoen hyödyttömän).

TAR Käyttötarkoitukset (12)

TAR-teknologioita, protokollia ja työnkulkuja voidaan käyttää tehokkaasti auttamaan eDiscoveryn ammattilaisia suorittamaan monia tietojen etsintä- ja lakisääteisiä etsintätehtäviä. Yhdeksän yleisesti pidettyä esimerkkiä TAR-käytöstä ovat:

Asiaankuuluvien asiakirjojen tunnistaminen

Varhainen tapausarviointi/tutkinta

Priorisointi tarkistusta varten

Luokittelu (ongelmien, luottamuksellisuuden tai tietosuojan mukaan)

Oikeuksien tarkistaminen

Laadunvalvonta ja laadunvarmistus

Incoming Productionsin katsaus

Disposition/kokeiluvalmistelu

Tietohallinto ja tietojen käsittely

Kyselyn tiedot (13,14,15,16,17,18, 19, 20)

Viitteet

(1) Grossman, M. ja Cormack, G. (2013). Grossman-Cormackin sanasto teknologiaavusteinen tarkastelu. [eBook] Liittovaltion tuomioistuinten laki tarkastelu. Saatavilla osoitteessa http://www.fclr.org/fclr/articles/html/2010/grossman.pdf [Accesed 31.8.2018].

(2) Dimm, B. (2018). Ennakoivan koodauksen asiantuntemus. [sähköposti].

(3) Roitblat, H. (2013). Johdatus ennustavaan koodaukseen. Orcatec. Saatavilla 31 elokuu 2018].

(4) Tredennick, J. ja Pickens, J. (2017). Syvä oppiminen E-Discoveryssä: Moving Past the Hype [online] CatalystSecure.com. Saatavilla 31 elokuu 2018].

(5) Grossman, M. ja Cormack, G. (2017). Teknologiaavusteinen tarkastelu sähköisessä Discoveryssä. [eBook] Saatavilla: 31 elokuu 2018].

(6) Grossman, M. ja Cormack, G. (2016). Jatkuva aktiivinen oppiminen TAR. [eBook] Käytännön laki. Saatavilla 31 elokuu 2018].

(7) Grossman, M. ja Cormack, G. (2016). Jatkuvan aktiivisen oppimisen skaalautuvuus luotettavaan korkean takaisinkutsun tekstiluokitukseen [eBook] Saatavilla: 3 syyskuu 2018].

(8) Losey, R., Sullivan, J. ja Reichenberger, T. (2015) E-Discovery Team TREC 2015 Total Recall Track -tapahtumassa. [eBook] Saatavilla: 1 syyskuu 2018].

(9) ”Jatkuva aktiivinen oppimistavaramerkki Maura Grossman ja Gordon V. Cormack — Rekisterinumero 5876987 — Sarjanumero 86634255። Justia Tavaramerkit”. Tavaramerk.Justia.com, 2020, 12. helmikuuta 2020].

(10) ”CAL tavaramerkki Maura Grossman ja Gordon V. Cormack — Rekisterinumero 5876988 — Sarjanumero 86634265። Justia Tavaramerkit”. Tavaramerk.Justia.com, 2020, 12. helmikuuta 2020].

(11) Dimm, B. (2016), TAR 3.0 -suorituskyky. [online] Clustify-blogi — eDiscovery, dokumenttien klusterointi, ennakoiva koodaus, tiedonhaku ja ohjelmistokehitys. Saatavilla 18 Helmikuu 2019].

(12) Electronic Discovery Reference Model (EDRM) (2019). Teknologian avustetun tarkastelun (TAR) suuntaviivat [verkossa] Saatavilla 18.2.2019].

(13) Dimm, B. (2018). TAR, suhteellisuus ja huonot algoritmit (1-NN). [online] Clustify-blogi — eDiscovery, dokumenttien klusterointi, ennakoiva koodaus, tiedonhaku ja ohjelmistokehitys. Saatavilla 31 elokuu 2018].

(14) Robinson, R. (2013). Juoksunkulku: Predictive Coding Yhden kysymyksen tarjoajan toteutus Survey. [online] ComplexDiscovery: eDiscovery Tietoa. Saatavilla 31 elokuu 2018].

(15) Robinson, R. (2018). Juoksulista: Top 100+ eDiscovery Tarjoajat. [online] ComplexDiscovery: eDiscovery Tietoa. Saatavilla 31 elokuu 2018].

(16) Robinson, R. (2018) Suhteellisesti ottaen: Ennakoiva koodaus Technologies and Protocols Survey Tulokset [online] ComplexDiscovery: eDiscovery Information. Saatavilla 18 Helmikuu 2019].

(17) Robinson, R. (2019) Aktiivisesti oppiminen? Ennakoiva koodaus Technologies ja protokollat kyselyn tulokset [online] ComplexDiscovery: eDiscovery Tiedot. Saatavilla: 22 elokuu 2019]

(18) Robinson, R. (2019) Alustoista työnkulkuihin: Ennakoiva koodaus Technologies and Protocols Survey — Syksy 2019 Tulokset [online] ComplexDiscovery: eDiscovery Information. Saatavilla 12. helmikuuta 2020].

(19) Robinson, R. (2020) Onko se kaikki suhteellinen? Ennakoiva koodaus Technologies and Protocols Survey - kevään tulokset [online] ComplexDiscovery: eDiscovery Tietoa. Saatavilla osoitteessa: [Pääsy 7. elokuuta 2020].

(20) Robinson, R. (2020) Wider-verkon valu? Ennakoiva koodaus Technologies ja protokollat Survey — Syksy 2020 [online] ComplexDiscovery: eDiscovery Tietoa. Saatavilla: 5. helmikuuta 2021].

Napsauttamalla tätä voit antaa tiettyjä lisäyksiä, korjauksia ja päivityksiä.

* Ennakoiva koodaustutkimus Vastaajat: kuusi kyselyä

0 — Ennakoivan koodaustutkimuksen vastaajat (yksilölliset ja yhteenlasketut) — kuusi tutkimusta

Lähde: Complex Discover

Ensimmäinen oikeudellinen hankkii eDiscoveryn tarjoaja Redpoint Technologies

According to Alex Martinez, CEO of First Legal, “Both First Legal...

Veristar hankkii planeetan tiedot

According to Veristar company founder, CEO, and president Rick Avers, “We...

Questel hankkii DoeGalin

doeLEGAL today announced that it has been acquired by intellectual property...

Seuraatko Moneya? Mike Bryant tarjoaa SOLID tarkastella Legal Tech Sulautuminen ja hankinta

From seed and venture capital investments to private equity and Special...

Uusi aikakausi eDiscoveryssa? Kehystys markkinoiden kasvu kuuden aikakausien linssin läpi

There are many excellent resources for considering chronological and historiographical approaches...

An eDiscovery Market Koko Mashup: 2020-2025 Maailmanlaajuiset ohjelmistot ja palvelut Yleiskatsaus

While the Compound Annual Growth Rate (CAGR) for worldwide eDiscovery software...

Perusviivan nollaaminen? eDiscoveryn markkinakoon mukautukset vuodelle 2020

An unanticipated pandemeconomic-driven retraction in eDiscovery spending during 2020 has resulted...

Kotiin vai pois? eDiscovery Malliston markkinoiden mitoitukseen ja hinnoitteluun liittyvät näkökohdat

One of the key home (onsite) or away (remote) decisions that...

Viisi suurta lukee eDiscovery helmikuussa 2021

From litigation trends and legal tech investing to facial recognition and...

Viisi suurta lukee eDiscovery tammikuu 2021

From eDiscovery business confidence and operational metrics to merger and acquisition...

Viisi suurta lukua eDiscovery joulukuu 2020

May the peace and joy of the holiday season be with...

Viisi suurta lukua eDiscoveryssa marraskuulle 2020

From market sizing and cyber law to industry investments and customer...

HaysTackid tunnustettu IDC MarketScape for eDiscovery Services

According to HaystackID CEO Hal Brooks, “We are proud to once...

Sukupolvenäkymä etätietoturvasta? HaysTackid™ -julkaisut 3.0 -tietoturvaparannukset tarkistustekniikkaan

According to HaystackID's Senior Vice President and General Manager for Review...

Vain ajan kysymys? HaysTackid käynnistää uuden palvelun tietomurtojen etsimistä ja tarkastelua varten

According to HaystackID's Chief Innovation Officer and President of Global Investigations,...

Se on Match! Keskittyminen eDiscovery-tarkastelun kokonaiskustannuksiin ja tarkistusoikeus Match

As a leader in remote legal document review, HaystackID provides clients...

Kylmä sää saalis? Ennakoiva koodaustekniikat ja -protokollat -kysely — kevään 2021 tulokset

The Predictive Coding Technologies and Protocols Survey is a non-scientific semi-annual...

Tuletko ulos metsästä? 18 huomautusta eDiscovery Business Luottamus talvella 2021

In the winter of 2021, 85.0% of eDiscovery Business Confidence Survey...

eDiscovery-liiketoiminnan suorituskykyyn vaikuttavat ongelmat: Talvi 2021 -yleiskatsaus

In the winter of 2021, 43.3% of respondents viewed budgetary constraints...

Ei niin erinomainen? eDiscoveryn operatiiviset mittarit talvella 2021

In the winter of 2021, eDiscovery Business Confidence Survey more...