TwinLadder Nedēļas Apskats

Izdevums #8 | 2025. gada maijs

Redaktora piezīme

Harvey tikko izdarīja kaut ko tādu, kam vajadzētu likt katram juristam pārdomāt savu skatījumu uz MI rīkiem. 13. maijā uzņēmums paziņoja par Google un Anthropic modeļu integrāciju blakus esošajai OpenAI infrastruktūrai. Harvey — viens no OpenAI ievērojamākajiem agrīni atbalstītajiem uzņēmumiem — faktiski paziņoja sava primārā investora konkurentam: jūs mums arī esat vajadzīgi.

Šis nav tehnoloģijas stāsts. Šis ir tirgus varas stāsts. Kad juridiskā MI platforma ar visdziļākajām OpenAI attiecībām nolemj, ka neviens atsevišķs modelis nav pietiekami labs, tas signalizē kaut ko, kas praktiķiem jāsaprot: laikmets "kuru MI mums lietot?" ir beidzies. Jautājums tagad ir "kuru MI mums lietot šim konkrētajam uzdevumam?"

Edgars Rozentāls, kurš seko aģentiskajām MI sistēmām un daudzmodeļu arhitektūrām, izteica asu novērojumu: "Brīdī, kad Harvey atsaistījās no viena modeļa nodrošinātāja, viņi signalizēja, ka inteliģences slānis ir prece. Vērtība ir orķestrēšanā — zinot, kuru dzinēju lietot kuram juridiskajam uzdevumam. Lielākā daļa biroju vēl diskutē, vai vispār adoptēt MI. Harvey jau ir tālu aiz šā jautājuma."

Ja Harvey ar visiem saviem resursiem ir nepieciešami trīs dažādi dzinēji, lai labi apkalpotu savus klientus, ko tas mums saka par rīkiem, ko lietojam mēs pārējie?

Kāpēc Harvey izvēlējās daudzmodeļu pieeju (un ko tas nozīmē jūsu birojam)

BigLaw Bench rezultāti

Harvey BigLaw Bench testēšana atklāja kaut ko tādu, ko piegādātāju mārketings aizēno: dažādi modeļi ir labi dažādās lietās, un atšķirībām ir nozīme juridiskajā darbā.

Gemini 2.5 Pro izceļas dokumentu sagatavošanā un spēj apstrādāt vairāk nekā miljonu tokenu konteksta — tas nozīmē veselas darījumu datu telpas, ne tikai atsevišķus dokumentus. Taču tas cīnās ar tiesvedības sagatavošanu un sarežģītu pierādījumu noteikumu argumentāciju, piemēram, dzirdēšanas izņēmumiem. Claude 3.7 Sonnet un OpenAI o1 labāk tiek galā ar sarežģītu argumentāciju un pierādījumu analīzi, bet tiem trūkst konteksta loga masveida dokumentu pārskatīšanai. Platforma tagad novirza uzdevumus uz modeli, kas vislabāk darbojas konkrētajam juridiskā darba veidam.

Modelis	Stiprā puse	Ierobežojums
Gemini 2.5 Pro	Dokumentu sagatavošana, 1M+ tokenu konteksts	Vājāks pierādījumu argumentācijā
Claude 3.7 Sonnet	Sarežģīta argumentācija, niansēta analīze	Mazāks konteksta logs
OpenAI o1	Strukturēta juridiskā argumentācija	Mazāk efektīvs masveida dokumentu pārskatīšanai
Harvey maršrutēšanas slānis	Uzdevumam optimizēta modeļa izvēle	Necaurspīdīgs galalietotājam

Praktiķiem sekas ir nozīmīgākas, nekā tehniskie detaļi liek domāt.

Četras sekas, kas ir svarīgas

Pirmkārt, modeļu komodizācija paātrinās. Ja Harvey uztver modeļus kā aizvietojamus komponentus, ko izvēlas pēc uzdevuma, vērtība ir maršrutēšanas inteliģencē un juridiskajā apmācības slānī — nevis tajā, kurš pamatmodelis atrodas zem tā. Tas nozīmē, ka jūsu pašreizējā piegādātāja prezentācija "mēs lietojam GPT-4" kļūst arvien bezjēdzīgāka. Jautājiet tā vietā: kā jūs izvēlaties pareizo modeli pareizajam uzdevumam?

Otrkārt, viena piegādātāja atkarība ir riska faktors. Kad OpenAI notiek pārtraukums, viena modeļa platformas apstājas. Daudzmodeļu arhitektūra nodrošina rezerves. Taču tā arī rada jaunas problēmas. Vidēja lieluma tiesvedības birojs ziņoja, ka Harvey novirzīja sarežģītu pierādījumu argumentu uz Claude nevis GPT-4, un argumentācijas dziļums dramatiski uzlabojās. Labs rezultāts. Taču trīs nedēļas vēlāk tāda paša veida uzvedne radīja stilistiski atšķirīgu analīzi, jo tika izvēlēts cits modelis. Partneris teica: "Es nevaru izveidot muskuļu atmiņu par to, ko rīks rada. Katra reize ir kā darbs ar citu juristu."

Treškārt, audita ceļš tikko kļuva sarežģītāks. Kad klients apšauba rēķinu par MI palīdzētu izpēti, "MI to izdarīja" jau bija nepietiekami. "Divi dažādi MI to izdarīja un mēs nevaram skaidri izskaidrot, kurš ko darīja" ir vēl sliktāk. Daudzmodeļu spēja ir atbilstības un izskaidrojamības izaicinājums, ar ko biroji vēl nav tikuši galā. Eiropas birojiem, uz kuriem attiecas ES MI regulas caurspīdīguma pienākumi saskaņā ar 13. un 14. pantu, šī necaurspīdīgums nav vienkārši neērti — tas ir regulatīvs risks. [VIDĒJA TICAMĪBA]

Un ceturtkārt, jūsu uzvedņu inženierija var izrādīties bezjēdzīga. Kāds birojs Frankfurtē ievērojami ieguldīja GPT-4 optimizētās uzvedņu bibliotēkās. Kad Harvey sāka novirzīt uzdevumus uz Claude un Gemini, šīs rūpīgi izstrādātās uzvednes deva nekonsekventus rezultātus. Atbildīgais jurists to raksturoja kā "būtībā sākam no nulles." Uzvedņu inženierija nav modeļu agnostiska, un daudzmodeļu platformas var prasīt daudzmodeļu uzvedņu izstrādi.

Novērtējuma jautājums

Harvey 80x ieņēmumu reizinātājs — 3 miljardu dolāru novērtējums ar aptuveni 75 miljonu dolāru gada regulārajiem ieņēmumiem — ir saprotamāks no šī skatpunkta. Likme nav uz kādu konkrētu MI modeli. Tā ir uz Harvey spēju uzbūvēt orķestrēšanas slāni starp modeļiem un juridisko darbu. Vai šis orķestrēšanas slānis ir 80x ieņēmumu vērts, ir riska kapitāla jautājums, nevis juridisko tehnoloģiju jautājums. Man ir savas šaubas. Taču pamatā esošā spēja ir reāla.

Rādītājs	Harvey	Tirgus konteksts
Novērtējums	$3 mljrd. (2025. g. maijs)	Augstākais juridiskā MI novērtējums pasaulē
Aplēstie gada ieņēmumi	~$75M	Ieņēmumu reizinātājs: ~80x
Korporatīvie klienti	500+ 53 valstīs	Iknedēļas aktīvie lietotāji aug 4x gadā
Am Law 100 iespiešanās	50+ biroji	~50% no augstākā līmeņa
Publiskā SaaS norma	—	6-12x ieņēmumu reizinātājs

Edgars Rozentāls pievieno tehnisku piezīmi, kuru vērts dzirdēt: "Daudzmodeļu maršrutēšana ir aģentiskās arhitektūras sākums. Šodien Harvey izvēlas labāko modeli katram uzdevumam. Rīt tas saķēdēs modeļus kopā — vienu izpētei, otru dokumentu izstrādei, trešo verifikācijai. Biroji, kas sapratīs šo progresiju, būs gatavi. Biroji, kas domās, ka daudzmodeļu ir vienkārši funkcionalitātes atjauninājums, būs pārsteigti." [AUGSTA TICAMĪBA]

Kompetences jautājums

Partnere lielā Eiropas birojā aprakstīja savu pieredzi pēc Harvey Gemini integrācijas: "Mēs ielādējām veselu datu telpu — divus tūkstošus dokumentu — un uzdevām jautājumus par visu kopumu. Tas, kas prasīja nedēļu, samazinājās līdz divām dienām." Iespaidīgi. Taču, kad jautāju, vai viņas juristi saprata dokumentus, par kuriem vaicāja, viņa vilcinājās.

Ir atšķirība starp atbildes atrašanu divos tūkstošos dokumentu un darījuma izpratni, ko šie dokumenti pārstāv. Konteksta logi kļūst lielāki. Spēja absorbēt un sintezēt nozīmi tam, kas atrodas iekšā, joprojām ir cilvēciska spēja. Jurists, kas spēj uzdot miljona tokenu modelim izvilkt katru kontroles maiņas klauzulu visā datu telpā, ir veicis mehānisku uzdevumu. Jurists, kas saprot, kāpēc šī kontroles maiņas klauzula ir svarīga pircēja integrācijas stratēģijas, mērķa uzņēmuma galveno darbinieku noturēšanas interešu un regulatīvo seku trīs ES jurisdikcijās kontekstā — šis jurists ir izrādījis spriedumspēju.

Kad jūsu rīki kļūst dramatiski jaudīgāki, kārdinājums ir ļaut tiem darīt vairāk. Daudzmodeļu maršrutēšana nozīmē, ka MI var veikt dokumentu sagatavošanu, argumentāciju un liela mēroga pārskatu ar pieaugošu sarežģītību. Ko tas nevar izdarīt, ir pateikt jūsu juristam, kad analīze ir nepareiza tādos veidos, kas ir komerciāli svarīgi, bet nav juridiski nozīmīgi. Klauzula ir tehniski atbilstoša. Darījums tik un tā nedarbosies. Tā ir spriedumspējas plaisa, un lielāki konteksta logi padara to vieglāk nepamanīt.

Ko darīt

Uzdodiet saviem MI piegādātājiem modeļa jautājumu. "Kurus modeļus tas lieto?" un "Kā tas izlemj, kurš modelis apkalpo kuru uzdevumu?" Ja viņi nevar skaidri atbildēt, viņi par to nav nopietni domājuši.
Testējiet konsekvenci. Izpildiet to pašu uzvedni trīs reizes dažādās dienās. Ja iegūstat būtiski atšķirīgus rezultātus, saprotiet, ka daudzmodeļu maršrutēšana (vai modeļu atjauninājumi) var būt iemesls. Veidojiet darba procesus, kas pielāgojas mainībai, nevis pieņem vienveidību.
Stipriniet audita dokumentāciju. Ja jūsu platforma lieto vairākus modeļus, jūsu ierakstiem jāatspoguļo, kurš modelis radīja kuru rezultātu. Profesionālās atbildības un atbilstības vajadzībām — un jo īpaši ES MI regulas caurspīdīguma prasībām — "MI to uzrakstīja" nav pietiekami. Jums var būt nepieciešams zināt — kurš MI.
Nepārbūvējiet uzvedņu bibliotēkas akli. Pirms ieguldāt modeļu specifiskā uzvedņu inženierijā, novērtējiet, vai jūsu platforma vispār atklāj modeļa izvēli. Ja maršrutēšana ir automātiska un necaurspīdīga, optimizācija konkrētam modelim ir veltīga.
Izvērtējiet daudzmodeļu platformas pret savu faktisko praksi. Birojiem ar šaurām, paredzamām darba plūsmām viena modeļa vienkāršība var pārspēt maršrutēšanas ieguvumus. Daudzveidīgām praksēm, kas apkalpo visu — no procesuālajiem dokumentiem līdz padziļinātajai izpētei — uzdevumam optimizēta maršrutēšana sniedz izmērāmu uzlabojumu. Saskaņojiet rīka arhitektūru ar savām vajadzībām.

Ātrā lasāmviela

Harvey izaugsmes rādītāji: 500+ korporatīvie klienti 53 valstīs, iknedēļas aktīvo lietotāju skaits aug 4x gadā, 50+ Am Law 100 biroji. Platformas tirgus pozīcija ir būtiska neatkarīgi no tā, kā vērtējat novērtējumu.
TechCrunch pasniedz paziņojumu kā Anthropic un Google uzvaru pār OpenAI — konkurences dinamika starp pamatmodeļu nodrošinātājiem pārveido korporatīvo juridisko MI ātrāk, nekā lielākā daļa biroju seko līdzi.
Gan Anthropic, gan Google modeļi ir integrēti caur AWS Bedrock un Google Vertex ar līdzvērtīgām korporatīvajām drošības garantijām — Azure ekskluzivitātes ēra juridiskā MI infrastruktūrā beidzas.
Sacra aplēš Harvey gada regulāros ieņēmumus virs 75 miljoniem dolāru — iespaidīga izaugsme, taču joprojām pārstāv 80x ieņēmumu reizinātāju pie pašreizējā 3 miljardu dolāru novērtējuma. Korporatīvais juridiskais MI ir likme uz nākotni, ar atbilstošu cenu.

Viens jautājums pārdomām

Ja vadošajai juridiskajai MI platformai ir nepieciešami trīs dažādi MI dzinēji, lai adekvāti apkalpotu savus klientus, cik pārliecināts jums vajadzētu būt par viena modeļa rīku, ko jūsu birojs iegādājās pagājušajā gadā?

TwinLadder Nedēļas Apskats | Izdevums #8 | 2025. gada maijs

Palīdzam Eiropas profesionāļiem veidot MI kompetenci caur godīgu izglītību.