Semalt sérfræðingur segir frá því hvernig skrap á vefgögnum var lögfest með úrskurði dómstóls

Þó að það geti verið ólöglegt að skafa gögn af vefsíðum án skýrt leyfis eigenda vefsins, hefur dómari nýlega úrskurðað annað undir vissum kringumstæðum. hiQ Labs höfðaði nýlega málsókn gegn LinkedIn vegna þess að koma í veg fyrir að þeir gætu dregið út gögn af LinkedIn síðum.

Það kom eins og dónalegt áfall fyrir flesta að LinkedIn var sagt að veita gangsetningunni ókeypis aðgang að vefsíðum sínum. hiQ notaði reiknirit sín til að greina hvenær LinkedIn notandi er að leita að starfi út frá þeim breytingum sem notandinn gerir á opinberum prófíl sínum.

Reikniritin eru keyrð á gögnum sem dregin eru út af LinkedIn vefsíðunum. Eins og búist var við, líkaði LinkedIn ekki við það og mótvægisaðgerðir voru gerðar til að koma í veg fyrir að HiQ gæti haft frekari gagnaflutninga. Burtséð frá tæknilegum hindrunum sem voru settar voru einnig gefnar út sterkar orðar lagalegar viðvaranir.

Gangsetningin átti ekki annan kost en að taka málið upp löglega. hiQ þurfti að leita lagalegs úrbóta. Fyrirtækið vildi að LinkedIn skipaði að fjarlægja tæknilegar hindranir sínar. hiQ vildi einnig að gagnaútdráttarferli sitt á LinkedIn væri lögleitt.

Sem betur fer fyrir gangsetninguna fékk það það sem það vildi. Úrskurðurinn var í þágu HiQ. LinkedIn var skipað að fjarlægja allar mótvægisaðgerðir sem hindra HiQ í að skafa (LinkedIn) vefsíður sínar og gefa einnig HiQ frjálsar hendur þar sem verknaðurinn er algerlega löglegur. Dómarinn hengdi úrskurð sinn um þá staðreynd að það sem hiQ vill skafa eru gögn sem hafa verið sýnd til almennings.

Dómarinn skipaði ekki aðeins sakborningnum um að fjarlægja allt forvarnartæki sem komið var á móti HiQ, heldur bauð hann einnig að stefndi hætti við slíkum aðgerðum í framtíðinni.

Að stuðla að opnum vefgögnum

Þótt úrskurðurinn sé enn tímabundið lögbann er það hjartahlý að heyra að lögin styðja opinn vefgögn og ókeypis aðgang að upplýsingum á Netinu þar sem þessi úrskurður staðfestir það. Jafnvel þó að lokaákvörðunin fái stefnda í hag, þá hefur þessi staðreynd þegar verið staðfest.

Dómarinn kynnti þessa stefnu með því að leggja niður nánast öll rök LinkedIn. Meðan LinkedIn reyndi að komast að því að stefnandi væri að brjóta í bága við friðhelgi einkalífsins, lagði dómari á móti því með því að stefndi er einnig að selja gögnin.

Þegar rökin héldu ekki vatni sagði sakborningur einnig að verkun hiQ væri í grófu broti á lögum um tölvusvindl og misnotkun (CFAA) vegna þess að gangsetningin nálgaðist netþjóna sína til að afla gagna ólöglega. Aftur var rifist með rökunum. Því var hafnað á þeim forsendum að hiQ væri aðeins að skafa efni á almenningssíðurnar, sem ekki varða.

Dómarinn líkaði málinu við að einhver labbaði inn í opna verslun á vinnutíma. Ekki er hægt að segja að slíkur maður sé að gera trespassing. Svo, hiQ var ekki trespassing. Athyglisvert er að dómarinn fór lengra með að skýra hvers vegna úrskurður hans er í þágu almennings.

Í hnotskurn samþykkti dómstóllinn að það væri í þágu almennings að leyfa að skríða, draga út og greina gögn. Svo það verður skaðleg stefna að hvetja til staðsetningar hindrana fyrir frjálsu upplýsingaflæði.

Það sem þú ættir að læra af úrskurðinum

Þó að þú hafir kannski ekki ástæður til að draga gögn beint frá LinkedIn, ættir þú að læra af úrskurðinum. Það er betra að spila öruggt með því að lesa og virða robots.txt skrá allra vefsíðna. Mundu að úrskurðurinn er enn tímabundið lögbann. Það gæti að lokum gengið í hag LinkedIn.

Þótt úrskurðurinn hafi ekki áhrif á þig beint, þá er það feginn að alríkisréttur heldur uppi þeirri stefnu að halda vefnum opnum fyrir almenning. Svo upplýsingar ættu að vera tiltækar og aðgengilegar þeim sem geta leitað og nýtt þær vel.

Vefgögn eru afar gagnleg fyrir alla, sérstaklega fjölmiðlafræðingar, verktaki, gagnafræðingar og nokkrir aðrir fagaðilar. Sem slíkur er úrskurðurinn kærkomin þróun.

mass gmail