To scrape or not to scrape…that’s the (pending) question

20180607 Pixabay Blogpost Scrapen.jpg

‘The bottom’ van de spreekwoordelijke ‘barrel’ is niet het enige dat tegenwoordig gescraped wordt. ‘Scrapen’ is een heus businessmodel. Voor startende  bedrijfjes  een lucratieve onderneming, voor grote bedrijven als Ryanair en LinkedIn een definitieve schrap. In deze post een kijkje in de wereld van het scrapen!

Scrapen: c’est quoi?

Scrapen ziet op het verzamelen van data van websites middels zogenaamde ‘spiders’ of ‘bots’(geautomatiseerde systemen) . De gescrapte data wordt door de scraper geanalyseerd en kan gebruikt worden voor het ontwikkelen van eigen datasets en het leveren van diensten, bijvoorbeeld prijsvergelijkingen voor vliegtickets, met een commercieel oogmerk.

Origineel of substantieel?

In de zaak Ryanair Ltd. v PR Aviation BV, wordt de vinger op twee zere plekken van het scrapen gelegd:

In de eerste plaats een mogelijke inbreuk op intellectuele eigendomsrechten, in het bijzonder de bescherming van de databank en in de tweede plaats het mogelijk schenden van de gebruiksvoorwaarden.

PR Aviation exploiteerde een zogenaamde ‘prijsvechter website’ voor vliegtickets. Om de website  te kunnen drijven, scrapte PR Aviation een gegevensverzameling die was gekoppeld aan de publiekelijk toegankelijke website van vliegmaatschappij Ryanair.  Volgens Ryanair maakte PR Aviation in de eerste plaats een inbreuk op haar rechten ten aanzien van haar gegevensverzameling oftewel haar  databank. In de tweede plaats vond Ryanair dat PR Aviation haar gebruiksvoorwaarden had geschonden met het scrapen, daar in de gebruiksvoorwaarden duidelijk een verbod op scrapen was opgenomen. 

Volgens de Databankrichtlijn zijn er twee vormen van rechtsbescherming voor een databank. De eerste daarvan is het auteursrecht. Een databank kan door auteursrecht beschermd worden wanneer deze door “de keuze of de rangschikking van de stof een eigen intellectuele schepping van de maker vormt”.[1] De tweede vorm van bescherming voor een databank is het sui generis recht. Deze vorm van bescherming geldt voor databanken waarvan “de verkrijging, de controle of de presentatie van de inhoud in kwalitatief of kwantitatief opzicht getuigt van een substantiële investering”.[2]

Voldoet een databank niet aan de gestelde criteria voor bescherming onder de richtlijn, dan kan er slechts via het toepasselijke nationale recht aanspraak gemaakt worden op bescherming van de databank.

 It is a (browse-or click) wrap

Zoals gezegd is naast een inbreuk op intellectuele eigendomsrechten ook mogelijk dat er sprake is van contractbreuk door het schenden van de gebruiksvoorwaarden. Steeds vaker wordt in de gebruiksvoorwaarden een bepaling opgenomen die ‘scrapen’ en vergelijkbare handelingen verbiedt.

In een conflict over scrapen kan het al gauw uitdraaien op de vraag of de scrapende partij al dan niet contractueel gebonden is, bijvoorbeeld door akkoord gaan met de gebruiksvoorwaarden. Wanneer bijvoorbeeld sprake is van digitaal gepubliceerde en te accepteren gebruiksvoorwaarden, komen browse-en click-wrapping  om de hoek kijken.

Browse-wrapping

Browse-wrapping ziet op de situaties waarin de gebruiksvoorwaarden gepubliceerd en bekeken kunnen worden op een website, maar er geen actieve handeling vereist is voor de acceptatie van de voorwaarden. De gebruiksvoorwaarden worden geaccepteerd door de gebruiker van de website wanneer deze verder klikt dan de beginpagina.[3]

Click-wrapping

In tegenstelling tot browse-wrapping wordt bij click-wrapping wel een actieve handeling vereist voor acceptatie. Denk bijvoorbeeld aan het aanvinken van een ‘akkoord-hokje’, of het klikken op een ‘accept-button’. Via een hyperlink kan de website-gebruiker de gebruiksvoorwaarden downloaden en opslaan.

Over het algemeen zal click-wrapping eerder leiden tot acceptatie van de voorwaarden dan browse-wrapping.[4]

Ryanair ving bot op beide fronten. De betreffende gegevens werden geoordeeld niet beschermd te zijn door een intellectueel eigendomsrecht of anderszins, maar waren gratis en vrij toegankelijk openbaar gemaakt. Het gratis en vrij toegankelijke karakter van de gegevens op een openbare website  maakte dat redelijkerwijs niet snel kon worden aangenomen dat PR Aviation, door slechts de website te bezoeken en de gegevens geautomatiseerd te verzamelen, ook de intentie had om zich te willen binden aan de gebruiksvoorwaarden van Ryanair. PR Aviation hoefde namelijk in de periode waarin zij scrapte nog geen actieve handeling te verrichten om akkoord te gaan met de gebruiksvoorwaarden en om toegang te krijgen tot de betreffende gegevens, daar Ryanair in die periode nog met browse-wrapping werkte.[5]

The saga continues…

Accross the pond lijken de scrapers ook aan de winnende hand. Op het moment loopt in de VS ronde twee van  de zaak hiQ Labs, Inc. v. LinkedIn Corporation. De eerste ronde was voor scraper hiQ Labs. Zo zouden de belangen van hiQ Labs bij het kunnen scrapen zwaarder wegen dan die van LinkedIn omdat het businessmodel van hiQ Labs geheel geënt was op scraping en zij zonder het verrichten van haar core handeling zou omvallen. Daarnaast kon niet met zekerheid gesteld worden dat de privacy van de gebruikers van LinkedIn  met een publiek profiel in het gedrang kwam door het scrapen. Aannemelijk was eerder dat gebruikers met een publiek profiel al rekening zouden houden met de mogelijkheid van “searches, data mining, aggregation, and analysis”. [6] Echter, zou een private entiteit als LinkedIn de mogelijkheid geboden worden om de toegang tot  publiek toegankelijke informatie te blokkeren, zou dat een serieuze bedreiging vormen voor het publieke debat en de vrije stroom van informatie op het internet.

Vooralsnog mag LinkedIn, hiQ Labs dus niet beletten de publieke profielen op haar website te scrapen en mag zij geen barrières (technisch of juridisch) opwerpen om scraping van de publieke profielen door hiQ Labs te voorkomen.

Of LinkedIn in ronde twee wel gelijk gaat krijgen? Wij gaan het zien.

Voor nu zeggen wij op de vraag: to scrape or not scrape?....TO BE CONTNUED!

 

[1] HvJ EU 15 januari 2015, C-30/14,  ECLI:EU:C:2015:10 (Ryanair Ltd./ PR Aviation), §34

   Zie ook: Artikel 3-6 Richtlijn 96/9/EG (Databankenrichtlijn)

[2] HvJ EU 15 januari 2015, C-30/14,  ECLI:EU:C:2015:10 (Ryanair Ltd./ PR Aviation), §34

   Zie ook: Artikel 7-11 Richtlijn 96/9/EG (Databankenrichtlijn)

[3] Hof Den Haag, 23 januari 2018, ECLI:NL:GHDHA:2018:61 (Ryanair Ltd./ PR Aviation), §32

[4] Hof Den Haag, 23 januari 2018, ECLI:NL:GHDHA:2018:61 (Ryanair Ltd./ PR Aviation), §32

[5] Hof Den Haag, 23 januari 2018, ECLI:NL:GHDHA:2018:61 (Ryanair Ltd./ PR Aviation), §78-81

[6] hiQ Labs, Inc. v. LinkedIn Corp., 14 augustus 2017.