Het uitgangspunt van de workshop is dat het lastig is om online anoniem te blijven. Aan de hand van een fictief klokkenluidersscenario wordt bekeken hoe het voor overheid en bedrijven mogelijk is om gegevens over je identiteit te verzamelen en hoe je dat tegen kunt gaan.
Grofweg zijn er in het proces van online onderzoek en publicatie drie gevoelige punten:
- de computer zelf
- opslag van de data
- spyware
- de verbinding
- data retentie (het opslaan van dataverkeersgegevens)
- de informatie zelf
- metadata die bij bestanden wordt opgeslagen over herkomst en gebruikte software.
Data-opslag op de harde schijf
Data wordt in de vorm van nullen en enen (binair) opgeslagen op de harde schijf. In het begin van de harde schijf is ruimte gereserveerd voor de index: een verwijzing van de binaire gegevens die bij elk bestand horen.
Als je een bestand verwijdert, zijn de gegevens niet verdwenen – er wordt alleen een verwijzing naar de prullenbak gemaakt. Bij het legen van de prullenbak wordt alleen de verwijzing in de index aangepast, maar de data staat nog op de harde schijf. Recovery software kan makkelijk gebruikt worden om de data op een schijf te recupereren, zonder gebruik te maken van de index.
Alleen shred- en wipe software verwijdert de data echt door de ruimte op de harde schijf te overschrijven. Je kunt sommige data laten overschrijven door een defragmentatie uit te voeren, maar dat is geen betrouwbare methode.
Spyware
Een voorbeeld van Spyware is DigiTask, dat door de Duitse overheid gebruikt wordt om Skype-gesprekken af te luisteren.
Kenmerken van spyware zijn:
- het verbergt zijn aanwezigheid
- het stuurt opgeslagen data door naar derden
- het kan realtime activiteit (beeldscherm, toetsaanslagen) doorsturen naar derden
- m.n. Bij windows besturingssystemen is het lastig om er zeker van te zijn dat het systeem spywarevrij is
- nederlandse overheid gebruikt ook spyware.
Q: biedt Linux voordelen wat betreft spyware?
A: Linux is niet populair genoeg om makkelijk spyware te ontwikkelen. Het is moeilijker om spyware ongezien geïnstalleerd. Voordeel van Linux is ook dat de de scheidslijnen tussen verschillende gebruikersaccount helderder zijn: mocht één account besmet zijn met spyware, dan zal een andere dat niet zijn.
Het is dus belangrijk om vanuit een schone omgeving te werken: geen sporen van data-opslag, geen spyware.
Verbinding
Via internet is er nooit een directe verbinding: de verbinding (bijv van de pc naar de google-website) verloopt via verschillende knooppunten. Bij ieder knooppunt is bekend wie de afzender van de data is, aan wie de data geadresseerd is, hoeveel data er verstuurd wordt en evt ook wat om wat voor data het gaat. Uit de hoeveelheid data is vaak ook al af te leiden om wat voor data het gaat.
Standaard gaan verbindingen via een http:// protocol. Het is veiliger om https:// te gebruiken, de inhoud van de data is dan niet leesbaar.
Data-retentie
Er is een wettelijke bewaarplicht voor providers, waarbij dataverkeersgegevens minimaal 6 maanden moeten worden bewaard. Het gaat dan, in een worst case scenario, om de volgende gegevens:
IP en MAC adres van de afzender, GPS locatie van de afzender indien mogelijk
IP adres van de geadresseerde
tijdstip van de verzending van de data
hoeveelheid data
Bij emailverkeer worden daarnaast ook het emailadres van de afzender en het onderwerp van de email bewaard.
Metadata
Metadata is data over de data, standaard bij bestanden opgeslagen. Bij .doc en .pdf bestanden wordt informatie opgeslagen over de auteur, het tekstverwerkingsprogramma, de versie daarvan, het onderwerp, de tijd en datum waarop het bestand is gewijzigd en opgeslagen, de locatie van de opslag op de schijf en oudere revisies. Bij fotobestanden worden ook de gebruikte camera, het model, het serienummer en de GPS coördinaten opgeslagen.
Dit is allemaal informatie waardoor identiteitsgegevens kunnen worden afgeleid. (Markant detail: de AIVD zelf is nogal de mist ingegaan door metadata van bestanden niet te verwijderen voor publicatie, waardoor er nogal wat info over medewerkers en netwerk openbaar werd!)
Q: Kan metadata verwijderd worden?
A: Ja, met M.A.T., kom ik later op terug.
(Noot van de notulist: het fictieve scenario van de klokkenluider heb ik achterwege gelaten, maar de problemen van anonimiteit per item op een rijtje gezet. Hierdoor wordt het verslag misschien wat droger, maar wel duidelijker.)
Hoe worden je gegevens achterhaald?
Bij het onderzoeken of publiceren van gevoelige informatie moet je er rekening mee houden dat:
(Computer)
je internetgeschiedenis in de cache van de browser wordt bewaard;
je tekstverwerkingsprogramma je bestanden tussentijds op de harde schijf opslaat, óók als je de bestanden uiteindelijk op een USB-stick opslaat;
met name bedrijfscomputers heel gevoelig zijn voor spyware;
er bij het publiceren van informatie via bijvoorbeeld een reguliere mediasite logbestanden worden bijgehouden met activiteiten op die site. Indymedia doet dat niet.
(Verbinding)
er een logbestand wordt aangemaakt van je bezoek als je een contactformulier bij een reguliere mediasite invult;
er logbestanden worden bijgehouden als je via de bedrijfscomputer actief bent op internet;
er ook logbestanden van je bezoek aan een reguliere mediasite worden bijgehouden door alle adverteerders op die mediasite! Deze bedrijven kunnen verschillende redenen hebben om jouw gegevens door te geven of te verkopen.
Deze gegevens allemaal gebruikt kunnen worden als narrow-down-methode bij een popo-onderzoek.
(Metadata)
het invullen van platte tekst bij een contactformulier veiliger is dan het opsturen van een .doc of .pdf bestand, omdat er bij platte tekst geen metadata wordt meegegeven;
er bij het meesturen van een .pdf ook metadata van de bronbestanden wordt meegegeven;
er bij het meesturen van foto’s ook metadata wordt meegegeven. Indymedia stript alle metadata van gepubliceerde foto’s.
Inhoudelijk: via het principe van stylometrie kan de inhoud van documenten die je publiceert ook met elkaar vergeleken worden om je identiteit te achterhalen. Daarbij wordt gelet op stijl, terugkerende spelfouten e.d.
Hoe kan je je anonimiteit beschermen bij onderzoek en publicatie?
Computer
Werk op een schoon systeem.
Gebruik Shred- en Wipe programma’s om gedelete bestanden ook echt te wissen. Bij Linux is er een standaard commando om bestanden te shredden.
Je kunt DOD software gebruiken om je ‘lege ruimte’ te laten overschrijven, zodat er geen sporen van bestanden meer zijn.
Een goeie manier om vanuit een schoon systeem te werken, is om Tails te gebruiken (The Amnesic Incognito Live System). Tails is te downloaden via tails.boum.org en is een compleet besturingssysteem, bootable vanaf de CD-ROM. Het heeft o.a. een browser, een emailclient, een tekstverwerkingsprogramma, een metadata toolkit (MAT: Metadata Anonymisation Toolkit) en is ontoegankelijk voor spyware. Je hebt bij Tails de mogelijkheid om bestanden (gecodeerd) op te slaan op een USB-stick.
Verbinding
Het is verstandiger om gebruik te maken van een publiek toegankelijk open netwerk.
Je beschermt je anonimiteit redelijk door gebruik te maken van het Tor-netwerk (TorProject.org). Bij het Tor-netwerk worden gegevens via verschillende knooppunten verstuurd, waarbij iedere keer de gegevens gecodeerd zijn en alleen voor het volgende knooppunt leesbaar zijn (Onion routing). Er worden voor de route wel logbestanden bijgehouden, maar deze worden daarna overschreven.
Tor is niet helemaal waterdicht: de knooppunten zijn wel bekend en als de je gegevens via knooppunten die in verkeerde handen zijn worden verstuurd geeft dat dus wel informatie. Vanaf de exit-node (de uitgang) van het Tor-netwerk zijn de gegevens niet meer gecodeerd. Ook de verbinding tussen je netwerkkaart en de ingang van het Tor-netwerk is niet gecodeerd: je MAC adres wordt opgeslagen als je verbinding maakt met internet.
Je kunt een complete browser downloaden, de Tor Browser Bundle. Deze browser bewaart geen gegevens in de cache. Je kunt op drie manieren gebruik maken van het Tor-netwerk: als regulier gebruiker, met intensief doorsturen (dus als knooppunt) of als exit node.
Anonymous proxy websites zijn minder veilig, omdat je niet weet wie de eigenaar van de websites is of wat deze met de gegevens doet.
Ghostery is een programma wat een overzicht geeft van de bedrijven die middels de website die je bezoekt gegevens binnen krijgen. Ghostery is een extention voor Firefox. Cookies, LSO’s en dergelijke worden in beperkte mate tegengehouden door Ghostery, het maakt je verbinding wel trager.
Better privacy is ook een extention voor Firefox die je hiervoor kunt gebruiken.
Metadata
Zoals eerder gezegd, gebruik MAT om metadata te verwijderen. Let ook op de metadata van bronbestanden van pdf’s en op de bestandsnamen die je geeft met het opslaan van een bestand.