Automatische Erkennung von Kleinbergbau


Wie Machine Learning dazu beitragen kann, Umweltzerstörung zu verhindern.

Input

Satellitenbilder

Output

Ort und Ausmaße von Goldminen

Ziel

Zeitnahe Informationen zu unregulierten Goldminen


Einführung


Unregulierter Kleinbergbau ist für 10% der weltweiten Goldproduktion verantwortlich, er gilt als problematisch in Bezug auf Umweltschäden und fehlenden Arbeitsschutz. Eine effiziente Überwachung dieser Aktivitäten ist mit Hilfe von Satellitenaufnahmen möglich. In diesem von der ESA geförderten Forschungsprojekt haben wir einen Algorithmus entwickelt, der Goldminen in Regenwaldgebieten erkennt.


Startpunkt


Der handwerkliche und Kleinbergbau (Artisanal and small scale mining, ASM) ist mit niedrigen Umwelt- und Arbeitssicherheitsstandards verbunden. Der Marktwert wird auf etwas 14 Milliarden US-Dollar geschätzt. ASM-Standorte...

  • befinden sich in mehr als 80 Entwicklungsländern

  • beeinträchtigen das Leben von 10 bis 20 Millionen Bergleuten

  • sind verantwortlich für einen großen Anteil der Abholzung der Regenwälder

  • machen 10% der globalen Goldproduktion aus

Frühzeitige Daten über die Lage und Ausdehnung von ASM in ihrer jeweiligen Interessenregion sindsehr wichtig für Regierungsbehörden, NGOs und Forscher. Es würde ihnen ermöglichen, Konzessionsrechte und Arbeitsschutzgesetze durchzusetzen oder Migrationsmuster zu erforschen.

Da dazu riesige Gebiete überwacht werden müssen, sind Satellitenbilder die beste Technologie zur Kartierung von ASM. dida entwickelt zusammen mit dem MRE an der RWTH Aachen ASMSpotter, ein Computer-Vision-Tool zur automatischen Erkennung von ASM-Standorten in Satellitenbildern.


Herausforderungen


Der wichtigste Teil eines jeden Machine-Learning-Projekts ist ein großer und qualitativ guter Trainingsdatensatz. Zu diesem Zweck hatten wir Zugang zu PlanetScope, einer hochauflösenden Satellitenkonstellation, die von Planet Labs betrieben wird. Um einen Datensatz zu erstellen, der für einen Machine-Learning-Algorithmus nützlich ist, mussten wir diese Satellitenbilder annotieren. Die Identifizierung der Minen ist nicht immer einfach - beispielsweise können sie schwer von einem ausgetrockneten Flussarm zu unterscheiden sein.

Da unser Interessengebiet (Area of Interest, AOI) in den Tropen liegt, können wolkenfreie Bilder rar sein. Es gibt aber Methoden, mehrere Bilder über die Zeit zu kombinieren, um ein wolkenfreies Bild der AOI zu erhalten.


Lösung


Datenerfassung

Unser Partner bei MRE kennzeichnete etwa 100 Planet Scope Bilder. Bei diesem Projekt war ein einziger Bergbauexperte für die Kennzeichnung zuständig. Für den Prototyp beschränkten wir die AOI auf den Nordosten von Surinam. Dieses Gebiet wurde ausgewählt, weil es repräsentativ für viele Regionen ist, in denen ASM-Standorte zu finden sind.

Planet Scope war die primäre Satellitenkonstellation, da sie eine der höchsten verfügbaren Auflösungen bietet (ca. 5m/px). Momentan arbeiten wir daran, dieselbe Genauigkeit mit den frei zugänglichen, aber schlechter aufgelösten Daten der Sentinel-2-Satelliten zu erreichen.

Algorithmus

Wir arbeiten mit einem tiefen neuronalen Netzwerk, das auf der U-Net-Architektur aufbaut. ASMSpotter kann lokal ausgeführt werden, um vom Benutzer bereitgestellte PlanetScope- oder Sentinel-2-Bilder zu analysieren. In einer zukünftigen Phase des Projekts wird ASMSpotter zu einem Cloud-Service entwickelt werden, der Satellitenbilder auf Anfrage analysiert oder so konfiguriert werden kann, dass er eine bestimmte Region kontinuierlich überwacht.


Technischer Hintergrund


Datenerfassung

Unser Partner bei MRE kennzeichnete etwa 100 Planet Scope Bilder. Bei diesem Projekt war ein einziger Bergbauexperte für die Kennzeichnung zuständig. Für den Prototyp beschränkten wir die AOI auf den Nordosten von Surinam. Dieses Gebiet wurde ausgewählt, weil es repräsentativ für viele Regionen ist, in denen ASM-Standorte zu finden sind. Die Region liegt im Amazonas-Regenwald, und der hydraulische Bergbau ist die vorherrschende Methode für den Goldabbau. Planet Scope war die primäre Satellitenkonstellation, da sie eine der höchsten verfügbaren Auflösungen bietet (ca. 5m/px). Sentinel-2 wurde ebenfalls erfolgreich getestet, war jedoch nicht der primäre Fokus dieser Studie.

Das Labelling erfolgte mit LabelBox. Das Labelling erfolgte nicht auf dem RGB-Bild (also im Bereich der sichtbaren Wellenlängen), sondern auf einer Graustufendarstellung des normalisierten Wasser-Differenz-Indexes (NDWI). PlanetScope hat vier Kanäle (RGB+NIR). Der NDWI wird berechnet als

$$NDWI = \frac{G - NIR}{G + NIR}$$

und hebt Bereiche mit hohem Wassergehalt hervor. Der NDWI wird den PlanetScope Bildern als fünfter Kanal beigefügt. Der normalisierte Vegetations-Differenz-index (NDVI) wird berechnet als

$$NDVI = \frac{NIR - R}{NIR + R}$$

und hebt die Vegetation in den Bildern hervor. Er wird als sechster Kanal an die Eingabedaten angehängt.

Verwendete Technologien

Backend: Python, PyTorch, Numpy, Matplotlib, Requests, geopandas, rasterio, geojson, Sentinelsat
Infrastruktur: GCloud (Training + storage), Git, DVC

Ähnliche Projekte