INTERLIS leicht gemacht #47 - INTERLIS, das bessere JSON-Schema?

24 March 2025

Ich hätte ja gerne ein Ausrufezeichen im Titel verwendet. Nur so allgemeingültig ist die Aussage wohl nicht. Jedoch für uns könnte sie passen. Im letzten Blogbeitrag habe ich geschrieben, dass bei uns viel Konfiguration anfällt. Ein Teil wird (zukünftig) originär in JSON von Mitarbeitern erfasst. Die Konfiguration der vielen Microservices im Umfeld des Web GIS Clients ist ebenfalls JSON. Diese ist teilweise sehr umfangreich und wird in der Regel nicht mehr von Hand erstellt. Zu jeder dieser Microservice-Konfiguration gibt es ein JSON-Schema, das die Konfiguration definiert. Im Fall des «elevation»-Services ist die Konfiguration maximal simpel:

{
  "$schema": "https://github.com/qwc-services/qwc-elevation-service/raw/master/schemas/qwc-elevation-service.json",
  "service": "elevation",
  "config": {
    "elevation_dataset": "/data/geodata/ch.so.agi.lidar_2014.dtm/ch.so.agi.lidar_2014.dtm.tif"
  }
}

Der Service hat zwei Funktionen: eine liefert für eine Koordinate einen Höhenwert zurück, die zweite Funktion liefert Höhenwerte entlang eines Linestrings als Antwort.

Das dazugehörige Schema ist schon um einiges umfangreicher:

{
  "$schema": "http://json-schema.org/draft-07/schema#",
  "$id": "https://raw.githubusercontent.com/qwc-services/qwc-elevation-service/master/schemas/qwc-elevation-service.json",
  "title": "QWC Elevation Service",
  "type": "object",
  "properties": {
    "$schema": {
      "title": "JSON Schema",
      "description": "Reference to JSON schema of this config",
      "type": "string",
      "format": "uri",
      "default": "https://raw.githubusercontent.com/qwc-services/qwc-elevation-service/master/schemas/qwc-elevation-service.json"
    },
    "service": {
      "title": "Service name",
      "type": "string",
      "const": "elevation"
    },
    "config": {
      "title": "Config options",
      "type": "object",
      "properties": {
        "elevation_dataset": {
          "description": "Elevation dataset (file or URL). Example: https://data.sourcepole.com/srtm_1km_3857.tif",
          "type": "string"
        }
      },
      "required": [
        "elevation_dataset"
      ]
    }
  },
  "required": [
    "service",
    "config"
  ]
}

Für JSON-Liebhaber mag das Kunst sein, für mich sieht es eher leicht chaotisch aus. Inhaltlich dürfte so ein Schema wohl viele Anforderungen abdecken. Man kann z.B. Konstanten oder Default-Werte definieren. Irgendwie noch schick. Oder auch URL verlangen. Wobei man anscheinend zwei Aussagen dazu braucht: Das URL-Attribut muss vom Typ «string» sein und gemäss einer «uri» formatiert sein. Scheint mir irgendwie umständlich. Was wäre aber, wenn wir das JSON-Schema als einfach lesbares INTERLIS-Modell definieren könnten?

INTERLIS 2.4;

MODEL Elevation (de) AT "mailto:edigonzales@localhost" VERSION "20250324" =

    TOPIC Elevation =

        STRUCTURE Config_ =
            elevation_dataset : TEXT*100;
        END Config_;

        CLASS Configuration =
            service : TEXT*100;
            config : Config_;
        END Configuration;

    END Elevation;

END Elevation.

Und ja, im Modell fehlen die Kommentare («description»), die im JSON-Schema vorhanden sind. Ebenfalls können keine Default-Werte und Konstanten gesetzt werden. Für beide Fragestellungen könnten z.B. Constraints verwenden werden. Und die Sache mit Modell → Topic → Class macht es auf den ersten Blick auch ziemlich verbose. Und trotzdem: Auch wenn wir Kommentare und Constraints noch einpflegen würden, dünkt es mich klarer, aussagekräftiger und sauberer strukturiert. Schlichtweg eleganter. Aber dazu gibt es wahrscheinlich auch gegenteilige Meinungen.

Die zum INTERLIS-Modell passende JSON-Datei sieht wie folgt aus / muss wie folgt aussehen:

[
    {
      "@type": "Elevation.Elevation.Configuration",
      "@id": "o1",
      "@bid": "bid1",
      "@topic": "Elevation.Elevation",
      "service": "elevation",
      "config": {
        "@type": "Elevation.Elevation.Config_",
        "elevation_dataset" : "/data/geodata/ch.so.agi.lidar_2014.dtm/ch.so.agi.lidar_2014.dtm.tif"
      }
    }
]

«Boah, wird ja immer komplizierter und hässlicher!» hört man sie sagen. Aber das hat alles schon seine Richtigkeit und Notwendigkeit. Aber der Reihe nach:

Bereits mit der ersten Version von GRETL wollten wir neben INTERLIS-Dateien auch CSV- und Shapedateien validieren können. GeoPackage ist im Laufe der Zeit noch hinzugekommen. Zur Validierung von Shapedateien habe ich vor Jahren was geschrieben. Im Prinzip geht das fast für jedes beliebige Format: man muss «nur» einen IoxReader implementieren. Anschliessend muss man einen Validator erweitern und schon hat man seinen Custom-Format-Validator mit der Mächtigkeit von INTERLIS und ilivalidator.

Vor einiger Zeit haben wir ebensolche JsonReader und GeoJsonReader programmieren lassen. Jetzt ist die Zeit gekommen diese in Wert zu setzen und sie als Basis für einen JsonValidator zu verwenden. Der JsonValidator wird als GRETL-Task umgesetzt. Ein Standalone-Werkzeug wäre aber mit minimalen Aufwand auch möglich.

Zurück zum hässlichen «INTERLIS-JSON»: Um möglichst viel von der Sprache INTERLIS verwenden zu können und Daten in JSON transportieren zu können, braucht es diese Metaattribute in der JSON-Datei. Man muss wissen welcher Basket geliefert wird, um welchen Klassentyp es sich beim konkreten Objekt handelt etc. pp. Für unseren momentanen Anwendungsfall/Spezialfall ist aber nur das Attribut @type notwendig. D.h. ich möchte die JSON-Datei nicht unnötig aufblasen. Das löse ich, indem ich fehlende Metaattribute vor der Validierung hinzufüge. Ebenso ein allfällig fehlendes Toplevel-Array. Den JsonReader lasse ich so sein, wie er ist. Unsere Konfigurationsdatei sieht abgespeckt so aus:

{
    "@type": "Elevation.Elevation.Configuration",
    "service": "elevation",
    "config": {
        "@type": "Elevation.Elevation.Config_",
        "elevation_dataset" : "/data/geodata/ch.so.agi.lidar_2014.dtm/ch.so.agi.lidar_2014.dtm.tif"
    }
}

Eine Unschönheit besteht/bestand noch: Ein JSON-Array mit z.B. Strings konnte nicht modelliert werden resp. nur über den Umweg mit INTERLIS-Strukturen. Das ist natürlich sehr umständlich. Weil mit INTERLIS 2.4 auch LIST und BAG mit einfachen Datentypen möglich ist, musste der JsonReader angepasst werden. Pullrequest ist gemacht.

Der JsonReader unterstützt auch Geometrien im Format von WKT. Ich kann z.B. folgendes Modell schreiben:

INTERLIS 2.4;

MODEL Test2 (de) AT "mailto:edigonzales@localhost" VERSION "20250324" =

    DOMAIN
        Coord2 = COORD
        2460000.000 .. 2870000.000,
        1045000.000 .. 1310000.000,
        ROTATION 2 -> 1;

    TOPIC Topic2 =

        CLASS ClassA =
            attrText : TEXT*60;
            attrArea : AREA WITH (STRAIGHTS, ARCS) VERTEX Coord2 WITHOUT OVERLAPS > 0.001;
        END ClassA;

    END Topic2;

END Test2.

Der JsonValidator überprüft problemlos die Area-Bedingung für folgende JSON-Datei (und findet die Überlappung):

[
    {
      "@type": "Test2.Topic2.ClassA",
      "attrText" : "line0",
      "attrArea" : "POLYGON ((2460000 1045000, 2460001 1045000, 2460001 1045001, 2460000 1045001, 2460000 1045000))"
    },
    {
      "@type": "Test2.Topic2.ClassA",
      "attrText" : "line1",
      "attrArea" : "POLYGON ((2460000.5 1045000, 2460002 1045000, 2460002 1045001, 2460001 1045001, 2460000.5 1045000))"
    }
]

Ist INTERLIS das bessere JSON-Schema? Für uns glaub schon. Wir müssen uns nicht in eine neue Spezifikation kämpfen und können auch weiterhin die gleichen Werkzeuge und die gleiche Sprache verwenden. Zudem die Werkzeuge und Sprache sehr mächtig sind. Ein weiterer interessanter Aspekt ist, dass die Formatfrage so mehr und mehr in den Hintergrund rückt, weil das Format abstrahiert wird.

Posted by Stefan Ziegler. | INTERLIS , JSON , iox , Java , ilivalidator