Arbeitspakete
Das Projekt ist in sechs Arbeitspakete gegliedert. Die folgende Grafik veranschaulicht die geplante Systemarchitektur und die in den einzelnen Arbeitspaketen entwickelten Komponenten.
Die Übersicht in der Abbildung skizziert die mehrschichtige Anwendungs- und Service-Architektur der SDGHUB-Plattform, einschließlich eines Überblicks über die heterogene Menge an Datenquellen, die Ausrichtung der wichtigsten Anwendungen und Zielgruppen sowie Verweise auf die jeweiligen Arbeitspakete, die für die Entwicklung der Bereiche und Ebenen verantwortlich sein werden.
- Die Input-Ebene (WP2) erfasst (i) SDG-Taxonomien, öffentliche Wissensgraphen sowie die Datensatz-Deskriptoren offener Datenbanken (ii) die öffentliche Debatte in Nachrichten und sozialen Medien und (iii) die Stakeholder-Kommunikation einschließlich wissenschaftlicher Artikel und SDG-bezogener Webseiten, die über die Aggregationsebene abgeglichen werden (inkl. Deduplizierung, Entfernung von Störfaktoren und gefälschter Konten sowie Metadatenanreicherung auf Dokumentenebene) .
- Die Modellebene (WP3-4) enthält die Sprach- und Domänenmodelle für die Deep-Learning-Aufgaben der Identifizierung von Tendenzen auf erklärbare Weise und der Erkennung von Beziehungen zwischen SDG-Konzepten und benannten Entitäten (einschließlich der ausgedrückten Wahrnehmungen von Bürger_innen auf der Ebene der einzelnen Entitäten). Die Modelle werden mit Hilfe von Texteinbettungsbibliotheken wie PyTorch und Hugging Face Transformers entwickelt und mit Hilfe von verteilten Bibliotheken (Ray, ktrain) trainiert und feinabgestimmt.
- Die Output-Ebene (WP4-6) wird auf den bestehenden Technologiepaketen der Partner WLT, MOD und GeoSphere aufbauen. Sie wird REST-APIs für den Zugriff auf den Inhalt und das Metadaten-Repository des Infrastruktur-Ebene beinhalten, wobei Shared Indexing verwendet wird, um Skalierbarkeit zu gewährleisten. Die KG wird in einem RDF Triple Store persistiert, der SDG Mapping und Relationsextraktionsfunktionen ermöglicht.
- Die Anwendungsebene (WP5-6) unterstützt den gesamten inhaltlichen Lebenszyklus der SDG-Kommunikation, einschließlich der Produktion (Tools zur effektiveren Vermittlung wissenschaftlicher Erkenntnisse), Darstellung (SDG-Matrix, Sense Tree, Geospatial Projection) und Analyse (Dashboard).