TOPICS:
(1) Scheduler
- Wiki-Scheduler für MediaWiki spezifische Importer-Jobs -> Prüfen, ob das effizienter gestaltet werden kann (100te Jobs für das Anlegen einer Seite?)
- Airflow für komplexere Workflows, z.B. KG Updates, Importer etc.
- Ticket https://phabricator.wikimedia.org/T347559
(2) API für Imports
- Jede/r mit Account (Accounts werden von MaRDI Leuten angelegt) kann Edits vornehmen, manuell und API-basiert
- Brauchen:
- Manual (How-To) Dokument, das Benutzung von QuickStatements beschreibt (läuft im Browser)
- SPÄTER: Manual (How-To) Dokument, das einen API-basierten Importer beschreibt
- Ticket: https://phabricator.wikimedia.org/T234827
(3) Wiki-Paper: Wer kann hinfahren? (Eloi überlegt)
(4) Profil-Typen
- Person (Beispiel: Michael Joswig - MaRDI portal (mardi4nfdi.de))
- add image
- Workflows (TA4; erstmal nur die Links zu den vorhandenen MediaWiki-Seiten anlegen)
- Formel
- Problem mit dem Rendering, z.B. Formula:9.10.E20
- fixed
- Problem mit dem Rendering, z.B. Formula:9.10.E20
- Paper
- Software(-package) (-> CRAN)
- Datensatz (TA1, TA2)
- Analysen (TA2)
(5) Roadmap (Anpassungen?)
- Neue Funktion "Import on Demand": "Per Knopfdruck": Daten aus WikiData (oder arXiv) importieren
- Data integration (durch Profile abgedeckt?)
- (Automatische) Disambiguierung/ Merges - wo soll kuratiert werden (zbMATH/ Wikidata/ MaRDI/ ...)?
- Erster Ansatz: inkonsistente Fälle markieren (z.B. Merge-Kandidaten)
- Siehe z.B.: Author Disambiguator (author-disambiguator.toolforge.org)
- Bessere Dokumentation der MaRDI-Portal Items (Referenzen/Quellen, Wer (welches Script? welche Version?) hat importiert?)
- Aus Roadmap: ZUSAMMENFASSEN: Services, Distr. Computing / Distr. Storage als Use-Case "JupyterNotebooks sind die Services, die von Portal-Nutzern ausgeführt werden können, mit Daten, die auf den unterstützten Plattformen liegen"
- https://colab.research.google.com/drive/1WWdpNpCkM_3EY74DDe-Abn7tn2dEw_o0#scrollTo=wKi563rRudLL
- Computational reproducibility of Jupyter notebooks from biomedical publications - https://arxiv.org/abs/2308.07333
- Vision (vielleicht für 2. Förderphase): instead of individual notebooks, consider using workflow platforms like Galaxy/ Taverna/ NixOs
(6) Dokumentation der Datenmodelle
e.g. Autorenreihenfolge in Paper items
(7) Use cases, e.g. math for the blind - for instance, use of the MathML "intent" feature
(8) Interaktion mit anderen TAs