LLMs zur automatisierten Bewertung der Gesundheit von Open-Source-Software

LLMs zur automatisierten Bewertung der Gesundheit von Open-Source-Software

Wie wir KI-gestützte Analysen von Metriken umsetzen wollen (22.10.2025)

Förderjahr 2024 / Projekt Call #19 / ProjektID: 7399 / Projekt: CrOSSD2

Im CrOSSD-Projekt beschäftigen wir uns mit der Frage, wie man die Gesundheit von Open-Source-Software (OSS) objektiv und vergleichbar messen kann. Nachhaltigkeit, Wartbarkeit und Vertrauenswürdigkeit sind entscheidend – besonders für Forschungssoftware.

Auf unserer CrOSSD Health-Plattform erfassen wir bereits zentrale Metriken, die den Zustand eines Projekts beschreiben, z.B.:

Diese Kennzahlen orientieren u.a. sich an den CHAOSS-Metriken der Linux Foundation und an Forschungsarbeiten wie “Is this GitHub Project Maintained?” (2020). Sie bilden ein solides Fundament – doch die Herausforderung liegt darin, diese Informationen automatisiert, skaliert und kontextualisiert auszuwerten. Hier beschäftigen wir uns aktuell mit dem Einsatz vonLLMs und agentischen KI-Systeme.

LLMs als Enabler

Viele unserer OSS-Metriken in der CrOSSD-Plattform erfordern die Zusammenführung verschiedener Datenquellen, z.B., Git-Commits, Issues, Paket-Abhängigkeiten, Release-Tags. LLMs können dabei helfen, diese Teils unstrukturierten Informationen zu verstehen und anzureichern.

Ein LLM kann z.B. automatisch erkennen, ob ein Commit ein Bugfix, ein Feature oder ein Refactoring ist. Arbeiten wie Amit and Feitelson (2020) zeigen, dass solche Commit-Klassifikationen die Aussagekraft klassischer Metriken deutlich verbessern.

Von Zahlen zu Einsichten

Metriken allein erzählen aber noch keine Geschichte: wenn sich z.B. der Churn-Wert verdoppelt, ist das ein Problem oder ein Zeichen aktiver Entwicklung?

LLMs können hier Kontext schaffen, z.B. durch das vergleichen von Projekten, erkennen von Trends oder formulieren von Berichte:

„Das Projekt hat im letzten Quartal 12 aktive Contributor (–25 %). Die durchschnittliche Issue-Schließzeit stieg von 3 auf 7 Tage. Der Code-Churn liegt mit 22 % über dem Median vergleichbarer Projekte (18 %).“

LLMs erreichen in strukturierten Aufgaben hohe Genauigkeit, sind aber nicht unfehlbar. Darum bleibt Transparenz bei der Berechnung der Metrik zentral: Nutzer:innen sollen nachvollziehen können, woher ein Score kommt und wie er berechnet wurde. Metriken brauchen Kontext – ein hoher Code-Churn kann sowohl auf Chaos als auch auf Innovation hindeuten.

Nächste Schritte im CrOSSD-Projekt

In der kommenden Phase wollen wir:

LLM-gestützte Metrik-Anreicherung – z.B. Commit- und Issue-Texte automatisch klassifizieren.
Automatische Health-Reports – interpretierte, textuelle Zusammenfassungen.
Validierung – LLM-Ergebnisse regelmäßig manuell validieren.

Klassische OSS-Metriken, wie sie aktuell in CrOSSD implementiert sind (Aktivität, Churn, Code-Abhängigkeiten, etc.) sind etabliert. Mit LLMs wollen wir sie intelligenter interpretieren und automatisiert auswerten und so verständliche, kontextbezogene Einsichten über die Gesundheit von Open-Source-Software zu generieren.

Sebastian Neumaier

Weitere Blogbeiträge

Förderjahr 2024 / Projekt Call #19 / ProjektID: 7399 / Projekt: CrOSSD2

LLMs als Enabler

Von Zahlen zu Einsichten

Nächste Schritte im CrOSSD-Projekt

Sebastian Neumaier

Weitere Blogbeiträge

Call for Participation: OSS Interview Study

CrOSSD2 auf der SAINT 2025

Wie geht es weiter in CrOSSD2?