Startseite Wirtschaft Blamage für Schweizer KI-Modell Lumo – Letzter Platz im Kassensturz

Blamage für Schweizer KI-Modell Lumo – Letzter Platz im Kassensturz

Ein umfassender Test von SRF Kassensturz offenbart die Schwächen von KI-Sprachmodellen bei Schweiz-spezifischen Fragen. Besonders bitter: Das einzige Schweizer Modell Lumo bildet das Schlusslicht.

Die Schweizer Konsumentensendung «Kassensturz» hat in Zusammenarbeit mit der Fachhochschule Nordwestschweiz (FHNW) zehn führende KI-Chatbots auf den Prüfstand gestellt. Das ernüchternde Fazit: Ausgerechnet das Schweizer Modell Lumo des Genfer Unternehmens Proton schneidet am schlechtesten ab – und das trotz vorbildlichem Datenschutz.

Methodisch fundierter Test mit klaren Ergebnissen

Zwischen dem 22. Oktober und 13. November 2025 mussten die Chatbots über 300 Fragen beantworten, wobei 20 Prozent einen expliziten Schweiz-Bezug hatten. Die Kategorien umfassten Alltag, Wissen, Recht und Gesundheit. In einem Turniermodus bewerteten 40 Fachexperten die Antworten nach Kriterien wie Struktur, Umfang, Sprache und Nachvollziehbarkeit.

Lumo: Datenschutz allein reicht nicht

Mit einer Gesamtnote von 3,8 landet Lumo auf dem letzten Platz. Simon Felix, KI-Experte an der FHNW, beschreibt die Problematik: Das Modell liefert teils extrem kurze Antworten von nur drei Wörtern, dann wieder unverhältnismässig lange Texte oder schlicht erfundene Informationen. Diese extreme Inkonsistenz macht den Chatbot für Nutzer unzuverlässig und unbrauchbar.

Besonders pikant: Während Proton mit seinem verschlüsselten E-Mail-Dienst und seiner Datenschutz-Philosophie international für Aufsehen sorgt, scheint bei Lumo die Antwortqualität dem hohen Datenschutz-Standard nicht zu entsprechen. Der Schweizer Firmensitz in Genf und die Einhaltung des strengen Schweizer Rechts (Bestnote 5,6 in dieser Kategorie) können die fundamentalen Schwächen in der Kernfunktionalität nicht kompensieren.

Weitere Verlierer

Neben Lumo erhalten auch Meta AI und der chinesische Chatbot Deepseek (beide 3,9) das Prädikat ungenügend. Meta kann trotz enormer Ressourcen nicht überzeugen, Deepseek kämpft mit halluzinierten Antworten.

Überraschend ist das mittelmäßige Abschneiden von ChatGPT (Note 4,1). Trotz 800 Millionen wöchentlich aktiver Nutzerkonten liefert das bekannteste KI-Modell nur durchschnittliche Leistungen. Bei komplexen Fragen erreicht es nur 3,2 Punkte.

Gewinner kommen aus den USA

Als klarer Testsieger geht Claude von Anthropic hervor (Note 5,0). Das von ehemaligen OpenAI-Forschern entwickelte Modell kommt schnell auf den Punkt und liefert prägnante Antworten, ohne wichtige Informationen wegzulassen. Bei kontroversen Themen erreicht es Bestnote 5,9.

Knapp dahinter folgen Copilot von Microsoft und Gemini von Google (beide 4,9). Für Schweizer Nutzer bedeutet dies: Wer verlässliche Antworten sucht, ist mit internationalen Modellen wie Claude, Copilot oder Gemini besser bedient – muss dafür aber Abstriche beim Datenschutz in Kauf nehmen. Die Hoffnung auf ein Schweizer Produkt, das beides vereint, bleibt vorerst unerfüllt.

werbung_3

Kommentar Abgeben

1