Feature update

Gemma 3 - Swiss stark verbessert

Shared by Fabio • June 02, 2025

Hi ,

Wir haben über das Wochenende ein bedeutendes Update für das KI-Modell Gemma 3 – Swiss ausgerollt. Die Aktualisierung fokussiert insbesondere auf die Reduktion sogenannter „Halluzinationen“, bei denen das Modell falsche oder irreführende Informationen generiert. Gleichzeitig verbessert sich durch das Update die Qualität und Genauigkeit der Antworten des Modells erheblich.

Product update

Neue KI-Modelle verfügbar: Entdecke unsere aktualisierte Auswahl

Shared by Fabio • April 16, 2025

Hi ,

Seit letztem Freitag 11.04.2025 steht euch eine überarbeitete und verbesserte Auswahl an KI-Modellen zur Verfügung.

In den letzten Monaten hat unser Team intensiv daran gearbeitet, die aktuell leistungsfähigsten und relevantesten Modelle für eure Bedürfnisse zu evaluieren, zu testen und zu integrieren. Diese Aktualisierung stellt sicher, dass ihr stets Zugriff auf modernste KI-Technologie habt, die optimal auf verschiedene Anwendungsfälle zugeschnitten ist.

Kontext: Warum neue Modelle?

Die Welt der künstlichen Intelligenz entwickelt sich rasant. Um euch die besten Werkzeuge an die Hand zu geben, überprüfen wir regelmässig den Markt, testen vielversprechende neue Modelle und integrieren die leistungsstärksten Kandidaten in unsere Plattform. Dabei achten wir nicht nur auf die reine Performance, sondern auch auf Geschwindigkeit, Effizienz beim Hosting (insbesondere auf unseren Schweizer Servern für Open-Source-Modelle) und die Qualität der generierten Antworten in Bezug auf Korrektheit und potenzielle Biases. Diese sorgfältige Auswahl führte nun zu einer strategischen Neuausrichtung, bei der wir unter anderem stark auf das neue Gemma-Modell für unsere Schweizer Variante setzen.

Unsere Top-Empfehlungen im Überblick:

Hier ist eine kurze Erklärung der wichtigsten neuen und aktualisierten Modelle:

Gemma 3 Swiss (Hosting: Schweiz)

Was es ist: Unser neues Top-Modell für Schweizerdeutsch und Deutsch, basierend auf Googles Gemma-Architektur. Es ersetzt das bisherige Llama 3 Swiss.
Stärken: Deutlich verbesserte Antwortqualität und vor allem extrem schnell (bis zu 120 Tokens/Sekunde). Hervorragend geeignet für allgemeine Aufgaben und besonders effektiv für RAG-Anwendungen (Retrieval-Augmented Generation), bei denen das Modell mit Ihren spezifischen Daten arbeitet.
Wichtiger Hinweis: Für optimale Ergebnisse, insbesondere bei der Arbeit mit eigenen Daten oder spezifischen Anweisungen (Konstruktoren), empfehlen wir dringend, die Temperatur (Kreativität) auf einen niedrigen Wert (z.B. 0.2 oder 0.3) zu setzen. Höhere Standardwerte (wie 0.7 oder 0.8) können bei diesem Modell zu unerwünschten oder falschen Ergebnissen führen. * Datenschutz: Wird auf unseren Servern in der Schweiz betrieben.

DeepSeek R1 (Hosting: Europa)

Was es ist: Ein hochmodernes Modell eines chinesischen Entwicklers, das mit den weltweit besten Modellen mithalten kann. * Stärken: DeepSeek ist ein sogenanntes "Thinking"-Modell. Es analysiert die Anfrage zuerst gründlich ("denkt nach"), bevor es mit der Generierung der Antwort beginnt. Dies führt zu einer leichten Startverzögerung, resultiert aber oft in besonders durchdachten und qualitativ hochwertigen Ergebnissen. Ideal für das Schreiben von Konzepten, längeren Texten oder komplexeren Aufgaben, die Reflexion erfordern.
Datenschutz: Wir hosten die vollständige Version dieses Modells auf Servern in Europa. Ihre Daten verlassen somit nicht den europäischen Raum, im Gegensatz zur direkten Nutzung über die Anbieter-Webseite oder andere Dienste, die es eventuell über chinesische Server routen.

Gemini 2.5 Pro (Hosting: Google)

Was es ist: Das aktuellste und leistungsfähigste Modell von Google, das als eines der weltweiten Top-Modelle gilt.
Stärken: Liefert herausragende Ergebnisse bei sehr komplexen Aufgaben. Exzellent für Programmierung, das Verfassen und Überarbeiten anspruchsvoller Texte, konzeptionelle Arbeit und Internet-Recherche.
Hinweis: Startet eventuell etwas langsamer als andere Modelle. Da es bei Google gehostet wird, werden Ihre Anfragen dorthin gesendet. Es ist daher weniger geeignet für Aufgaben, bei denen hochsensible Daten direkt verarbeitet werden sollen (z.B. klassische RAG-Anwendungen mit internen Dokumenten).

Zum ganzen Artikel