Zum Inhalt springen
André Bojahr vor einem sehr großen Open Source Logo

Open Source im AI-Kontext: Kleines Modell, große Wirkung

André Bojahr ist Lead Data Scientist bei Exxeta. Er arbeitet im Data Lab, einem Zusammenschluss von Data Engineers und Data Scientists, die sich für Exxetas Kunden mit der Integration von KI-Modellen in Unternehmen beschäftigen. Im Interview erklärt er, warum Open Source im Bereich Künstliche Intelligenz (KI) und GenAI eine immer wichtigere Rolle spielt und warum Unternehmen sich jetzt mit dem Thema auseinandersetzen sollten.  

TL;DR

  • Freiheit durch Transparenz: Open Source in der KI ermöglicht Unternehmen, Modelle anzupassen und weiterzuentwickeln, statt sich auf geschlossene Systeme zu verlassen.
  • Kosteneffektiv und flexibel: Kleinere Open-Source-Modelle bieten eine kostengünstige Alternative zu großen, ressourcenintensiven Lösungen und eignen sich hervorragend für einfache Aufgaben.
  • Datenschutz im Fokus: Die Möglichkeit, Modelle lokal zu hosten, reduziert Datenschutzrisiken und bietet Unternehmen mehr Kontrolle über ihre Daten.

Technologie gibt uns Freiheit. Stimmt das? Zumindest war das einmal die große Idee. Bis sich in weiten Teilen der Tech-Szene einzelne Monopole und Oligopole gebildet haben, die ihre Systeme geschlossen haben. Und da ist es nicht verwunderlich, dass sich Gegenbewegungen gebildet haben. Leute, die gesagt haben, Technologie muss frei bleiben. Wir müssen weiterhin selbst daran herumschrauben können. Sie für unsere Zwecke nutzbar machen können.  

Open Source heißt dieses Prinzip, das bisher vor allem aus der Software-Szene bekannt ist. Der Begriff beschreibt die Offenlegung von Quellcodes, dass sie von jedermann eingesehen und kopiert werden können. 

Open Source ist aber mehr als das. Es beschreibt auch die Weitergabefreiheit, also dass diese Codes frei weitergegeben werden können. Und die Freiheit zur Weiterentwicklung, also dass jeder die Software weiterentwickeln und verbessern kann. 

History Repeating: Open Source in AI 

Nun ist es kein Wunder, dass sich der Open-Source-Gedanke auch im Bereich der Künstlichen Intelligenz (KI) und GenAI immer weiter ausbreitet. Schließlich haben sich hier - nicht zuletzt durch den GenAI-Hype vor zwei Jahren - immer größere Player gebildet. Sie bieten vortrainierte Modelle an. Trainiert auf Billionen von Textbausteinen und gespeichert in Milliarden von Parametern. Einer der bekanntesten Anbieter ist hier unter anderem OpenAI mit ChatGPT, einer Anwendung basierend auf sogenannten Generative Pre-trained Transformers (GPTs) und immer größeren und trainierteren Modellen wie GPT-4 oder GPT4o.

Die hohe Leistungsstärke dieser Modelle ist bekannt. Allerdings gibt es auch Nachteile, die vor allem im Unternehmenskontext heute und vor allem in Zukunft den Wunsch nach Open Source Modellen wachsen lassen.

Große Modelle sind geschlossen

Denn die großen Modelle der großen Tech-Unternehmen sind geschlossene Systeme. Das bedeutet, dass sie nicht wesentlich beeinflusst oder verändert werden können. Ja, OpenAI erlaubt in gewissem Umfang Anpassungen durch einzelne GPTs, aber das Modell greift immer auf die gleiche Quelle zurück.

Man muss mit dem leben, was die Maschine einem liefert. Und entweder den Input weiter anpassen, bis das Ergebnis stimmt. Oder den Output anpassen, bis er der Aufgabe entspricht. Beides erfordert zusätzliche Arbeit. Und das alles nur, weil man sich in einem vorgegebenen Schema bewegt, das nur bedingt anpassungsfähig ist.

Mit Kanonen auf Spatzen schießen

Die Modelle von OpenAI, Google und Co. sind groß. Sehr groß. Sie benötigen viel Hardware, viel Energie und viel Aufwand, um richtig zu funktionieren. Das ist für viele zu automatisierende Prozesse in den meisten Firmen nicht notwendig, schließlich würde kaum ein Unternehmen einen Jura-Harvard-Absolventen mit internationaler Berufserfahrung einstellen, um Dankeskarten für die jährliche Betriebsfeier zu formulieren. Um einfache Aufgaben im Unternehmen erledigen zu lassen, wie z.B. automatisierte E-Mails zu erstellen oder Dokumente in einfache Sprache zu überführen, benötigt man nur bedingt die volle Durchschlagskraft solcher Modelle.

Open-Source-Modelle bieten hier in Zukunft die Möglichkeit, kostengünstiger und effizienter zu agieren. Zwar sind auch diese Systeme nicht kostenlos, aber die kleineren und besser handhabbaren Algorithmen werden einen echten Kostenvorteil bieten können.

Datenschutz bei Open Source: Besser, aber noch nicht perfekt

Gerade in Europa diskutieren wir im Zusammenhang mit KI auch über Datenschutz. Kein Wunder, schließlich haben wir in Europa mit dem Digital Markets Act und vor allem dem AI-Act die erste echte Regulierung von digitalen und KI-Produkten. Diese Regulierung sorgt auch dafür, dass bestimmte Open Source Modelle aktuell nicht in Europa verwendet werden dürfen oder dafür freigegeben sind. Dies liegt auch daran, dass die Dokumentationspflichten und Absicherungsmaßnahmen, die einem auferlegt werden, zu groß und kostspielig sind.

Um es vorweg zu nehmen: Auch ein Großteil des Open-Source-Angebots kommt derzeit aus den USA. Mehr noch, mit Meta ist eines der Tech-Schwergewichte der große Anbieter von Open Source KI-Modellen. Und auch IBM bietet neben einem Software-Angebot zunehmend spezifische Hardware an, um Open Source KI-Modelle lokal hosten zu können.

Ein weiterer großer Vorteil, den Open Source hier gegenüber geschlossenen Systemen hat: die Möglichkeit, die Modelle auf eigenen Servern zu betreiben.   

In persönlichen Gesprächen mit unseren Kunden stelle ich immer wieder fest, dass neben Datenschutzbedenken auch die Sorge vor Datenlecks ein Pain-Point bei vielen Kunden ist. Der beste Schutz dagegen ist immer noch, so viel wie möglich lokal zu hosten, ohne den Anschluss an die große Technik zu verlieren.  

Hardware für große GenAI Modelle ist teuer. Kleinere Modelle, wie Llama von Meta, lassen sich aber bereits auf einem normalen Laptop betreiben. 

Fazit: Open Source – eine echte Alternative. Bald! 

Während die großen geschlossenen Systeme immer mehr skaliert werden, steht Open Source erst noch recht am Anfang das Potential zu entfalten. Wir sehen aber bereits das große Potenzial dieser Technologie. Wer in Zukunft in seinem Unternehmen verstärkt auf KI und GenAI setzen will, sollte Open Source in diesem Bereich unbedingt im Auge behalten. Und am besten schon jetzt damit planen. Auch wenn die Einstiegskosten derzeit noch höher sind: Je besser man die Modelle an seine Bedürfnisse anpassen kann, desto effizienter können sie in Zukunft arbeiten. Und Effizienz ist doch das, was wir von dieser Technologie erwarten, oder?

Entdecke neue Trends, bleibe up-to-date: Exxeta Newsletter

Spotlight


Get in Touch