Künstliche Intelligenz: Anwendungen, die über Chat GPT hinausgehen

Künstliche Intelligenz: Anwendungen, die über Chat GPT hinausgehen

Giovanni Blandino Veröffentlicht am 10/25/2023

Mittlerweile ist es so gut wie sicher: Künstliche Intelligenz ist die Technologie, die unser Leben und Arbeiten in naher Zukunft am meisten verändern wird. Seit der Einführung von ChatGPT – der künstlichen Intelligenz, die in der Lage zu sein scheint, jede unserer Fragen zu beantworten – explodiert das Interesse an diesem und anderen Beispielen für künstliche Intelligenz.

Branchenexperten und Investoren spitzen bereits die Ohren, aber auch Nutzer, Unternehmen und einfach nur Neugierige haben begonnen, die Trends der KI-basierten Apps mit Interesse zu verfolgen.

Plattformen und Apps mit künstlicher Intelligenz sollen uns nicht nur Gesellschaft leisten und unsere unterschiedlichsten Fragen beantworten, sondern werden uns höchstwahrscheinlich auch in vielerlei anderer Hinsicht helfen: Sie werden die Erfahrung bei der Online-Suche verbessern, Unternehmen bei der Kundenbetreuung unterstützen, die Erstellung und Optimierung von Artikeln, Abbildungen und Videos ermöglichen, Programmiercodes vorschlagen und Ratschläge zur Steigerung der Produktivität in Geschäftszyklen geben.

Auf künstlicher Intelligenz basierende Anwendungen, die in den kommenden Monaten zu beobachten sind
Auf künstlicher Intelligenz basierende Anwendungen, die in den kommenden Monaten zu beobachten sind

Doch welche auf künstlicher Intelligenz basierenden Apps gibt es derzeit auf dem Markt? Mit welcher Technologie funktionieren sie? Und was genau tun sie? Erfahren Sie Details und Neuigkeiten über die Produkte, die bereits auf dem Markt sind und solche, die demnächst auf den Markt kommen.

Hier finden Sie alle Beispiele, Anwendungen und Plattformen für künstliche Intelligenz, die Sie in den kommenden Monaten verfolgen sollten.

  • ChatGPT – der derzeit beliebteste Chatbot der Welt, basierend auf künstlicher Intelligenz
  • Google Bard – Googles Alternative zu ChatGPT, die die Welt der Suchmaschinen revolutionieren soll
  • Midjourney – ein Beispiel für künstliche Intelligenz zur Erstellung von Bildern aus einem Textbefehl
  • DALL-E 2 – eine weitere App für künstliche Intelligenz zur Umwandlung von Text in Bilder, auf die man achten sollte
  • Writesonic – Technologie der künstlichen Intelligenz für die Erstellung von Artikeln und Inhalten für soziale Medien
  • Synthesia – ein Beispiel für künstliche Intelligenz zur Erstellung von Videopräsentationen
  • GitHub Copilot – eine App, die Entwicklern beim Schreiben von Software-Quellcode mithilfe künstlicher Intelligenz hilft

ChatGPT

Wo könnte man besser anfangen als hier? ChatGPT ist die App für künstliche Intelligenz, die in den letzten Monaten die meisten Kommentare und das größte Interesse auf sich gezogen hat. Der Blogpost, mit dem sie im November 2022 vorgestellt wurde, wird von vielen bereits als technologiegeschichtliches Ereignis betrachtet, das mit der Präsentation des ersten iPhones im Jahr 2007 gleichzusetzen ist.

Auf künstlicher Intelligenz basierende Anwendungen: ChatGPT
Auf künstlicher Intelligenz basierende Anwendungen: ChatGPT

Technisch gesehen ist ChatGPT ein Chatbot, d. h. eine App mit künstlicher Intelligenz. Die App versteht natürliche Sprache und beantwortet konsequent Fragen, die von Nutzern in der gleichen Sprache gestellt werden. ChatGPT kann ein bisschen von allem und auf ganz natürliche Weise gefragt werden, wie z. B. “Kannst du diesen Text für mich übersetzen?” oder “Was ist die französische Revolution?”. Unter den Anfragen, die jeden Tag von den mehr als 600 Millionen Nutzern gestellt werden, betreffen viele Gedichte, Programmiercodes, Aufsätze zu bestimmten Themen, Schulaufgaben oder philosophische Gespräche.

Ein Beispiel für eine auf künstlicher Intelligenz basierende Anwendung: ChatGPT
ChatGPT wird gebeten, eine böse künstliche Intelligenz zu spielen. Quelle: Reddit

ChatGPT basiert derzeit auf dem GPT-3.5-Modell, einem künstlichen neuronalen Netzwerk, das auf der Grundlage von Hunderten von Milliarden von Online-Texten trainiert wurde. Die App mit künstlicher Intelligenz wurde von OpenAI entwickelt, einem Unternehmen, das von Elon Musk und Sam Altman gegründet wurde und an dem Microsoft maßgeblich beteiligt ist.

Natürlich hat ChatGPT zum Zeitpunkt der Erstellung dieses Artikels [März 2023] auch seine Grenzen. Die Trainingsdatenbank endet nämlich im Jahr 2021: Das bedeutet, dass ChatGPT ignoriert, was in den letzten zwei Jahren passiert ist. Seltsam, nicht wahr? Außerdem handelt es sich um eine rein textbasierte künstliche Intelligenz: Sie kann weder Bilder, Videos noch Sprachbefehle verstehen oder erzeugen. Einige dieser Hürden werden jedoch wahrscheinlich mit dem nächsten Upgrade auf GPT-4 überwunden werden.

Derzeit kann die Software nach einer Registrierung hier kostenlos online abgerufen werden. Leider ist es aufgrund des hohen Anfragevolumens oft schwierig, sie zu nutzen.

Zusammenfassend lässt sich sagen, dass ChatGPT:

  • Eine App, die auf künstlicher Intelligenz im Gespräch basiert (Chatbot)
  • Reagiert auf Texteingaben, indem sie artikulierte Antworten in natürlicher Sprache liefert
  • Ist nur textbasiert, enthält keine Audios oder Bilder
  • Derzeit kostenlos

Google Bard

Google Bard ist als Googles Antwort auf ChatGPT angekündigt. Derzeit [März 2023] ist diese App für künstliche Intelligenz noch nicht veröffentlicht worden und nur für eine sehr kleine Anzahl von Nutzern zugänglich.

Beispiele für künstliche Intelligenz: Google Bar
Beispiele für künstliche Intelligenz: Google Bar

Bis jetzt wissen wir, dass Google Bard, wie ChatGPT, eine App mit künstlicher Intelligenz für Konversationen ist, besser bekannt als Chatbot. Obwohl wir noch keine genauen Details über seine Fähigkeiten haben, sollte Google Bard in der Lage sein, konsequent auf verschiedene Arten von Eingaben von Nutzern in Form von Gesprächen zu reagieren. Google arbeitet insbesondere an der Integration von Google Bard in seine Suchmaschine, um die Internet-Suche zu revolutionieren und sie zuverlässiger und näher an unserer Sprache zu gestalten. In ähnlicher Weise ist ChatGPT dabei, in Bing, die Suchmaschine des Hauptkonkurrenten von Google, integriert zu werden.

Google Bard basiert auf der LaMDA-Technologie (Language Model for Dialogue Applications), einer Familie künstlicher neuronaler Netze, die auf Sprache angewendet und von Google ab 2020 entwickelt wird.

Zusammenfassend lässt sich sagen, dass Google Bard:

  • Ein Chatbot ähnlich wie ChatGPT, entwickelt von Google
  • Er wurde im Februar 2023 angekündigt, ist aber noch nicht öffentlich.
  • Er wird die Google-Suche verbessern

Midjourney

Midjourney ist, stark vereinfacht, die Bildversion von ChatGPT.

Midjourney ist eine App mit künstlicher Intelligenz vom Typ AI Text-to-Image, d.h. eine künstliche Intelligenz, die Bilder aus den Texteingaben eines Nutzers erstellt. Der Benutzer kann die Software zum Beispiel bitten, eine Illustration einer Frau auf einem Fahrrad im Stil von Picasso oder eine Alpenlandschaft mit Cyberpunk-Elementen zu erstellen.

Künstliche Intelligenz App: Midjourney
Künstliche Intelligenz App: Midjourney

Nach der ersten Eingabeaufforderung (so nennt man im Fachjargon die Texteingabe des Nutzers) gibt die App vier Bilder zurück, die weiter bearbeitet werden können, bis das gewünschte Ergebnis erreicht ist: So kann man die Software beispielsweise bitten, Elemente wie Gebäude im Hintergrund zu entfernen, ein bestimmtes Format zu verwenden oder einen völlig anderen Stil anzuwenden.

Beispiele für künstliche Intelligenz: Midjourney
Das Cover des Economist wurde dank Midjourney erstellt. Quelle: The Economist

Midjourney wurde im Juli 2022 von einem kleinen unabhängigen Labor mit Sitz in San Francisco in der Betaversion auf den Markt gebracht (die auch die derzeit verfügbare Version ist). Die künstliche Intelligenz basiert auf maschinellem Lernen und wurde auf einer riesigen Datenbank mit digitalen Bildern trainiert.

Bereits in den ersten Monaten stieß diese auf künstlicher Intelligenz basierende App auf Interesse und Kritik. Das Titelbild des Economist vom Juni 2022 wurde mit Midjourney gestaltet, während eine sorgfältige Debatte über rechtliche, ethische und philosophische Fragen rund um den Einsatz dieser Art von künstlicher Intelligenz von dem digitalen Künstler LRNZ und einigen Kollegen geführt wurde.

Sie können eine kostenlose Testversion von Midjourney aktivieren oder es mit einer kostenpflichtigen Lizenz nutzen. Sie können Midjourney von hier aus aufrufen.

Zusammenfassend lässt sich sagen, dass Midjourney ist:

  • Eine App mit künstlicher Intelligenz, die Bilder aus Text erstellt
  • Ermöglicht die Nachbearbeitung von Bildern durch Hinzufügen von Details, Stilen oder technischen Parametern
  • Die App befindet sich noch in der Beta-Phase, kann aber mit einer kostenpflichtigen oder einer kostenlosen Version genutzt werden.

DALL-E 2

Wie Midjourney ist auch DALL-E 2 eine auf künstlicher Intelligenz basierende Text-zu-Bild-App.

Die App, die 2021 von OpenAi, demselben Unternehmen wie ChatGPT, vorgestellt wird, befindet sich derzeit in ihrer zweiten Version, die bereits verbessert und gegenüber der Basissoftware aufgerüstet wurde. Das künstliche neuronale Netz, mit dem die App arbeitet, wurde auf einer großen Datenbank mit Bildern und einem Beschreibungstext trainiert.

DALL-E 2 nutzt also die gleiche Technologie wie ChatGPT, mit dem Unterschied, dass es natürliche Sprache interpretiert und entsprechende Bilder erzeugt. Wenn man zum Beispiel den Befehl “ein Gorilla spielt Computerspiele” eingibt, erzeugt die App ein realistisches Bild. Die App kann nicht nur dazu verwendet werden, ein bestimmtes Bild von Grund auf zu erstellen, sondern auch, um es dank einfacher Textbefehle zu verändern: Wenn Ihnen der Gorilla als Figur nicht mehr gefällt, können Sie die App bitten: “Ersetze den Gorilla durch einen jungen Teenager”.

Beispiel eines von AI DALL-E erzeugten Bildes 2. Quelle: https://openai.com/product/dall-e-2

Im Moment sind Midjourney und DALL-E 2 die beiden Hauptbeispiele für Text-zu-Bild-Künstliche Intelligenz, daher wird es nützlich und interessant sein, ihre Entwicklung zu verfolgen, um zu sehen, ob sie sich unterscheiden. Im Moment sind die Hauptunterschiede zwischen den beiden Apps vor allem im Stil zu erkennen, wobei DALL-E 2 dazu neigt, fotografischere und realistischere Bilder zu rendern als Midjourney.

Sie können DALL-E 2 von hier aus aufrufen. Sie können Ihre ersten Bilder kostenlos erstellen und zusätzliche Credits kaufen, um Ihre Kapazität zu erhöhen.

Zusammenfassend lässt sich sagen, dass DALL-E 2:

  • Die Benchmark-App der künstlichen Intelligenz für Text-zu-Bild, zusammen mit Midjourney.
  • Sie neigt dazu, einen realistischeren und fotografischen Stil als ihre Konkurrenten zu haben.
  • Sie wurde von OpenAi, dem Unternehmen, dem ChatGPT gehört, entwickelt.

Writesonic

Writesonic ist eine auf künstlicher Intelligenz basierende App zum Erstellen und Optimieren von Texten und Artikeln: eine Art digitaler Texter mit einer KI-Engine.

Mit Hilfe von Natural Language Processing (NLP)-Modellen und maschinellem Lernen zielt Writesonic darauf ab, mehr oder weniger komplexe Artikel, Inhalte für soziale Medien und Texte für Online-Werbung zu erstellen. Die App nutzt auch künstliche Intelligenz, um bereits geschriebene Texte zu verbessern, zum Beispiel durch die Optimierung von Suchbegriffen oder die Unterstützung bei der Verwaltung der Bilder, die dem Artikel beigefügt werden sollen.

Künstliche Intelligenz App: Writesonic
Künstliche Intelligenz App: Writesonic

Die erste, noch recht rudimentäre Version von Writesonic wurde 2020 von seinem Schöpfer, dem indischen Informatiker Garg Samanyou, mit der Idee ins Leben gerufen, das Potenzial der künstlichen Intelligenz mit der menschlichen Kreativität zu verbinden. Inzwischen hat das Unternehmen Writesonic auch eine eigene Alternative zu ChatGPT entwickelt: den Chatbot Chatsonic.

Wie ChatGPT ist ChatSonic eine auf künstlicher Intelligenz basierende Konversations-App, die auf Texteingaben reagiert. Im Vergleich zu seinem bekannteren Konkurrenten kann ChatSonic jedoch auch mit Bildern reagieren und versteht auch Sprachbefehle. Die App wurde außerdem auf einer Datenbank trainiert, die heute aktuell ist, im Gegensatz zur Datenbank von ChatGPT, die im Jahr 2021 stecken geblieben ist.

Sie können Writesonic bis zu einer bestimmten Wortzahl kostenlos testen, danach müssen Sie kostenpflichtige Pläne aktivieren. Hier können Sie auf die App zugreifen.

Zusammenfassend lässt sich sagen, dass Writersonic ist:

  • Eine auf künstlicher Intelligenz basierende App zum Erstellen und Optimieren von Artikeln
  • Zur Erstellung oder Optimierung von Artikeln, Blogposts, Social-Media-Inhalten und Anzeigen
  • Das gleiche Unternehmen bietet auch ChatSonic an, eine Chatbot-Alternative zu ChatGPT

Synthesia

Synthesia ist eine Plattform zur Erstellung von Videos, die auf künstlicher Intelligenz basiert. Die App wurde 2017 von einer Gruppe von Forschern der Universitäten Stanford, UCL, TUM und Cambridge gegründet.

Synthesia funktioniert ganz einfach über einen Browser: Durch die Eingabe eines Textes werden Präsentationsvideos (derzeit noch sehr statisch) erstellt, in denen ein Avatar den vom Nutzer eingegebenen Text vorträgt. Der Vorteil für Unternehmen ist, dass sie viele Videos erstellen können, ohne ein ganzes Videoteam und teure Geräte wie Mikrofone und Kameras einsetzen zu müssen.

Beispiele für künstliche Intelligenz: Synthesia
Beispiele für künstliche Intelligenz: Synthesia

Hinter dem Funktionieren der App steht eine künstliche Intelligenz, die die Sprache an die Lippenbewegungen der Avatare anpasst und Stimmen synthetisiert, die den natürlichen Stimmen ähneln (hier ein Beispiel für ein Werbevideo einer Finanz-App).

Derzeit kann man in Synthesia aus über 85 Avataren, die auf echten Schauspielern basieren, und 120 Sprachen (darunter natürlich auch Italienisch) wählen. In einigen Sprachen können Sie sogar den Akzent variieren. Um Zugang zu einer Demo zu erhalten oder um ein auf Ihre Bedürfnisse zugeschnittenes Angebot auszuhandeln, wenden Sie sich an das Unternehmen. Die Basisversion kostet 26 Euro pro Monat.

Zusammenfassend lässt sich sagen: Synthesia ist:

  • Eine auf künstlicher Intelligenz basierende App für die Erstellung von Promovideos
  • Künstliche Intelligenz synthetisiert natürliche Stimmen und synchronisiert Sprache mit den Lippen von Avataren
  • Um eine Demoversion anzufordern, kontaktieren Sie bitte das Unternehmen

GitHub Kopilot

Wussten Sie, dass Apps, die auf künstlicher Intelligenz basieren, Entwicklern selbst bei ihrer Arbeit helfen können? GitHub Copilot zum Beispiel ist eine Plattform, die Entwickler bei der Erstellung von Programmiercode unterstützt: eine Art Helfer für Programmierer.

Beispiele für künstliche Intelligenz: GitHub Copilot
Beispiele für künstliche Intelligenz: GitHub Copilot

Beim Kompilieren von Software schlägt die App dem Nutzer verschiedene Möglichkeiten vor, wie der Code vervollständigt werden kann, um die Arbeit des Programmierers zu beschleunigen und zu rationalisieren. GitHub Copilot basiert auf der GPT-3-Technologie, der gleichen wie ChatGPT: In diesem Fall ist das Modell der künstlichen Intelligenz jedoch speziell dafür ausgelegt, sowohl die menschliche als auch die Programmiersprache zu verstehen und zu generieren.

Im Moment scheint die App nicht über die Rolle eines einfachen Assistenten hinauszugehen und nicht in der Lage zu sein, ein komplexes System eigenständig zu bewältigen. Wird sie sich in Zukunft durchsetzen?

Sie können GitHub Copilot hier ausprobieren.

Zusammenfassend lässt sich sagen:

GitHub Copilot ist:

  • Ein auf künstlicher Intelligenz basierender Assistent für die Kompilierung von Programmiercode
  • Künstliche Intelligenz versteht und generiert sowohl menschliche Sprache als auch Quellcodes
  • Die App scheint derzeit nicht in der Lage zu sein, komplexe Systeme selbständig zu bearbeiten.

Und haben Sie schon eine dieser KI-basierten Anwendungen ausprobiert? Was halten Sie von diesen ersten Beispielen?