Künstliche Intelligenz: Microsoft-Bot malt Bilder auf Zuruf

Künstliche Intelligenz Microsoft-Bot malt Bilder auf Zuruf

Wie weit ist Künstliche Intelligenz? Diese Frage beschäftigt im Zeitalter des Digitalen Wandels Laien und Experten. Nun haben Microsoft-Forscher einen Zeichenbot entwickelt, der anhand eines Sprachbefehls oder einer Textbeschreibung beispielsweise einen „gelben Vogel mit einem kurzen Schnabel und schwarzen Flügeln“ zeichnet. Dabei wird jedes Bild dank Künstlicher Intelligenz um Details ergänzt, die in der Zeichenanleitung fehlen, wie etwa einen Ast, auf dem der Vogel sitzt. Laut Aussage der Forscher lässt dies auf eine „eigene Vorstellungskraft“ des Bots schließen.

 

Ein Kontrollmechanismus überprüft die Richtigkeit des Bildes

Der Zeichenbot arbeitet nach dem Verfahren der sogenannten „Generative-Adversarial-Network“ (GAN). Dieses kombiniert zwei Modelle des maschinellen Lernens. Im ersten Schritt wird ein Bild aus einer Textbeschreibung generiert (Generator). Danach wird im zweiten Schritt auf Grundlage der gleichen Textbeschreibung die Richtigkeit und Qualität des gezeichneten Bildes beurteilt (Discriminator). So wird gewährleistet, dass der Zeichenbot visuelle Darstellungen und Beschreibungen einander korrekt zuordnet. Trainiert wurde die KI vorab mit einer Vielzahl an Bildern und den dazugehörigen Textbeschreibungen.

 

Allerdings funktioniert das einfache GAN-Verfahren nur bei wenig komplexen Bildbeschreibungen einwandfrei. Enthält die Zeichenanweisung zu viele Details, wird die Methode anfällig für Fehler, weil das System nur einen einzigen Input aufnehmen kann. Im Gegensatz dazu sind Menschen in der Lage, auch komplexe Anweisungen umzusetzen, indem sie alle Abschnitte einer Anweisung beachten. Deshalb haben die Forscher versucht, dieses menschliche Konzept der Aufmerksamkeit mathematisch auf die GAN-Methode zu übertragen.

 

Auf der Basis dieses erweiterten GAN-Modells sei die Künstliche Intelligenz sogar in der Lage, ein gewisses Allgemeinwissen zu entwickeln, erklären die Microsoft-Mitarbeiter. So lerne die Maschine beispielsweise anhand ihrer Trainingsdaten, dass Vögel häufig auf einem Ast sitzend abgebildet werden (Quelle: https//news.microsoft.com).

 

Mögliche Einsatzbereiche der Microsoft-KI

Geht es nach den Microsoft-Forschern, so könnten Zeichenbots in Zukunft zum Beispiel Architekten oder Designern als Assistenten zur Hand gehen oder etwa in Bildbearbeitungsprogramme integriert werden. Entwickler Xiandong He glaubt sogar, dass mit Hilfe der Microsoft-Technologie und einer höheren Rechenleistung animierte Filme anhand eines Drehbuchs produziert werden können. Das würde deutlich weniger Handarbeit erforderlich machen und Filmemachern ihren Job erleichtern.

 

Bei aller Begeisterung räumen die Microsoft-Forscher jedoch ein, dass ihre KI-Technologie noch nicht perfekt funktioniert. Betrachte man die Bilder, seien fast immer Mängel zu entdecken, wie beispielsweise Vögel, deren Schnäbel blau anstatt schwarz sind. Anhand dieser Fehler ließe sich eben erkennen, dass ein Computer und kein Mensch die Bilder erstellt habe. Dennoch sei die erweiterte GAN-Technologie eine deutliche Verbesserung im Vergleich zu bisherigen Verfahren und ein weiterer Meilenstein auf dem Weg zu einer KI, die Menschen im Alltag unterstützen könne.

 

„Sprache und Vorstellungskraft sind die zwei wichtigsten Grundvoraussetzungen, damit Menschen und Künstliche Intelligenz künftig miteinander interagieren können“, so Xiandong He (Quelle: https://blogs.microsoft.com).

 

 

 

Kontakt

[contact-form-7 404 "Not Found"]

Veröffentlicht von

Branchen-Trendscout Team
Branchen-Trendscout Team

Das Branchen-Trendscout Team berichtet über brandaktuelle Themen zur digitalen wie auch analogen Welt des Marketings.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.