Können Computer zeichnen? Google hat gerade ein neuronales Netzwerk zum Skizzieren gelehrt - Fotografie - 2018

Anonim

Die obigen Kritzeleien wurden von Sketch RNN erstellt und auf ein Stock-Foto gelegt.

Die KI von Google kann jetzt Ihre groben Skizzen identifizieren - aber das Forschungsteam unterrichtet auch Computer, um ihre eigenen Kritzeleien zu zeichnen. Am 13. April berichtete das Google-Forschungsteam über seine neuesten Arbeiten mit einem neuronalen Netzwerk, das in der Lage ist, eigene Skizzen zu zeichnen, die derzeit Sketch RNN heißen. Im Gegensatz zu AutoDraw ist Sketch RNN eine kürzlich veröffentlichte Forschungsarbeit und noch nicht für die Öffentlichkeit zugänglich.

Das System basiert auf menschlichen Skizzen, imitiert jedoch nicht genau die menschlichen Doodles, so Google Research, sondern erstellt stattdessen eigene neue Zeichnungen. Während das System noch mit einer Skizze beginnt, rekonstruiert das Programm die Originalzeichnung auf einzigartige Weise. Das liegt daran, dass das Team bewusst Rauschen zwischen Encoder und Decoder hinzugefügt hat, so dass der Computer die genaue Skizze nicht abrufen kann.

Das Ziel ist nicht, Computer zu lehren, eine Zeichnung zu kopieren, sondern zu sehen, ob neuronale Netze tatsächlich in der Lage sind, ihre eigenen Zeichnungen zu erstellen. Die Google-Forscher David Ha und Douglas Eck nutzten dafür 70.000 Zeichnungen, um das System anhand der Motorsequenzen wie Richtung und Zeitpunkt des Aufhebens des Stifts zu unterrichten, anstatt einfach Tausende von bereits fertiggestellten Zeichnungen einzugeben.

Während die Katzenzeichnungen des Systems nicht viel besser aussehen als die eines Vorschülers, kann sketch RNN eine einzigartige Skizze erstellen. Um die Fähigkeit des Programms zu testen, eine einzigartige Katze zu zeichnen, füttert das Team auch Daten von seltsamen Zeichnungen, wie eine dreiäugige Katze. "Wenn wir eine Skizze einer dreiäugigen Katze füttern, erzeugt das Modell eine ähnlich aussehende Katze, die stattdessen zwei Augen hat, was darauf hindeutet, dass unser Modell gelernt hat, dass Katzen normalerweise nur zwei Augen haben", schrieb Ha.

Wenn die Eingabeskizze tatsächlich ein anderes Objekt ist, aber immer noch mit dem Wort cat gepaart ist, erzeugt das Programm immer noch eine Katze, obwohl die Gesamtform der ursprünglichen Zeichnung ähnelt. Als die Forscher zum Beispiel einen Lastwagen zeichneten und dem Computer erzählten, dass es ein Schwein war, bekamen sie ein Schwein in Form eines Lastwagens.

Also, was ist die reale Weltanwendung? Google Research sagt, dass das Programm Designern helfen kann, schnell eine große Anzahl von einzigartigen Skizzen zu generieren. Schließlich könnte das Programm auch verwendet werden, um Zeichnungen zu lehren, mehr über die Art, wie Menschen skizzieren, oder um unvollständige Zeichnungen zu beenden.