Google verstärkt seine mit künstlicher Intelligenz (KI) verknüpften Anzeigen und bringt einen brandneuen Bildgenerator auf den Markt. Bemerkenswerter Punkt: Es funktioniert ohne Aufforderung!

Google bringt mehrere neue Produkte auf Basis künstlicher Intelligenz auf den Markt. © JRdes / Shutterstock

Denn die Bilderzeugung ist sicherlich einer der Bereiche, in denen KI die meisten Nutzer in ihren Bann zieht, und es entstehen ständig neue Tools.

Vor diesem Hintergrund bringt Google Labs, eine Zweigstelle, die sich Tests und Experimenten mit den neuesten Technologien des Unternehmens widmet, Whisk auf den Markt. „ Anstatt Bilder mit langem, detailliertem Text zu erstellen, können Sie mit Whisk Eingabeaufforderungen mit Bildern erstellen “, erklärt sie in einem Blogbeitrag. Aber wie genau funktioniert es dann?

Gemini generiert die Eingabeaufforderungen

Tatsächlich müssen Sie nur Bilder in das Tool ziehen, damit es startet: eines für das Motiv, ein zweites für die Szene und das letzte für den Stil. Anschließend wird das Gemini-Modell aktiviert, das automatisch detaillierte Bildunterschriften für die eingefügten Bilder schreibt. Diese Bildunterschriften werden dann in Imagen 3 eingeführt, dem neuesten Bildgenerierungsmodell der Firma Mountain View.

Dieser Prozess erfasst die Essenz Ihres Motivs und nicht eine exakte Nachbildung. So können Sie Ihre Themen, Szenen und Stile ganz einfach auf originelle Weise neu mischen », versichert das Unternehmen. Konkret handelt es sich also um ein Bild, das auf Geminis Interpretation der vom Benutzer in das Tool integrierten Bilder basiert.

Hier sehen wir die drei Bilder, die in Whisk eingefügt wurden, um das rechte Bild zu generieren. © Google
Hier sehen wir die drei Bilder, die in Whisk eingefügt wurden, um das rechte Bild zu generieren. © Google

Laut Google eher ein kreatives Tool als ein Generator

Da Whisk nur einige Schlüsselfunktionen aus Ihrem Bild extrahiert, kann es sein, dass es Bilder erzeugt, die von Ihren Erwartungen abweichen. Beispielsweise kann das generierte Motiv eine andere Größe, ein anderes Gewicht, eine andere Frisur oder einen anderen Hautton haben „, warnt Google und erkennt an, dass das Tool das Potenzial hat, „ Ihr Ziel verfehlen „. Glücklicherweise ist es auch möglich, ihm weitere Informationen im Text zu geben, sodass das generierte Bild nachbearbeitet werden kann.

Das könnte Sie auch interessieren:  Das iPhone 17s könnte unsere Lieblingsfunktion von den Pro-Modellen erhalten
Ein weiteres Beispiel für Whisks Kreationen. © Google
Ein weiteres Beispiel für Whisks Kreationen. © Google

Das Unternehmen betrachtet Whisk eher als „ ein kreatives Werkzeug » als echter Bildgenerator. „ Wir haben es für eine schnelle visuelle Erkundung konzipiert, nicht für eine pixelgenaue Bearbeitung “, präzisiert sie.

Wer die Technik testen will, muss allerdings Geduld haben. Derzeit ist Whisk in den USA nur als Vorschau verfügbar. Wie bei KI üblich, wird Google auf das Feedback der ersten Tester warten, um seine Technologie zu verbessern, bevor ein breiterer Einsatz in Betracht gezogen wird.

Quelle : Google