Google hat gestern die beiden neuen Gemini-Mediengeneratoren Imagen 3 und Veo 2 vorgestellt, mit denen die Nutzer durch einfache Prompts beliebige Bilder oder Videos erstellen können. Aber es gibt noch ein drittes Tool im Bunde, das einen etwas anderen Ansatz verfolgt und das Erstellen von Bildern noch weiter vereinfachen soll: Mit Whisk lassen sich neue Bilder visuell generieren und anpassen.
Google hat vor wenigen Tagen das neue Gemini 2.0 vorgestellt, das in allen Bereichen große Verbesserungen im Gepäck haben und auch die Multimodalität zum Verständnis von Medien weiter verbessern soll. Passend dazu wurden nun neue Generationen des Videogenerators Veo sowie des seit langer Zeit im Einsatz befindlichen Bildgenerators Imagen vorgestellt. Beide sollen deutlich zugelegt haben.
Die Online-Textverarbeitung Google Docs bietet den Nutzern viele Möglichkeiten, um unterschiedliche Medien in ein Dokument einzufügen. Bilder sind natürlich die naheliegendste Variante für ein Dokument, das vielleicht auch ausgedruckt werden soll, und jetzt zieht auch an dieser Stelle die Künstliche Intelligenz ein. Viele Nutzer können per Imagen 3-Integration neue Fotos per Prompt generieren lassen.
Zu Googles KI-Modell Gemini gehört dank des multimodalen Ansatzes auch die Möglichkeit, Bilder zu vearbeiten oder auf Anfrage neue zu generieren. Jetzt macht das darunterliegende Modell Imagen 3 einen großen Schritt und ist ab sofort für alle Nutzer kostenlos und unbegrenzt verfügbar. Sowohl qualitativ als auch funktionell hat man sehr stark zugelegt und den Bildgenerator auf ein neues Level gebracht.
Nutzer von Google Workspace dürfen sich auf die nächste Generation der Plattform freuen, die natürlich ganz im Zeichen der Künstlichen Intelligenz und mehrstufig für die ersten Nutzer ausgerollt wird. Jetzt ist die Präsentationsplattform Google Slides an der Reihe, die Labs-Teilnehmern die Möglichkeit gibt, Grafiken dynamisch auf Basis der Imagen-Technologie zu generieren.