Alphabet CEO Sundar Pichai waves after speaking at a Google I/O event in Mountain View, Calif., Wednesday, May 10, 2023. (AP Photo/Jeff Chiu)

Wer fuchtelt da auf der Bühne herum? Es ist der Google-CEO Sundar Pichai, der für das letzte Jahr 226 Millionen US-Dollar kassiert hat und dann eine Massenentlassung startete...Bild: AP / Jeff Chiu

Analyse

Tschüss ChatGPT! Mit diesen neuen KI-Funktionen will Google die Konkurrenz ausstechen

Generative künstliche Intelligenz hält in praktisch allen Google-Produkten Einzug, inklusive Suchmaschine. Hier sind die wichtigsten Ankündigungen.

11.05.2023, 11:0011.05.2023, 11:00

Daniel Schurter / watson.ch

An seiner Entwicklerkonferenz I/O hat Google am Mittwochabend verraten, wie es ChatGPT in den Schatten stellen will, ohne die gleichen Fehler zu machen. Dieser Beitrag dreht sich um die wichtigsten Software-Ankündigungen.

Inhaltsverzeichnis

"Magic Editor" für Google Fotos "Magic Compose" soll Texte verbessern Google Bard wird aufgemotzt, aber ...Das bietet das neue Sprachmodell PaLM 2 Google-Suche erhält KI-Funktion MusicLM – hier soll die KI-Musik spielen "Immersive View" für Google Maps Warum diese KI-Offensive?Quellen

"Magic Editor" für Google Fotos

Googles neuestes Fotos-Feature ist eine Funktion namens Magic Editor. Generative KI ermöglicht es, ganz einfach größere Änderungen in einer Aufnahme vorzunehmen.

Mit Magic Editor kannst du eine abgebildete Person vollständig verschieben.

Alphabet CEO Sundar Pichai speaks at a Google I/O event in Mountain View, Calif., Wednesday, May 10, 2023. (AP Photo/Jeff Chiu)

Sundar Pichai stellt die neuen Funktionen vor.Bild: AP / Jeff Chiu

Die KI-Funktion für Google Fotos soll laut Ankündigung später in diesem Jahr verfügbar sein – zunächst allerdings nur auf "ausgewählten" neuen Pixel-Smartphones.

"Magic Compose" soll Texte verbessern

Die neue KI-Funktion "Magic Compose" soll in Nachrichten und Konversationen verwendet werden können, um Texte in verschiedenen Stilen umzuschreiben.

So geht's: Um mit Magic Compose zu starten, muss man gemäß Ankündigung die Google-App "Messages" verwenden und zunächst wie gewohnt den Text eingeben. Anschliessend wählt man aus, wie die Nachricht klingen soll, und die generative KI könne den Text entsprechend anpassen.

Laut Google soll "Magic Compose" noch in diesem Sommer als Betaversion für Android-User lanciert werden.

Google-Chef Pichai demonstrierte unter anderem, wie Software einen Brief für die User formulieren kann. Und wenn man eine Geschichte schreibt, soll die Software Vorschläge für weitere Wendungen der Story und automatisch generierte Illustrationen liefern können.

Google Bard wird aufgemotzt, aber ...

Die ChatGPT-Herausforderer aus dem Hause Google soll schon bald in 180 Ländern verfügbar sein, wenn auch nur auf Englisch. Das Eintragen in eine Warteliste entfalle für alle Interessierten, die den KI-Chatbot testen möchten.

Als sich der watson-Redaktor auf bard.google.com (mit dem eigenen Google-Account) anmeldete, gab es allerdings eine herbe Enttäuschung: "Derzeit nicht verfügbar", wurde auf dem Bildschirm angezeigt.

Der Textroboter von Google konnte bislang nur in den USA und Großbritannien ausprobiert werden. Nun wird der User-Kreis erweitert, allerdings nicht in Europa.Bild: www.imago-images.de / imago images

Neu würden auch Japanisch und Koreanisch unterstützt, Deutsch und Schweizerdeutsch hingegen nicht. Weitere 40 Sprachen, darunter Deutsch, sollen "bald" folgen. Aber auch in den Ländern der Europäischen Union (EU) wird Bard zumindest vorerst nicht verfügbar sein.

Offenbar versucht der US-Konzern zunächst zu klären, ob Bard kompatibel mit dem rechtlichen Rahmen in der Europäischen Union ist.

Laut Ankündigung erhält Google Bard eine Reihe neuer Funktionen, darunter einfachere Möglichkeiten zum Exportieren von Text in Google Docs und Gmail, eine visuelle Suche und einen "Dark Mode" (Dunkelmodus).

Der neue KI-Chatbot kann nicht nur Sprache in Textform verarbeiten, er "versteht" bis zu einem gewissen Grad auch Bildinhalte. Dies wird als multimodal bezeichnet.

Auch die Google-Workspace-Apps, also die Bürosoftware, wird mit KI-Funktionen ergänzt, um sie leistungsfähiger zu machen: Dies soll etwa mit der Hinzufügung einer automatischen Tabellengenerierung (nicht von Formeln) geschehen und mit automatisierter Bilderstellung in Slides und Meet.

Das bietet das neue Sprachmodell PaLM 2

An der Entwicklerkonferenz hat Google die Einführung von PaLM 2 bekannt gegeben, seinem neuesten Large Language Model (LLM). Auf dieser Technologie basieren auch der neue KI-Chatbot Bard und weitere KI-Funktionen.

Mit dem neuen Sprachmodell will Google gegen GPT-4 von OpenAI antreten.Bild: AP / Jeff Chiu

So wie es der Konkurrent OpenAI mit ChatGPT tut, gibt auch Google nicht viele technische Details darüber preis, wie es die nächste Generation der generativen KI trainiert.

Google sagt, das neue Modell sei besser in den Bereichen gesunder Menschenverstand, Mathematik und Logik. Und es komme nicht nur auf die Grösse an.

"Es ist kein Geheimnis, dass grosse Sprachmodelle – mit ihrem Fokus auf Sprache – Schwierigkeiten haben, mathematische Fragen zu beantworten, ohne auf Plug-ins von Drittanbietern zurückzugreifen. Google argumentiert jedoch, dass PaLM 2 problemlos mathematische Rätsel lösen, Probleme durchdenken und sogar Diagramme erstellen kann."

quelle: techcrunch.com

PaLM 2 bietet laut Ankündigung auch eine verbesserte Unterstützung für das Programmieren und Debuggen von Code. Das Modell wurde in 20 Programmiersprachen trainiert, darunter beliebte Sprachen wie JavaScript und Python.

Google spricht von PaLM als Familie von Modellen, zu denen auch Med-PaLM 2 gehört, das Modell des Unternehmens, das sich auf medizinisches Wissen konzentriert.

Es gebe auch noch Sec-PaLM, eine Version, die sich auf Sicherheitsanwendungen konzentriert, und ein kleineres PaLM-2-Modell, das auf Smartphones laufen könne.

Und die Sicherheit?

Google will bei der Lancierung seiner KI-Tools nicht die gleichen Fehler wie die ChatGPT-Entwickler machen. Also nichts überstürzen. Die Sicherheit stehe an erster Stelle, heißt es. Ob das gelingt, wird die Praxis zeigen.

Google will in Zukunft alle KI-generierten Inhalte mit einem digitalen Wasserzeichen versehen. Und diese Kennzeichnung, die gegen die Verbreitung von Fake News helfen kann, bleibe erhalten, auch wenn der Inhalt bearbeitet wird.

Googles Erzrivale Microsoft ist bekanntlich einen milliardenschweren Pakt mit der ChatGPT-Entwicklerfirma OpenAI eingegangen und baut generative KI auf breiter Front in seine Anwendungen ein. Google hielt sich bisher damit zurück, unter Verweis auf einen verantwortungsvollen Einsatz der Technologie und regulatorische Notwendigkeiten.

Auf der Google I/O bekräftigte der Konzern diesen Kurs. "Der einzige Weg, auf lange Sicht mutig zu sein, ist, von Anfang an verantwortungsvoll zu agieren", betonte am Mittwoch James Manyika, der bei Google für gesellschaftliche Verantwortung beim Einsatz Künstlicher Intelligenz zuständig ist.

Der Konzern sehe die Gefahr, dass die Software Vorurteile stärken oder für Produktion und Verbreitung von Falschinformationen verwendet werden könne. Zum Schutz davor sollen zum Beispiel mit Hilfe Künstlicher Intelligenz erzeugte Dateien mit Metadaten versehen werden, damit sie sofort erkannt werden können.

Auch werde Google eine Software, die automatisch Synchronfassungen von Videos anfertigen kann, nur überprüften Entwicklern zur Verfügung stellen, sagte Manyika. Damit sollen sogenannte Deepfakes mit angeblichen Handlungen realer Personen verhindert werden.

Manyika betonte zugleich, dass Google sich schon vor Jahren dagegen entschieden habe, Schnittstellen für Anwendungen mit Gesichtserkennung öffentlich verfügbar zu machen. Beim verantwortungsvollen Einsatz Künstlicher Intelligenz müssten alle Beteiligten zusammenarbeiten.

Google-Suche erhält KI-Funktion

Generative KI wird auch in die Google-Suche integriert:

"Fragen lassen sich dank künstlicher Intelligenz natürlicher als bisher stellen, oberhalb der bekannten Suchergebnisse wird es künftig eine Box mit einer Fliesstextantwort der KI geben.

Wie bei Microsofts KI-unterstützter Bing-Suche werden Informationen aus der Websuche eingebunden, die dabei verwendeten Webseiten werden als Links visualisiert."

quelle: golem.de

Die neuen KI-Such-Funktionen sollen zunächst nur für interessierte Tester verfügbar sein. Wer es ausprobieren möchte, soll sich bei labs.google.com/search anmelden können.

Mithilfe der integrativen KI soll die Suchmaschine etwa die Frage beantworten können, welcher von zwei Naturparks für eine Familie mit Kindern und Hund besser geeignet sei. Die Antworten werden in ganzen Sätzen formuliert, als Zusatz gibt es die gewohnten Internet-Links.

Bei Produktsuchen gebe es neben den bisherigen Shopping-Vorschlägen KI-generierte Hinweise und Tipps – etwa, worauf bei einem Fahrradkauf zu achten sei. Die Shopping-Anzeigen würden ebenfalls mit KI-Erklärungen ergänzt, heißt es.

Bei der Suche nach einem Gefährt werden zusätzlich zu Ratschlägen, etwa auf die Radaufhängung zu achten, auch passende Angebote von Händlern angezeigt. Zusätzlich könnte man sich zum Beispiel zu Regeln für Handzeichen beim Radfahren in Kalifornien befragen lassen, sagte Google-Managerin Cathy Edwards. "Das sind Dinge, nach denen man früher nie in der Suche gefragt hätte."

Aber: Google betont, dass "Bard" ein Experiment sei und kein ernsthafter Ersatz für seine Suchmaschine.

MusicLM – hier soll die KI-Musik spielen

Außerdem lanciert Googles ein experimentelles KI-Tool, das Text in Musik umwandeln kann. Das im Januar angekündigte "Music LM" soll man nun ausprobieren können.

Ein Demo-Video (auf Englisch):

Video: YouTube/Google Arts & Culture

"Immersive View" für Google Maps

Googles Karten-App soll in einigen Städten "Immersive View" für Routen bekommen. Dabei wird eine virtuelle Vorschau der vom User gewählten Strecke angezeigt, die unter anderem den aktuellen Verkehr als kleine, animierte Fahrzeuge visualisiert. Auch das Wetter wird angezeigt. Egal, ob man die Strecke per Auto, Velo oder zu Fuss absolvieren will.

"Mit dem Zeitschieberegler sehen Sie Informationen zur Luftqualität und wie die Route aussieht, wenn sich das Wetter im Laufe des Tages ändert, sodass Sie mit einer Jacke oder Sonnencreme vorbereitet sein können."

Zu den auserwählten Metropolen, die Immersive View als Erste erhalten, gehören Amsterdam, Berlin, Dublin, Florenz, Las Vegas, London, Los Angeles, Miami, New York, Paris, San Francisco, San Jose, Seattle, Tokio und Venedig.

Warum diese KI-Offensive?

Seitdem ChatGPT im vergangenen November für die Öffentlichkeit zugänglich gemacht wurde, hat in der IT-Branche ein wilder Wettlauf um generative KI-Systeme begonnen, die auf Nutzeranfragen in natürlicher Sprache in Sekundenschnelle Inhalte generieren können.

Der Hype rund um die Möglichkeiten der neuen KI-Systeme schwankt in der Öffentlichkeit dabei zwischen überschwänglicher Begeisterung und apokalyptischen Befürchtungen.

Auch Google zog nach und machte sein Konkurrenzprodukt Bard Ende März eingeschränkt der Öffentlichkeit zugänglich.

Die Verantwortlichen beim US-Techkonzern werden nicht müde zu betonen, dass Google kein Neueinsteiger ist.

"Seit sieben Jahren sind wir in erster Linie ein Unternehmen für künstliche Intelligenz, und wir stehen an einem Wendepunkt", sagte der Chef des kalifornischen Konzerns, Sundar Pichai, am Mittwochabend zur Eröffnung der I/O im Google-Amphitheater im kalifornischen Mountain View.

Microsoft hat kürzlich ähnliche Ankündigungen gemacht. Der IT-Riese, der zweistellige Milliardenbeträge in den kalifornischen ChatGPT-Entwickler OpenAI investiert hat, hatte ChatGPT bereits in die eigene Suchmaschine Bing integriert und öffnete die KI-Suche vergangene Woche vollständig für die Öffentlichkeit - wodurch das im Vergleich zu Google unbedeutende Suchportal wiederbelebt wurde.

Quellen

Mit Material der Nachrichtenagenturen Keystone-SDA und DPA

blog.google: New ways AI is making Maps more immersive
blog.google: Supercharging Search with generative AI
blog.google: Turn ideas into music with MusicLM
golem.de: Google bringt KI in Suche und Apps und öffnet Bard für alle
theverge.com: The Pixel Fold is Google’s $1800 entry into folding phones
techcrunch.com: Google launches PaLM 2, its next-gen large language model

Tschüss ChatGPT! Mit diesen KI-Funktionen will Google die Konkurrenz ausstechen