GoogleWatchBlog

Starline: Google erklärt revolutionäre neue Technologie zur Videotelefonie – beeindruckender Realismus (Video)

» Web-Version «

Die Videotelefonie ist in ihren Ursprüngen eine überraschend alte Technologie, aber erst durch die Pandemie und den Home Office-Boom konnte sie ihren endgültigen Durchbruch feiern und sich bei vielen Menschen zumindest beruflich zum Standard etablieren. Google bietet eine Reihe von Lösungen für die Videotelefonie, arbeitet aber auch ganz offen an neuen Technologien, die wichtige Grenzen verschwimmen lassen sollen. Nach einem großen Testlauf zieht man erste Bilanz und erklärt das Projekt Starline.


Die Videotelefonie ist ein altes Thema, denn in einigen Kreisen ist sie seit Jahrzehnten etabliert, wenn auch mit völlig anderen Qualitätsansprüchen als heute. Viele Menschen dürften aber erst 2020 ernsthafter und umfangreicher mit diesem Thema in Berührung gekommen sein und so ist es kein Wunder, dass vorher nahezu unbekannte Unternehmen wie Zoom plötzlich aus dem Boden schossen und auch Google nach halbherzigen Anläufen große Anstrengungen in Meet und andere Produkte setzt, die sich auf Videokonferenzen spezialisiert haben.

Doch trotz aller Technologien wirkt die Videotelefonie oftmals hölzern und ein wenig unrealistisch – man weiß jederzeit, dass man nur einige Pixel auf dem Bildschirm sieht, die das gegenüber darstellen. Google hat im vergangenen Jahr ein ganz neues Produkt gezeigt, dass auf beiden Seiten sehr stark auf 3D setzt und erst vor wenigen Tagen wurde der etwas breitere Einsatz angekündigt. Dabei soll das Gegenüber so realistisch dargestellt werden, dass man den Eindruck gewinnen kann, der Person gegenüberzusitzen.

Beide Teilnehmer werden mit 3D-Kameras gefilmt und auch die Darstellung auf dem übergroßen Display erfolgt mit 3D-Technologien, sodass nicht mehr das flache Bild übertragen wird, sondern tatsächlich das besagte 3D-Modell des Gegenübers. Als Display kommt ein Light Field Display zum Einsatz, das genau für solche Zwecke geschaffen wurde. Schaut euch nur einmal das folgende Video an – beeindruckend.




Das Ganze setzt aber nicht nur auf spezielle Software und Hardware, sondern baut auch auf der richtigen Umgebung auf. Man kann den Aufbau fast schon als offene Kabine beschreiben, denn der exakt abgestimmte Abstand und das sehr große Display tragen zur Täuschung des menschlichen Auges bei. Auf einem kleinen Display wäre das mit Sicherheit in der Form niemals möglich. Und so hat man das Gefühl, der Person direkt gegenüberzusitzen, nur getrennt von einer Glasscheibe. Ein wenig Gefängnis-Atmosphäre, aber dennoch eine große Verbesserung.

Googles Ziel war es, die Qualität deutlich zu verbessern, die Realität zu steigern und gleichzeitig die Technologie soweit wie möglich verschwinden zu lassen: Keine Kamera, die auf einen gerichtet ist und auch kein auf den ersten Blick erkennbares Display. Das Ganze ist noch Zukunftsmusik, doch Google-intern kommt das schon seit weit über einem Jahr in mehreren Niederlassungen zum Einsatz und wird seit kurzer Zeit Partnern zur Verfügung gestellt. Ich gehe davon aus, dass die Gespräche im obigen Video realistisch und nicht nachträglich bearbeitet worden sind.

Der Flaschenhals wird aber wohl nicht die Technologie, sondern eher die Datenübertragung sein. Umfangreich texturierte 3D-Modelle zu übertragen ist doch etwas anders als leicht komprimierbare Videostreams. Das Ganze soll dennoch in Echtzeit erfolgen – und das ist auch notwendig. Gerade bei dieser realistischen und fast natürlichen Wahrnehmung ist es wichtig, so wenig Latenz wie möglich zu haben, um die Illusion perfekt zu machen. Spannend!

Nach eineinhalb Jahren Erfahrungen sammeln konnte man offenbar ein sehr gutes Zwischenfazit ziehen, denn die natürlichere Darstellung sorgt dafür, dass die in der Videotelefonie eher vermissten Körpersignale – Mimik und Gestik – wieder stärker zum Ausdruck kommen. Selbst eine gewisse Art von Augenkontakt ist plötzlich möglich, was bei der Videotelefonie normalerweise aufgrund des Blicks in die Kamera ODER das Display nicht möglich ist.




Obige Infografik hat Google veröffentlicht, die zeigt, wie Starline aufgebaut ist und aus wie vielen Kameras, Sensoren, Mikrofonen und Lautsprechern das Produkt besteht.

Errungenschaften von Starline gegenüber klassischer Videotelefonie

  • People displayed more non-verbal behaviors such as ~40% more hand gestures, ~25% more head nods and ~50% more eyebrow movements.
  • People had much better memory recall when using Project Starline, tracking nearly ~30% better when being asked to recall details of their conversation or the content of a meeting.
  • People focused ~15% more on their meeting partner in an eye-tracking experiment, suggesting that visual attentiveness is enhanced when using Project Starline.

Klingt wirklich nach einem spannenden Projekt, das in der Form aber eher Nichts für den Privatgebrauch ist und auf absehbare Zeit auch nicht wird. Technologie hat in den letzten Jahrzehnten rasante Fortschritte gemacht, aber bis so etwas zu vernünftigen Preisen in die Haushalte einzieht, dürfte es noch etwas dauern.

[Google-Blog & Google-Blog #2]


Keine Google-News mehr verpassen:
GoogleWatchBlog bei Google News abonnieren | Jetzt den GoogleWatchBlog-Newsletter abonnieren