Seit Corona sind viele von uns ja an online-Meetings gewohnt, dennoch bleibt das Spiel via Voice- oder Videochat nach wie vor eine anstrengendere Angelegenheit als gemeinsam an einem Tisch sitzend zu spielen. Nur, warum eigentlich?
1) Visuelle Einschränkungen
Im schlechtesten Fall haben wir kein Bild unserer Gegenüber, mit denen wir spielen – damit fehlt ein ziemlich großer Anteil an Information. Sitzt die andere Person entspannt, ist sie hibbelig, schläft sie fast ein? Schaut sie gelangweilt oder engagiert, drückt sie mimisch ihr Engagement und Emotionen aus, spechtet sie gar aus den Augenwinkeln aufs Handy? Was macht sie mit den Händen, blättert sie in ihrem Charakterbogen oder surft sie grade anderswo? Hat sie schon dreimal zu reden angehoben und wurde jedesmal knapp zeitlich unterboten, weswegen sie sich nun frustriert und schweigend zurücklehnt?
Und das alles kann man allein aus der Stimme nicht, nicht sicher oder nicht leicht herauslesen. Körpersprache ist sehr wichtig in der Kommunikation.
Das meiste davon ist auch auf einer kleinen Video-Kachel nur schlecht zu sehen, der eingeschränkte Blickwinkel durch Kamera und Bildschirm schränkt die periphere Wahrnehmung ein, über die wir jenseits unseres unmittelbaren Aufmerksamkeitsfokus Informationen aus der Umgebung erhalten. Außerdem verunmöglicht es das übliche Kamera-Bildschirm-Setup, dem Gegenüber direkt in die Augen zu sehen, was wir bei Live-Kommunikation meiste tun, und nebenbei ist auch “Mikromimik” deutlich schlechter bis gar nicht wahrzunehmen.
2) Akustische Einschränkungen
Unser Gehör ist für eine Rundum-Wahrnehmung gemacht, es ist ein wesentliches Warn- und Kommunikationssystem für unsere umgebende Umwelt. Wesentlich dafür, auf einer Party mit Dutzenden von Stimmen die der eigenen Gesprächspartnerin herausfiltern zu können, ist die akustische Raumwahrnehmung. Schallreize erreichen unsere beiden Ohren jeweils mit einer minimalen Verzögerung bzw. Variation in der wahrgenommenen Lautstärke, je nach dem, von welcher Seite das Geräusch kommt – unser Gehirn kann daraus eine ziemlich gute räumliche Ortung machen. Das macht es in einer realen Gesprächsgruppe wesentlich einfacher, Stimmen Personen zuzuordnen, da wir neben der visuellen Information, wer gerade spricht (sofern wir das sehen können), automatisch auch die räumliche Information (woher kommt die Stimme?) erhalten. Vor dem PC haben wir dagegen nur eine einzige Geräuschquelle – alle Stimmen aller Mitspieler, Musik, Soundeffekte, all das kommt aus den gleichen Kopfhörern und für unser Gehör damit aus der gleichen Richtung. Dadurch ist es wesentlich anstrengender, Stimmen zu unterscheiden und mit unterschiedlichen Lautstärken umzugehen, unser Hirn muss aktiv die Stimme allein nach dem Klang bezüglich ihres Besitzers analysieren, was Ressourcen kostet, anstatt die Zuordnung zu einer Person einfach automatisch über die Raumwahrnehmung machen zu können.
In PC-Spielen kann Raumklang ganz gut simuliert werden, gängige Voicechat-Tools haben diese Funktion meines Wissens nach üblicherweise nicht.
3. “Cognitive Load”
Dass man sich vor dem PC leicht ablenken lassen kann, ist recht evident. Laufen nebenbei Whatsapp, Instagram oder gar Youtube, muss unser Hirn diese Reize ständig aktiv ausblenden und die konditionierte Sucht nach derlei Plattformen unterdrücken. Das kostet Ressourcen. Ebenso wie die oben genannten fehlenden Zusatzinformationen über Mimik, Körpersprache, räumliche Verortung und nuancierte Lautstärken. Richtig hart wird es dann, wenn auch noch relevant große Latenzen zwischen den Teilnehmenden aufkommen, schon im Bereich von nur wenigen hundert Millisekunden Versatz zwischen den DialogpartnerInnen wird der natürliche Gesprächsfluss gestört und unser Gehirn muss sich ständig bremsen, um die eigenen Antworten zu verzögern und sicherzugehen, dass das Gegenüber wirklich fertiggesprochen hat. Das gegenseitige Unterbrechen in natürlichen Dialogen kann online zu einer Qual werden auch aufgrund der genannten fehlenden Lokalisierung der Geräuschquelle, die es uns im Realraum erlaubt, meist wenigstens einen der gleichzeitig Sprechenden rauszufiltern – bei mehreren Stimmen aus dem Kopfhörer ist das bestenfalls noch mit hohem kognitiven Ressourceneinsatz möglich, oft auch gar nicht.
Was hilft (etwas) gegen diese Probleme?
- Spielt mit Video, möglichst großformatig. Schaut auf die Gesichter eurer Mitspielenden, nicht nur auf den VTT.
- Achtet auf eine möglichst minimale Latenz (schon ab ca. 100 ms hat diese einen negativen Einfluss), schaltet parallele Bandbreitenfresser am Gerät bzw. im Haushalt ab.
- Haltet Sprechdisziplin, deutet gegebenenfalls per Handzeichen an, wenn Ihr als nächstes etwas sagen wollt.
- Vermeidet Geräuschchaos; lieber online ohne Musik und viele Soundeffekte spielen, auch wenn’s im VTT besonders verlockend scheint – für Sprache wird es dadurch aber schwieriger, da sie – aufgrund des geteilten einheitlichen Kanals aller Geräusche – nicht so leicht vom Gehirn ausgeblendet werden kann wie am gemeinsamen Tisch.
- Legt in der Darstellung eurer Figur eine Schippe extra Emotion und Ausdruck drauf – online kann man fast nicht overacten, und Eure Stimme allein muss den Mangel an Mimik und Gestik für die Zuhörer kompensieren.
- Als SL: strukturiert das Spielgeschehen dahin stärker, dass jede/r Spielende zu Wort kommt, bevor Ihr die Szene weitererzählt.

Schreibe einen Kommentar