Marzo de 2026, un piso de Madrid. Carlos, ingeniero de treinta y ocho años, abre Zoom para su primer 1-on-1 con su nueva jefa japonesa en Tokio después de tres meses de correos y mensajes de LINE. Carlos ha preparado tres puntos de agenda, se ha puesto una camisa presentable, ha ordenado la mesa detrás y ha probado el micrófono.
Cuando la cámara arranca y ve el rostro de Fujita-san en el centro del portátil, se concentra profesionalmente en su cara y responde con esmero durante media hora sin apartar los ojos del monitor. Al colgar cree que la reunión ha ido bien.
Diez minutos después le llega un mensaje discreto de una colega japonesa: "Carlos-san, en la reunión parecías cansado; Fujita-san te ha preguntado por LINE si tenías algún problema personal, dice que llevas toda la videollamada mirando hacia abajo".
Carlos releva la escena varias veces en su cabeza antes de entender qué había pasado. No había apartado los ojos ni un segundo: había estado mirando la pantalla, no la cámara. Y en el ángulo del portátil, la cámara integrada estaba encima de la pantalla, con lo que su mirada perfectamente atenta a la cara de la jefa se leyó al otro lado como una mirada hacia abajo, tímida y triste.
Lo que en una comunicación cara a cara habría sido concentración, en la videollamada asíncrona por hardware se convierte en un tic corporal que emite, sin querer, un mensaje distinto del que se pretende.
Este artículo trata exactamente de ese desajuste. Desde la pandemia, una parte cada vez mayor del trabajo, del reclutamiento, del negocio y también de la vida familiar hispano-japonesa transcurre en videollamada.
La regla clásica de contacto visual —analizada en el artículo dedicado al contacto visual japonés cara a cara— no basta y, en algunos puntos, se invierte.
Vamos a fijar el nuevo protocolo con detalle práctico: por qué el problema es estructural, cómo colocar la cámara, cómo diseñar el layout de la pantalla, cuándo mirar a la lente y cuándo al interlocutor, y qué hacer en las cuatro escenas cotidianas más frecuentes: entrevista de trabajo online, reunión de negocios, 1-on-1 con jefe japonés y videollamada con la familia de la pareja japonesa.
Cerraremos con el ajuste de entorno —luz, fondo, sonido, ropa— y con un pequeño repertorio de frases de recuperación por si algo sale mal en directo.

El problema estructural: por qué las miradas no coinciden
La cámara no está donde crees
La lógica del contacto visual presencial se apoya en un supuesto físico simple: los ojos del interlocutor y los tuyos están a la misma altura y en el mismo eje. En videollamada, ese supuesto se rompe. La cámara del portátil está encima del monitor, la del móvil está pegada al borde superior de la pantalla, y la del monitor externo con webcam encima queda a bastante más altura que el rectángulo donde ves el rostro del interlocutor.
- Cuando miras la cara del interlocutor en la pantalla, tu mirada va hacia el centro-abajo, no a la cámara.
- La cámara graba ese ángulo como una mirada evasiva o cabizbaja.
- El interlocutor japonés recibe ese ángulo como falta de sinceridad, de energía o de compromiso.
- El fenómeno es simétrico: él te ve cabizbajo por lo mismo, tú lo ves cabizbajo por lo mismo.
Es un problema estructural del canal, no de la persona. Ninguna cantidad de esfuerzo compensa un mal montaje.
Los tres ángulos que envían mensajes distintos
Un mismo hablante puede transmitir tres mensajes muy diferentes solo con la altura de la cámara respecto a los ojos:
| Altura de la cámara | Cómo te ve el interlocutor | Cómo lo interpreta un japonés |
|---|---|---|
| Por debajo de los ojos | Desde abajo, con papada | Arrogante, altivo, chulo |
| A la altura de los ojos | En un plano neutro | Profesional, cordial |
| Por encima de los ojos | Con la cara ligeramente inclinada | Tímido, cabizbajo, evasivo |
En la mayoría de portátiles la configuración de fábrica cae automáticamente en el tercer supuesto —la cámara por encima de los ojos— y produce, día tras día, el efecto Carlos.
Por qué en Japón el efecto es más costoso
Todas las culturas de videollamada sufren este desajuste, pero en el marco japonés el precio simbólico es más alto que en la mayoría de países hispanos, por tres razones convergentes.
- La presentación del rostro ocupa en la etiqueta japonesa un lugar central; una cara cabizbaja recuerda al saludo de disculpa y sugiere que hay algo mal.
- La cultura de la lectura de indicios —el kuuki wo yomu del que hablamos en el artículo sobre leer el aire— convierte el ángulo de la mirada en dato interpretable.
- El honne / tatemae que analizamos en el artículo dedicado hace que el interlocutor no te lo diga, sino que se lo guarde y saque conclusiones silenciosamente.
Ese silencio evaluador es exactamente lo peor: no recibes feedback y no puedes corregir sin ayuda. Este artículo es esa ayuda.
Solución técnica 1: la altura de la cámara
El objetivo: cámara a la altura de los ojos
La regla es simple. El objetivo de la cámara debe quedar a la altura de los ojos, o como máximo dos centímetros por debajo. Cualquier configuración por debajo de esa línea genera "efecto Carlos"; cualquier configuración muy por encima genera "efecto papada". Existen tres soluciones prácticas ordenadas por coste.
- Solución gratuita: apilar libros bajo el portátil hasta que la cámara suba al nivel de los ojos. Cinco libros de bolsillo suelen bastar.
- Solución barata: un soporte plegable de portátil, de entre 15 y 25 euros en cualquier tienda de material de oficina; se lleva plegado en el bolso al ir a otra sala.
- Solución óptima: una webcam externa (Logitech C270, C920 o equivalente) montada sobre un monitor externo o sobre un trípode ajustable. Coste: de 30 a 100 euros.
Un colega mío en Barcelona sostiene desde 2021 que "la mejor inversión de teletrabajo con Japón por menos de cincuenta euros es la webcam externa". La experiencia mayoritaria confirma la afirmación.
La postura del cuerpo
La altura de la cámara no arregla nada si el cuerpo se apoya mal.
- Espalda apoyada suavemente en el respaldo, no encorvada sobre la mesa.
- Cabeza sobre el eje del cuello, no proyectada hacia adelante.
- Hombros bajos y sueltos, no elevados por tensión.
- Distancia al monitor: aproximadamente la longitud del antebrazo con el puño cerrado.
Una postura correcta durante una hora es más creíble en video que una postura teatral durante cinco minutos que se desmorona después. La sostenibilidad importa.
El error de la webcam mal colocada
Un pequeño detalle que la gente no suele revisar: si tienes webcam externa montada sobre el monitor pero el monitor es alto, la cámara acaba por encima de los ojos y reproduce el "efecto Carlos" digitalmente. La comprobación se hace en tres segundos: abre Zoom en modo "preview", localiza tus propios ojos y observa si la cámara los mira desde arriba, desde abajo o desde su altura. Ajusta el monitor o la cámara hasta que la línea sea horizontal.

Solución técnica 2: el diseño de pantalla
Zoom, Teams y Meet: layout que ayuda
Los tres clientes principales de videollamada tienen ajustes de layout que reducen —no eliminan— el desajuste cámara-mirada. La idea general: acercar el rectángulo donde ves al interlocutor lo más posible a la cámara.
- Zoom: desactiva el modo pantalla completa; reduce la ventana al tamaño necesario y arrástrala hasta que quede justo debajo de la cámara. El rectángulo del rostro del interlocutor queda a pocos centímetros de la lente.
- Google Meet: usa el modo "presentador destacado" para que la persona a la que se dirige tu atención principal ocupe la esquina cercana a la cámara.
- Microsoft Teams: prefiere el layout "gallery" reducido al mínimo y colócalo en la parte alta de la pantalla, justo debajo de la webcam.
Un ajuste bien hecho puede reducir el desplazamiento angular de la mirada de veinte grados a cinco. La diferencia perceptiva es enorme.
La ventana pequeña como amiga
Contra la intuición occidental —"pantalla grande = mejor"—, en videollamada con japoneses una ventana más pequeña y bien colocada bajo la cámara funciona mejor que una ventana grande y central. Al reducir el rectángulo, el eje de tu mirada se aproxima al de la cámara.
Marcadores discretos junto a la lente
Un truco que usan periodistas de televisión y consultores es pegar cerca del objetivo un pequeño referente visual —un post-it verde, una pegatina de emoji, la foto en pequeño de un ser querido— para tener un objeto natural al que mirar cuando se quiere transmitir contacto visual. Aplicado a videollamadas con japoneses, funciona igual de bien:
- Un post-it con la palabra clave "kamera" pegado a un centímetro del objetivo.
- Una pequeña flecha impresa que apunta al objetivo desde arriba.
- La foto en miniatura de la propia jefa o de un familiar cercano al objetivo.
El truco parece infantil pero convierte un esfuerzo consciente en un hábito casi automático a las dos semanas de uso.
Cuándo mirar a la cámara y cuándo a la pantalla
El reparto 80/20
Aunque la teoría ideal sería "mira siempre a la cámara", la práctica de una videollamada larga desmiente el consejo: mirar continuamente a la lente sin ver las expresiones del interlocutor produce respuestas descoordinadas, se pierde información y el efecto acaba siendo peor.
La regla operativa que funciona con audiencias japonesas es una versión del principio 80/20:
- 80 % del tiempo mirando la pantalla para leer las reacciones del interlocutor.
- 20 % del tiempo mirando a la cámara en los momentos clave de tu mensaje.
- El 20 % se concentra en pocos instantes muy calibrados, no se distribuye al azar.
Este reparto reproduce en videollamada lo que en el mundo hispano se llamaría "un buen contacto visual moderado", ajustado al hardware del canal.
Cuándo mirar a la cámara
Los momentos donde vale la pena hacer el esfuerzo consciente de mirar la lente son cinco.
- Saludo inicial: los tres primeros segundos, mientras dices "o-sewa ni natte orimasu" o el equivalente que corresponda.
- Presentación personal: al decir tu nombre y tu cargo por primera vez a un nuevo interlocutor.
- Punto clave del argumento: cuando pronuncias la frase que quieres que el otro recuerde de la reunión.
- Pregunta que exige respuesta: al formular una pregunta explícita esperas una respuesta atenta.
- Cierre: los últimos cinco segundos, con "yoroshiku onegai itashimasu" mirando a la lente.
Ese repertorio de cinco momentos, bien ejecutado, transmite atención plena sin robotizarte durante los otros 55 minutos de la reunión.
Cuándo mirar la pantalla
En los otros 80 % del tiempo, tus ojos van a la pantalla porque necesitas información del rostro del interlocutor:
- Mientras el otro habla, para leer sus microexpresiones.
- Al hacer pausas propias de respiración entre bloques argumentales.
- Al leer notas breves apuntadas junto a la ventana de video.
- Al esperar respuesta después de una pregunta, para captar el matiz de la reacción.
El silencio japonés que analizamos en el artículo dedicado a las pausas es un punto especialmente rentable para mirar la pantalla: es información que solo se lee bien en el rostro.

Escenario 1: entrevista de trabajo online
Preparativos técnicos
Una entrevista de trabajo online con una empresa japonesa combina dos exigencias que raramente se cruzan en una entrevista presencial hispana: la exigencia técnica del canal y la exigencia formal de la etiqueta. La lista de preparativos es larga pero se ejecuta en veinte minutos:
- Cámara a la altura de los ojos, ventana bajo la lente.
- Iluminación frontal y suave, sin contraluz por ventana detrás.
- Fondo neutro, preferiblemente pared blanca o gris.
- Webcam probada media hora antes con un amigo, no con la propia aplicación.
- Móvil en modo avión y a distancia del portátil.
- Vaso de agua fuera del encuadre pero al alcance.
- Documentación en pantalla —currículum, cartas— en la mitad de la pantalla no ocupada por la videollamada.
Durante la entrevista
En la conversación misma, la etiqueta suma dos ajustes a los cinco momentos generales de mirada a cámara.
- La reverencia inicial se ejecuta sentado, con el eshaku de 15° que describimos en el artículo de errores comunes de ojigi.
- Al ser preguntado por experiencia laboral, mira a la cámara durante los primeros diez segundos de la respuesta; después, alterna con la pantalla.
- No juegues con el ratón visible en el encuadre; los reclutadores japoneses lo penalizan.
- Termina la última respuesta con "go-kentō no hodo, yoroshiku onegai itashimasu" mirando a la cámara.
Errores que no debes cometer
Los tres errores clásicos, en orden de frecuencia:
- Mirar la imagen de uno mismo en el rincón: transmite inseguridad y falta de atención al interlocutor.
- Reaccionar con exceso con gestos exagerados de acuerdo: en Japón se lee como servilismo.
- Alargar respuestas cuando el reclutador guarda silencio en pantalla: mejor dejar la pausa y esperar a que el otro reaccione.

Escenarios 2 y 3: reunión de negocios y 1-on-1 con jefe
Reunión de negocios con varios japoneses
Una reunión con varios interlocutores japoneses simultáneos exige gestión de mirada más elaborada.
- El saludo inicial mira a la cámara para cubrir a todos por igual.
- Al hablar, mira a la cámara en los momentos clave; entre medias, mira a la pantalla y desplaza suavemente la vista por los rostros del "gallery view".
- Al agradecer, mira a la cámara.
- Al ser presentado por primera vez, haz un pequeño eshaku sentado con las manos ligeramente juntas sobre la mesa.
El error más frecuente en este escenario es fijarse en el interlocutor de más rango e ignorar al resto: la etiqueta japonesa espera un reparto atento entre todos los presentes, con matices de deferencia hacia los rangos superiores pero sin exclusión de los demás.
1-on-1 con jefe japonés
En la conversación tú-a-tú con un superior japonés el ritmo se relaja y el peso relativo de la mirada a cámara sube. Los ajustes específicos:
- La reunión suele empezar con small talk sobre el clima; ese es un buen momento para calibrar el ángulo de mirada mientras la temperatura de la conversación es baja.
- Al hablar de temas sensibles —evaluación, plan de carrera, problemas del equipo—, aumenta a un reparto 70/30 (más cámara) para transmitir sinceridad.
- Cuando el jefe hace un silencio prolongado, resístete a rellenarlo: es el patrón analizado en el artículo sobre el silencio incómodo.
- Al cierre, agradece la orientación recibida —"go-shidō itadaki, arigatō gozaimashita"— con mirada a cámara.
Cuando el jefe activa la cámara pero no habla
Un patrón muy japonés en 1-on-1 online: el jefe activa la cámara, escucha atentamente y habla lo mínimo. Muchos hispanos leen esa contención como desinterés o disgusto y sobre-explican. En realidad, es exactamente el equivalente virtual del silencio de reflexión japonés analizado en el artículo dedicado a la cultura del trabajo compartido.
Lo mejor es respetar el silencio, cerrar cada bloque con un "ijō desu" —"eso es todo por mi parte"— y esperar respuesta.

Escenario 4: videollamada con la familia japonesa
El nuevo escenario doméstico
Miles de familias hispano-japonesas, de las que hablamos con detalle en el artículo dedicado, viven separadas por continentes y sostienen su vínculo con abuelos, tíos y primos japoneses por videollamada semanal. La etiqueta es menos formal que en el trabajo, pero conserva especificidades que conviene aprender.
- La cámara sigue teniendo que estar a la altura de los ojos.
- La primera videollamada con los suegros exige el mismo esmero de setup que una entrevista de trabajo.
- Las llamadas semanales rutinarias admiten un tono más relajado, pero conservan la reverencia inicial y final.
- Los niños hispano-japoneses aprenden por imitación: el modelo que ven en casa es el que replicarán con sus abuelos.
Cinco reglas prácticas para la videollamada familiar
Un pequeño decálogo probado en casas con parientes en Tokio, Osaka y Sapporo.
- Fija una hora estable a la semana; la puntualidad japonesa se extiende a la esfera doméstica.
- Empieza siempre con el saludo formal apropiado y con una mirada a cámara.
- Presenta a los niños directamente a la cámara, no al portátil; la abuela los ve mejor así.
- Sostén los objetos —regalos, dibujos escolares, boletines de notas— pegados a la cámara, no lejos de ella.
- Cierra con un "o-yasumi nasai" mirando a cámara si es de noche, o "mata ne" si es de día.
El caso especial: hijos hispano-japoneses adolescentes
Un caso frecuente y delicado: los adolescentes hispano-japoneses de doce a dieciséis años suelen sentirse incómodos en la videollamada semanal con los abuelos, especialmente si su nivel de japonés es intermedio-bajo. Presiones excesivas los alejan; ausencias completas los alejan también. La solución probada por muchas familias:
- Bloques de cinco minutos "protegidos" en los que el adolescente saluda, muestra algo concreto —una nota, un dibujo, un premio deportivo— y se retira sin drama.
- Uso del móvil vertical para el bloque adolescente, más natural para su generación que el portátil.
- Preparación previa de una frase japonesa útil por semana; el abuelo la aprecia y el adolescente sale reforzado.
El entorno: luz, fondo, sonido, vestimenta
Iluminación
La iluminación es la variable con mejor relación calidad-precio en videollamada.
- Fuente frontal —una ventana o una lámpara— apuntando a la cara, no a la espalda.
- Temperatura de color cálida (2700-3000 K) para reuniones formales; luz demasiado blanca marca ojeras.
- Reflector improvisado: una hoja A4 blanca apoyada en las rodillas mejora la piel.
- Si la ventana está detrás, corre la cortina; el contraluz es letal en Zoom.
Fondo
Los fondos virtuales dividen: son útiles para tapar caos y arriesgados si el hardware no los renderiza bien. En Japón, la tendencia mayoritaria es preferir fondo real ordenado a virtual mal montado.
- Pared blanca o gris con un objeto pequeño y ordenado —una planta, un libro— es la opción más segura.
- Si necesitas fondo virtual, elige uno estático y sobrio, no una playa exótica.
- Nunca uses fondo virtual con movimiento; distrae más que oculta.
Sonido y vestimenta
Los dos aspectos que Zoom no compensa por sí solo.
- Auriculares con micrófono, no altavoz del portátil.
- Prueba de audio con un amigo, no con la propia app.
- Camisa o polo lisos, colores neutros; los estampados finos producen efecto moiré en cámara.
- Corbata y americana solo si el escenario lo pide; en Japón, el sobre-vestir a veces se lee como sobreactuación.

Contraste hispano y frases de recuperación
Diferencias culturales en videollamada
Un pequeño mapa comparativo del modo en que hispanos y japoneses viven una videollamada estándar.
| Dimensión | Uso hispano frecuente | Uso japonés esperado |
|---|---|---|
| Duración de silencios | Se rellenan enseguida | Se dejan y se leen |
| Solapamiento de voces | Frecuente y tolerado | Casi ausente |
| Fondo detrás | Casual, con familia visible | Ordenado y neutro |
| Cámara encendida | Opcional según situación | Casi siempre esperada |
| Saludo inicial | Cordial, informal | Formulario, con reverencia |
Frases de recuperación cuando algo falla
El repertorio breve, ordenado por gravedad del incidente.
- "gamen ga midarete mōshiwake arimasen" — "disculpe que se me haya movido la imagen".
- "koe ga tōi yō desu ga, ki-koemasu deshō ka" — "parece que la voz suena lejos, ¿me oye?".
- "kaisen ga fuantei de, mōshiwake gozaimasen" — "la conexión está inestable, lo lamento".
- "ichido setsudan shite sai-nyū-shitsu itashimasu" — "desconecto y vuelvo a entrar un momento".
- "osoku natte mōshiwake gozaimasen" — "disculpe el retraso al conectarme".
Ninguna de esas frases resuelve por sí sola el problema técnico, pero todas te compran los treinta segundos que necesitas para que la incidencia no se convierta en crisis.
Conclusión: el ojo digital que aprende a mirar
Volviendo a Carlos y su jefa Fujita-san, la historia tuvo un desenlace productivo. Tres semanas después de aquel 1-on-1 fallido, Carlos había comprado una webcam externa por sesenta euros, había reajustado el layout de Zoom para que Fujita-san quedara justo debajo de la cámara y había pegado un post-it verde a un centímetro del objetivo.
En la siguiente reunión, mirar a la cámara en los cinco momentos clave se había vuelto reflejo. Fujita-san no comentó nada, como corresponde al tatemae, pero dos meses más tarde le confirmó a Carlos como jefe de proyecto en un mandato de un año, lo que —también según tatemae— era la confirmación silenciosa de que la señal había cambiado.
La lección para el lector hispano es doble. La primera es técnica y barata: elevar la cámara y reducir la ventana del interlocutor resuelve el 80 % del problema en veinte minutos y por menos de cincuenta euros.
La segunda es cultural y gradual: aprender a repartir la mirada 80/20 entre pantalla y cámara, a respetar los silencios que analizamos en el artículo previo y a saludar con la ojigi correcta descrita en el artículo sobre errores de ojigi exige práctica, pero se automatiza en pocas semanas.
En el próximo artículo de la serie Comunicación No Verbal bajamos del ojo al cuerpo: la etiqueta japonesa del espacio personal, con foco práctico en el tren de cercanías, ese laboratorio urbano donde miles de hispano-japoneses libran su primera prueba diaria con la densidad tokiota. Y después vendrá el capítulo de las expresiones faciales, cierre de la serie.
Cinco piezas del cuerpo —silencio, reverencia, mirada, distancia, gesto— para que la conversación con el vecino japonés fluya con menos ruido de fondo hispano.
Para seguir leyendo
- Contacto visual en Japón: por qué mirar directamente resulta incómodo — la referencia sobre el marco cara a cara.
- El silencio incómodo: guía práctica para hispanohablantes — las pausas y su gestión.
- Errores comunes de ojigi — la reverencia bien hecha, incluida la digital.
- La cultura del trabajo compartido: otsukaresama — el marco laboral donde ocurre la videollamada.
- Familia internacional hispano-japonesa — el escenario doméstico de la videollamada semanal.