IA y Tecnología

Google DeepMind lanza Gemini Robotics-ER 1.6 con razonamiento espacial y comprensión multivista mejorados

El nuevo modelo de razonamiento encarnado apunta a la robótica autónoma en entornos del mundo real

노승우·2026년 4월 13일 월 06:52·5 min de lectura·

Gemini Robotics-ER 1.6: Powering real-world robotics tasks through enhanced embodied reasoning

Resumen

•Google DeepMind lanzó Gemini Robotics-ER 1.6, mejorando el razonamiento espacial y la comprensión multivista para robots autónomos.
•La actualización habilita un rendimiento autónomo cualitativamente superior en entornos del mundo real no estructurados.
•Con la intensificación de la competencia en IA física, la estandarización del razonamiento encarnado podría determinar el liderazgo del mercado en los próximos años.

Gemini se convierte en los ojos y el cerebro de los robots

Google DeepMind ha presentado Gemini Robotics-ER (Embodied Reasoning) 1.6, un modelo diseñado específicamente para tareas robóticas autónomas. La actualización se centra en dos capacidades clave: el Razonamiento Espacial y la Comprensión Multivista, permitiendo que los robots realicen operaciones más precisas y autónomas en entornos del mundo real no estructurados. Las siglas 'ER' corresponden a Razonamiento Encarnado (Embodied Reasoning), una filosofía de diseño que internaliza cómo un agente con cuerpo físico percibe y actúa en el mundo.

Por qué esta actualización es importante

Uno de los desafíos históricos de la robótica es conectar la visión con la acción. Los humanos razonan instintivamente en 3D al recoger un objeto, infiriendo posición, ángulo y distribución del peso, pero los robots convencionales han tenido limitaciones fundamentales para extraer esta información de una sola cámara.

Gemini Robotics-ER 1.6 aborda este problema combinando capacidades de razonamiento a nivel de modelo de lenguaje grande (LLM) con la percepción robótica. El módulo de comprensión multivista fusiona entradas de múltiples ángulos de cámara en un mapa espacial 3D coherente; el motor de razonamiento espacial planifica la siguiente acción sobre ese mapa. Esto va más allá del simple reconocimiento de imágenes: redefine cómo los robots interactúan con su entorno.

Los dominios de aplicación clave incluyen automatización industrial, almacenes logísticos, asistencia médica y robots de servicio doméstico, todos los cuales exigen la manipulación precisa de objetos y la adaptación dinámica al entorno que esta actualización aborda directamente.

¿Qué cambió respecto a versiones anteriores?

Característica	Generación ER anterior	ER 1.6	Cambio
Razonamiento Espacial	Interpretación 2D limitada	Razonamiento 3D mejorado	Salto cualitativo
Procesamiento Multivista	Enfoque en cámara única	Comprensión multivista integrada	Nueva capacidad
Tareas en el mundo real	Solo entornos estructurados	Entornos del mundo real no estructurados	Mayor generalidad
Nivel de autonomía	Semiautónomo	Razonamiento autónomo mejorado	Mayor autonomía

En el panorama competitivo, OpenAI está ampliando su inversión en Inteligencia Física, Meta avanza en marcos de aprendizaje robótico de código abierto, y el Optimus de Tesla ejemplifica el impulso hacia la IA encarnada propia. La estrategia de Google DeepMind es diferenciada: construir una capa de razonamiento específica para robots sobre la ya poderosa base multimodal de Gemini.

El hilo histórico: cómo llegamos aquí

La IA Encarnada no surgió de la noche a la mañana. Tras el AlphaGo de DeepMind (2016), los investigadores empezaron a aplicar principios similares al mundo físico.

SayCan y PaLM-E de Google (2022) fueron primeras demostraciones de que los modelos de lenguaje podían usarse para planificación de acciones robóticas. En 2023, el auge de los modelos fundacionales dio lugar a RT-2 (Robotics Transformer 2), que demostró la conversión end-to-end de comandos en lenguaje natural a movimientos robóticos.

Con la familia Gemini en 2024, Google DeepMind integró formalmente el razonamiento multimodal en una línea robótica dedicada. Gemini Robotics-ER se centra específicamente en el razonamiento, y la versión 1.6 continúa ese arco evolutivo.

Después de 2025, el mercado de IA robótica está transitando de la automatización simple a Sistemas Autónomos Adaptativos: de brazos industriales de tareas fijas hacia robots de propósito general que se autodirigen en entornos cambiantes. Gemini Robotics-ER 1.6 emerge como una capa de infraestructura clave que impulsa esa transición.

¿Qué viene a continuación? [Análisis experto]

El lanzamiento de Gemini Robotics-ER 1.6 señala un cambio más amplio en la competencia de IA robótica: del rendimiento en benchmarks hacia la capacidad de despliegue en el mundo real.

Primero, es probable que se intensifique la competencia en integración hardware-software. Google actualmente despliega Gemini Robotics a través de asociaciones con fabricantes de hardware robótico. Las líneas competitivas con actores de integración vertical como Tesla, Physical Intelligence y Boston Dynamics se espera que se definan con mayor claridad.

Segundo, es probable que aumente la presión por inferencia en el dispositivo (on-device). Muchos entornos robóticos del mundo real son intolerantes a la latencia de la nube. El anuncio previo de Google DeepMind de una variante Gemini Robotics On-Device parece ser un movimiento deliberado para anticiparse a esta restricción.

Tercero, es probable que se acelere la estandarización del razonamiento multimodal para interfaces físicas. El razonamiento espacial y la comprensión multivista no son exclusivos de la robótica; la conducción autónoma, los drones y la realidad aumentada comparten las mismas necesidades fundamentales. Quien establezca el estándar aquí podría determinar el panorama del mercado de IA física durante los próximos cinco años.

Gemini Robotics-ER 1.6 es más que una actualización de versión. Marca un hito en la expansión de la IA del mundo digital al físico, y la carrera por definir esa frontera apenas ha comenzado.

#deepmind-series #gemini-robotics #구현추론 #로보틱스 #공간추론 #멀티모달 #물리AI

별빛의녹차방금 전

유익한 기사네요. Google에 대해 처음 접하는 정보가 있었습니다. 전문가 의견도 더 듣고 싶습니다.

대전의리더방금 전

깔끔한 기사입니다. DeepMind에 대해 처음 접하는 정보가 있었습니다. 나중에 다시 읽어볼 만합니다.

솔직한별방금 전

핵심만 잘 정리해주시네요.

아침의돌고래방금 전

구현추론에 대한 다른 매체 보도와 비교해봐도 잘 정리되어 있습니다. 전문가 의견도 더 듣고 싶습니다.

현명한에스프레소방금 전

참고가 됩니다. 로보틱스 관련 용어 설명이 친절해서 좋았습니다. 다른 시각의 분석도 읽어보고 싶습니다.

햇살의해방금 전

Google 주제로 시리즈 기사가 나오면 좋겠습니다.

현명한별방금 전

좋은 기사 감사합니다.

부산의관찰자방금 전

lanza 관련 해외 동향도 궁금합니다.

열정적인드럼방금 전

참고가 됩니다. 구현추론 관련 해외 동향도 궁금합니다. 나중에 다시 읽어볼 만합니다.

구름위펭귄방금 전

로보틱스에 대해 주변 사람들과 이야기 나눠볼 만합니다. 계속 지켜봐야겠습니다.

유쾌한워커5분 전

몰랐던 사실을 알게 됐습니다. Google 관련 용어 설명이 친절해서 좋았습니다.

한밤의연구자5분 전

DeepMind에 대해 더 알고 싶어졌습니다. 생각이 바뀌었습니다.

공원의고양이5분 전

lanza에 대해 주변 사람들과 이야기 나눠볼 만합니다.

저녁의기록자5분 전

깔끔한 기사입니다. 구현추론에 대해 처음 접하는 정보가 있었습니다. 좋은 기사 감사합니다.

카페의돌고래5분 전

로보틱스의 향후 전망이 궁금합니다.

오후의기록자5분 전

깔끔한 기사입니다. Google에 대해 주변 사람들과 이야기 나눠볼 만합니다. 생각이 바뀌었습니다.

서울의크리에이터5분 전

DeepMind 주제로 시리즈 기사가 나오면 좋겠습니다.

유쾌한관찰자5분 전

흥미로운 주제입니다. lanza이 앞으로 어떻게 전개될지 주목해야겠습니다. 생각이 바뀌었습니다.

냉철한녹차5분 전

구현추론 관련 용어 설명이 친절해서 좋았습니다.

봄날의사색가5분 전

로보틱스에 대해 더 알고 싶어졌습니다. 전문가 의견도 더 듣고 싶습니다.

도서관의돌고래12분 전

Google에 대한 다른 매체 보도와 비교해봐도 잘 정리되어 있습니다. 좋은 기사 감사합니다.

해운대의기록자12분 전

좋은 정리입니다. DeepMind 관련 용어 설명이 친절해서 좋았습니다.

여름의첼로12분 전

lanza의 향후 전망이 궁금합니다.

해운대의사색가12분 전

구현추론 관련 통계가 의외였습니다. 좋은 기사 감사합니다.

제주의해12분 전

로보틱스에 대해 처음 접하는 정보가 있었습니다. 좋은 기사 감사합니다.

신중한러너12분 전

Google에 대해 처음 접하는 정보가 있었습니다. 좋은 기사 감사합니다.

가을의라떼12분 전

DeepMind의 전문가 코멘트가 설득력 있었습니다.

아침의라떼12분 전

유익한 기사네요. lanza 관련 용어 설명이 친절해서 좋았습니다. 계속 지켜봐야겠습니다.

홍대의관찰자12분 전

구현추론에 대해 처음 접하는 정보가 있었습니다. 나중에 다시 읽어볼 만합니다.

강남의돌고래12분 전

좋은 정보 감사합니다.

저녁의비평가30분 전

Google에 대한 다른 매체 보도와 비교해봐도 잘 정리되어 있습니다.

대전의펭귄30분 전

DeepMind이 일상에 어떤 영향을 줄지 생각해보게 됩니다.

부지런한강아지30분 전

lanza에 대해 더 알고 싶어졌습니다.

현명한시민30분 전

구현추론에 대해 주변 사람들과 이야기 나눠볼 만합니다. 좋은 기사 감사합니다.

새벽의바람30분 전

로보틱스이 일상에 어떤 영향을 줄지 생각해보게 됩니다.

비오는날커피30분 전

Google이 앞으로 어떻게 전개될지 주목해야겠습니다. 전문가 의견도 더 듣고 싶습니다.

현명한해30분 전

좋은 정리입니다. DeepMind 관련 배경 설명이 이해하기 쉬웠습니다. 주변에도 공유해야겠어요.

별빛의라떼30분 전

lanza 관련 데이터가 인상적이었습니다.

신중한돌고래30분 전

흥미로운 주제입니다. 구현추론에 대해 주변 사람들과 이야기 나눠볼 만합니다.

강남의달30분 전

참고가 됩니다. 로보틱스 기사에서 언급된 사례가 흥미로웠습니다.

인천의비평가1시간 전

잘 읽었습니다. Google 관련 해외 동향도 궁금합니다. 주변에도 공유해야겠어요.

강남의강아지1시간 전

흥미로운 주제입니다. DeepMind에 대한 다른 매체 보도와 비교해봐도 잘 정리되어 있습니다.

한밤의해1시간 전

lanza 관련 배경 설명이 이해하기 쉬웠습니다. 계속 지켜봐야겠습니다.

진지한드럼1시간 전

흥미로운 주제입니다. 구현추론 관련 해외 동향도 궁금합니다. 좋은 기사 감사합니다.

따뜻한커피1시간 전

로보틱스에 대해 더 알고 싶어졌습니다. 잘 정리된 기사네요.

다정한달1시간 전

Google에 대해 주변 사람들과 이야기 나눠볼 만합니다. 좋은 기사 감사합니다.

봄날의러너1시간 전

이런 시각도 있었군요. DeepMind에 대해 더 알고 싶어졌습니다.

새벽의사자1시간 전

정리가 깔끔하네요.

홍대의사색가1시간 전

구현추론 기사에서 언급된 사례가 흥미로웠습니다.

부산의에스프레소1시간 전

이런 시각도 있었군요. 로보틱스에 대한 다른 매체 보도와 비교해봐도 잘 정리되어 있습니다.

가을의여행자2시간 전

잘 읽었습니다. Google에 대해 주변 사람들과 이야기 나눠볼 만합니다.

느긋한라떼2시간 전

다양한 주제를 다뤄주셔서 좋습니다.

밝은사색가2시간 전

lanza 기사에서 언급된 사례가 흥미로웠습니다.

솔직한아메리카노2시간 전

잘 읽었습니다. 구현추론 관련 해외 동향도 궁금합니다.

해운대의바이올린2시간 전

출퇴근길에 항상 읽고 있습니다.

비오는날사자2시간 전

Google 관련 통계가 의외였습니다.

유쾌한러너2시간 전

유익한 기사네요. DeepMind 관련 통계가 의외였습니다.

바닷가의다람쥐2시간 전

lanza에 대해 더 알고 싶어졌습니다. 좋은 기사 감사합니다.

카페의시민2시간 전

좋은 정리입니다. 구현추론 관련 데이터가 인상적이었습니다. 전문가 의견도 더 듣고 싶습니다.

성수의여행자2시간 전

로보틱스에 대해 더 알고 싶어졌습니다. 후속 기사 부탁드립니다.

새벽의드리머3시간 전

이런 시각도 있었군요. Google이 앞으로 어떻게 전개될지 주목해야겠습니다. 잘 정리된 기사네요.

공원의다람쥐3시간 전

북마크해두겠습니다. DeepMind이 앞으로 어떻게 전개될지 주목해야겠습니다. 다른 시각의 분석도 읽어보고 싶습니다.

호기심많은커피3시간 전

깔끔한 기사입니다. lanza에 대해 주변 사람들과 이야기 나눠볼 만합니다.

도서관의사자3시간 전

구현추론이 일상에 어떤 영향을 줄지 생각해보게 됩니다.

다정한관찰자3시간 전

몰랐던 사실을 알게 됐습니다. 로보틱스이 일상에 어떤 영향을 줄지 생각해보게 됩니다. 잘 정리된 기사네요.

아침의시민3시간 전

흥미로운 주제입니다. Google 관련 통계가 의외였습니다. 좋은 기사 감사합니다.

용감한바이올린3시간 전

DeepMind의 향후 전망이 궁금합니다. 후속 기사 부탁드립니다.

신중한여우3시간 전

잘 읽었습니다. lanza에 대해 더 알고 싶어졌습니다.

바람의리더3시간 전

몰랐던 사실을 알게 됐습니다. 구현추론 주제로 시리즈 기사가 나오면 좋겠습니다.

카페의비평가3시간 전

로보틱스 관련 배경 설명이 이해하기 쉬웠습니다. 다른 시각의 분석도 읽어보고 싶습니다.

판교의여행자5시간 전

Google의 전문가 코멘트가 설득력 있었습니다.

구름위해5시간 전

기사 퀄리티가 좋습니다.

오후의부엉이5시간 전

lanza 관련 데이터가 인상적이었습니다. 좋은 기사 감사합니다.

산속의여우5시간 전

참고가 됩니다. 구현추론 기사에서 언급된 사례가 흥미로웠습니다.

조용한돌고래5시간 전

로보틱스 관련 해외 동향도 궁금합니다. 전문가 의견도 더 듣고 싶습니다.

별빛의시민5시간 전

잘 읽었습니다. Google 관련 통계가 의외였습니다. 해외 동향도 함께 다뤄주시면 좋겠습니다.

꼼꼼한커피5시간 전

유익한 기사네요. DeepMind에 대해 처음 접하는 정보가 있었습니다.

용감한바람5시간 전

좋은 정리입니다. lanza 관련 배경 설명이 이해하기 쉬웠습니다. 잘 정리된 기사네요.

해운대의부엉이5시간 전

구현추론 관련 데이터가 인상적이었습니다. 계속 지켜봐야겠습니다.

도서관의라떼5시간 전

로보틱스이 일상에 어떤 영향을 줄지 생각해보게 됩니다. 나중에 다시 읽어볼 만합니다.

용감한달8시간 전

Google의 향후 전망이 궁금합니다.

서울의비평가8시간 전

DeepMind에 대해 더 알고 싶어졌습니다. 주변에도 공유해야겠어요.

비오는날구름8시간 전

잘 읽었습니다. lanza에 대해 주변 사람들과 이야기 나눠볼 만합니다. 후속 기사 부탁드립니다.

아침의바이올린8시간 전

읽기 좋은 기사입니다. 구현추론 기사에서 언급된 사례가 흥미로웠습니다.

냉철한별8시간 전

깔끔한 기사입니다. 로보틱스 기사에서 언급된 사례가 흥미로웠습니다. 해외 동향도 함께 다뤄주시면 좋겠습니다.

공원의기록자8시간 전

몰랐던 사실을 알게 됐습니다. Google 관련 배경 설명이 이해하기 쉬웠습니다.

별빛의여행자8시간 전

DeepMind에 대한 다른 매체 보도와 비교해봐도 잘 정리되어 있습니다. 계속 지켜봐야겠습니다.

꼼꼼한강아지8시간 전

깔끔한 기사입니다. lanza이 일상에 어떤 영향을 줄지 생각해보게 됩니다.

호기심많은시민8시간 전

몰랐던 사실을 알게 됐습니다. 구현추론의 전문가 코멘트가 설득력 있었습니다.

바람의다람쥐8시간 전

참고가 됩니다. 로보틱스 주제로 시리즈 기사가 나오면 좋겠습니다.

바닷가의구름

Google 관련 용어 설명이 친절해서 좋았습니다.

아침의연구자

DeepMind 관련 통계가 의외였습니다. 다른 시각의 분석도 읽어보고 싶습니다.

꼼꼼한라떼

lanza이 일상에 어떤 영향을 줄지 생각해보게 됩니다.

대전의에스프레소

읽기 좋은 기사입니다. 구현추론 관련 용어 설명이 친절해서 좋았습니다.

꼼꼼한아메리카노

기사 잘 읽었습니다.

산속의고양이

유익한 기사네요. Google에 대해 주변 사람들과 이야기 나눠볼 만합니다.

산속의구름

유익한 기사네요. DeepMind이 일상에 어떤 영향을 줄지 생각해보게 됩니다. 나중에 다시 읽어볼 만합니다.

서울의달

읽기 좋은 기사입니다. lanza의 전문가 코멘트가 설득력 있었습니다. 다른 시각의 분석도 읽어보고 싶습니다.

똑똑한토끼

읽기 좋은 기사입니다. 구현추론의 전문가 코멘트가 설득력 있었습니다.

도서관의사색가

로보틱스 관련 용어 설명이 친절해서 좋았습니다.

Más de esta serie

젠슨 황 "앤트로픽 투자 못 한 건 내 실수"…구글·아마존 칩 위협론은 일축

16/4/2026

Google DeepMind presenta Gemini 3.1 Flash TTS: una nueva era de voz expresiva con IA

15/4/2026

Google DeepMind presenta Gemma 4: declara tener los modelos abiertos más capaces 'byte a byte'

2/4/2026

Google DeepMind lanza el modelo de voz IA 'Gemini 3.1 Flash Live'

26/3/2026

Google DeepMind aborda los riesgos de manipulación dañina de la IA con nuevas medidas de seguridad en finanzas y salud

25/3/2026

Más en IA y Tecnología

OpenAI, 생명과학 전용 추론 AI 'GPT-Rosalind' 출시… 신약 개발 패러다임 흔든다

Últimas noticias

Global

IMF, 7년 만에 베네수엘라와 관계 재개…49억 달러 동결 해제 기대

IMF가 2019년 이후 중단됐던 베네수엘라와의 공식 관계를 7년 만에 재개했다.

3시간 전

Economía

IMF, 7년 만에 베네수엘라와 관계 재개…49억 달러 동결 해제 가능성

IMF가 7년 만에 베네수엘라와 공식 협력을 재개하기로 결정했다.

4시간 전

Economía

경상흑자 역대 최대인데 원화는 왜 약해지나

한국은행, 경상흑자에도 원화 약세 이어지는 구조적 원인 공식 분석.

4시간 전

Economía

금융당국, 미래에셋에 SpaceX IPO 조기 마케팅 경고

금융당국이 미래에셋증권의 SpaceX IPO 조기 마케팅에 구두 경고를 내렸다.

4시간 전

Global

베네치아, 수백 년 안에 사라진다...유럽 연구팀의 4가지 생존 방안

유럽 연구팀, 베네치아 생존 위한 4가지 시나리오를 Scientific Reports에 발표했다.

4시간 전

Deportes y Esports

96년 전통 깬다…월드컵 결승전, 사상 첫 하프타임 쇼

FIFA가 96년 만에 처음으로 월드컵 결승전 하프타임 쇼를 도입한다.

5시간 전

Global

레바논 사망자 2,196명…이스라엘 공습에 의료 시스템 붕괴 위기

이스라엘 공습으로 레바논 누적 사망자 2,196명, 부상자 7,185명 기록

5시간 전

Economía

이란 전쟁 속 걸프 3국, 사모채권으로 100억 달러 조달

걸프 3국이 이란 전쟁 이후 처음으로 사모채권 발행에 나서 약 100억 달러를 조달했다.

5시간 전

ArayoNews

Google DeepMind lanza Gemini Robotics-ER 1.6 con razonamiento espacial y comprensión multivista mejorados

Gemini se convierte en los ojos y el cerebro de los robots

Por qué esta actualización es importante

¿Qué cambió respecto a versiones anteriores?

El hilo histórico: cómo llegamos aquí

¿Qué viene a continuación? [Análisis experto]

댓글 (100)

Más de esta serie

Más en IA y Tecnología

OpenAI, 생명과학 전용 추론 AI 'GPT-Rosalind' 출시… 신약 개발 패러다임 흔든다

EU, Anthropic의 Claude Mythos AI 사이버 위협 놓고 직접 협의 개시

퍼플렉시티, Mac 전용 AI 에이전트 'Personal Computer' 정식 출시

글로벌 금융당국, Anthropic 'Mythos' AI 사이버 위협에 일제히 긴급 대응

앤스로픽, 런던에 800명 규모 사무소 확보…미 국방부 갈등 속 유럽 거점 구축

릴리 파운다요, 사망 위험 57% 감소…경구용 GLP-1 시대 열리나

Últimas noticias

IMF, 7년 만에 베네수엘라와 관계 재개…49억 달러 동결 해제 기대

IMF, 7년 만에 베네수엘라와 관계 재개…49억 달러 동결 해제 가능성

경상흑자 역대 최대인데 원화는 왜 약해지나

금융당국, 미래에셋에 SpaceX IPO 조기 마케팅 경고

베네치아, 수백 년 안에 사라진다...유럽 연구팀의 4가지 생존 방안

96년 전통 깬다…월드컵 결승전, 사상 첫 하프타임 쇼

레바논 사망자 2,196명…이스라엘 공습에 의료 시스템 붕괴 위기

이란 전쟁 속 걸프 3국, 사모채권으로 100억 달러 조달