IBM lanza Granite 4.0 3B Vision: IA multimodal compacta para documentos empresariales
Diseño de adaptador LoRA y dataset ChartNet de 1,7 millones de muestras elevan la precisión en extracción de tablas, gráficos y pares clave-valor

- •IBM lanzó Granite 4.0 3B Vision, un VLM ligero especializado en el procesamiento de documentos empresariales.
- •El modelo usa ChartNet (1,7 millones de muestras de gráficos) y la arquitectura DeepStack para mejorar la extracción de tablas, gráficos y KVP.
- •El diseño de adaptador LoRA permite que un único despliegue gestione cargas de trabajo multimodales y de solo texto.
IBM presenta Granite 4.0 3B Vision, un VLM compacto especializado en comprensión de documentos empresariales
IBM ha lanzado Granite 4.0 3B Vision, un modelo de visión y lenguaje (VLM, por sus siglas en inglés) ligero diseñado específicamente para el procesamiento de documentos empresariales. Anunciado a través del blog de Hugging Face, el modelo se centra en tres capacidades clave: extracción de estructuras de tablas, interpretación de gráficos y extracción semántica de pares clave-valor (KVP). Se distribuye como un adaptador LoRA sobre Granite 4.0 Micro, el modelo de lenguaje denso de IBM.
Por qué esto es relevante
Automatizar la extracción de información de documentos empresariales —facturas, contratos, informes y formularios financieros— ha sido durante mucho tiempo un desafío persistente. Las soluciones convencionales de reconocimiento óptico de caracteres (OCR) tienen dificultades con diseños complejos o datos codificados visualmente, como gráficos y diagramas.
Granite 4.0 3B Vision apunta directamente a este vacío. Al mantener el número de parámetros en torno a los 3B mientras optimiza la comprensión de estructuras documentales, el modelo busca reducir los costes de inferencia y la complejidad de despliegue en comparación con modelos generalistas de gran escala, lo que lo hace más viable para integrarse en flujos de trabajo internos empresariales.
El soporte oficial para Docling, la biblioteca de procesamiento de documentos de código abierto, añade una ventaja práctica para los equipos que construyen pipelines empresariales. El modelo puede operar de forma independiente o como parte de un pipeline más amplio.
Qué cambia respecto a los enfoques existentes
Tres innovaciones distinguen a Granite 4.0 3B Vision de los VLM convencionales.
① ChartNet: un dataset especializado en comprensión de gráficos
Los gráficos son notoriamente difíciles para los VLM, ya que comprenderlos exige razonar simultáneamente sobre patrones visuales, datos numéricos y lenguaje natural. El equipo de IBM abordó esto desarrollando ChartNet, un dataset de escala millonaria construido mediante un pipeline de síntesis guiado por código.
ChartNet comprende 1,7 millones de muestras de gráficos diversas que abarcan 24 tipos de gráficos y 6 bibliotecas de trazado. Cada muestra incluye cinco componentes alineados: código de trazado, imagen renderizada, tabla de datos, resumen en lenguaje natural y pares de preguntas y respuestas. Esta investigación se presentará en CVPR 2026.
② Arquitectura DeepStack: inyección de características visuales por capas
| Característica | Enfoque VLM estándar | Granite 4.0 3B Vision (DeepStack) |
|---|---|---|
| Punto de inyección visual | Capa única | Distribuido en múltiples capas |
| Semántica de alto nivel | Mezclada con detalle espacial | Inyectada en capas anteriores |
| Detalle espacial/diseño | Riesgo de pérdida | Inyectado en capas posteriores |
| Comprensión del diseño | Limitada | Preservada mediante enrutamiento separado |
La inyección DeepStack dirige las características visuales abstractas a las capas anteriores para la comprensión semántica y las características espaciales de alta resolución a las capas posteriores para preservar el detalle. El resultado es un modelo que comprende tanto qué hay en un documento como dónde está.
③ Diseño modular: despliegue práctico mediante adaptador LoRA
En lugar de ser un modelo independiente, Granite 4.0 3B Vision se distribuye como adaptador LoRA sobre Granite 4.0 Micro. Esto significa que un único despliegue puede atender cargas de trabajo tanto multimodales como de solo texto.
[Análisis experto] El auge de los modelos especializados ligeros está redefiniendo la estrategia de IA empresarial
Este lanzamiento refleja una tendencia más amplia: junto a la carrera por modelos de propósito general cada vez más grandes, los modelos ligeros especializados en dominios específicos están consolidando su propio espacio en los mercados de IA empresarial.
Para las empresas, modelos como GPT-4o o Gemini 1.5 Pro conllevan altos costes de inferencia por documento y son difíciles de desplegar en local por requisitos de seguridad y cumplimiento normativo. Un modelo especializado de escala 3B que pueda ejecutarse en servidores internos o entornos perimetrales —con un rendimiento adecuado al propósito— tiene una alta probabilidad de convertirse en una opción cada vez más atractiva.
La prevista publicación del dataset ChartNet en CVPR 2026 también es destacable. Una vez disponible, podría acelerar los esfuerzos de ajuste fino en toda la industria y elevar el listón para la comprensión de gráficos en modelos competidores. No obstante, la validación en entornos reales sigue siendo clave.
댓글 (99)
IBM이 일상에 어떤 영향을 줄지 생각해보게 됩니다.
다양한 주제를 다뤄주셔서 좋습니다.
Granite 관련 용어 설명이 친절해서 좋았습니다.
ibm-series에 대해 처음 접하는 정보가 있었습니다. 다른 시각의 분석도 읽어보고 싶습니다.
granite-4.0 관련 데이터가 인상적이었습니다. 계속 지켜봐야겠습니다.
IBM에 대해 주변 사람들과 이야기 나눠볼 만합니다. 해외 동향도 함께 다뤄주시면 좋겠습니다.
깔끔한 기사입니다. lanza 관련 통계가 의외였습니다. 후속 기사 부탁드립니다.
깔끔한 기사입니다. Granite 관련 데이터가 인상적이었습니다.
몰랐던 사실을 알게 됐습니다. ibm-series에 대해 주변 사람들과 이야기 나눠볼 만합니다. 계속 지켜봐야겠습니다.
이런 시각도 있었군요. granite-4.0이 앞으로 어떻게 전개될지 주목해야겠습니다. 나중에 다시 읽어볼 만합니다.
IBM이 일상에 어떤 영향을 줄지 생각해보게 됩니다. 해외 동향도 함께 다뤄주시면 좋겠습니다.
잘 읽었습니다. lanza 관련 데이터가 인상적이었습니다. 다른 시각의 분석도 읽어보고 싶습니다.
잘 읽었습니다. Granite의 향후 전망이 궁금합니다. 다른 시각의 분석도 읽어보고 싶습니다.
ibm-series 관련 용어 설명이 친절해서 좋았습니다. 전문가 의견도 더 듣고 싶습니다.
유익한 기사네요. granite-4.0에 대해 주변 사람들과 이야기 나눠볼 만합니다.
IBM에 대해 주변 사람들과 이야기 나눠볼 만합니다.
lanza에 대해 처음 접하는 정보가 있었습니다. 후속 기사 부탁드립니다.
좋은 정리입니다. Granite의 향후 전망이 궁금합니다. 생각이 바뀌었습니다.
ibm-series에 대한 다른 매체 보도와 비교해봐도 잘 정리되어 있습니다. 계속 지켜봐야겠습니다.
granite-4.0 관련 용어 설명이 친절해서 좋았습니다. 계속 지켜봐야겠습니다.
좋은 기사 감사합니다.
구독 중인데 만족합니다.
Granite의 전문가 코멘트가 설득력 있었습니다. 좋은 기사 감사합니다.
이런 시각도 있었군요. ibm-series 관련 용어 설명이 친절해서 좋았습니다.
흥미로운 주제입니다. granite-4.0에 대해 더 알고 싶어졌습니다.
IBM에 대해 더 알고 싶어졌습니다.
lanza에 대해 주변 사람들과 이야기 나눠볼 만합니다. 좋은 기사 감사합니다.
몰랐던 사실을 알게 됐습니다. Granite의 전문가 코멘트가 설득력 있었습니다. 해외 동향도 함께 다뤄주시면 좋겠습니다.
ibm-series 관련 배경 설명이 이해하기 쉬웠습니다. 다른 시각의 분석도 읽어보고 싶습니다.
몰랐던 사실을 알게 됐습니다. granite-4.0에 대해 주변 사람들과 이야기 나눠볼 만합니다.
IBM에 대해 더 알고 싶어졌습니다. 잘 정리된 기사네요.
lanza의 향후 전망이 궁금합니다.
Granite의 전문가 코멘트가 설득력 있었습니다. 해외 동향도 함께 다뤄주시면 좋겠습니다.
언론이 이래야죠.
깔끔한 기사입니다. granite-4.0이 일상에 어떤 영향을 줄지 생각해보게 됩니다. 생각이 바뀌었습니다.
이런 시각도 있었군요. IBM 관련 해외 동향도 궁금합니다. 해외 동향도 함께 다뤄주시면 좋겠습니다.
참고가 됩니다. lanza에 대해 처음 접하는 정보가 있었습니다. 잘 정리된 기사네요.
유익한 기사네요. Granite 기사에서 언급된 사례가 흥미로웠습니다. 생각이 바뀌었습니다.
ibm-series 기사에서 언급된 사례가 흥미로웠습니다.
읽기 좋은 기사입니다. granite-4.0 관련 통계가 의외였습니다. 나중에 다시 읽어볼 만합니다.
유익한 기사네요. IBM의 향후 전망이 궁금합니다. 해외 동향도 함께 다뤄주시면 좋겠습니다.
유익한 기사네요. lanza 관련 해외 동향도 궁금합니다. 주변에도 공유해야겠어요.
Granite에 대한 다른 매체 보도와 비교해봐도 잘 정리되어 있습니다.
ibm-series 기사에서 언급된 사례가 흥미로웠습니다. 계속 지켜봐야겠습니다.
granite-4.0에 대해 더 알고 싶어졌습니다.
요즘 이 매체 기사가 제일 읽기 좋아요.
좋은 정리입니다. lanza이 일상에 어떤 영향을 줄지 생각해보게 됩니다.
Granite에 대해 주변 사람들과 이야기 나눠볼 만합니다.
ibm-series 관련 배경 설명이 이해하기 쉬웠습니다.
읽기 좋은 기사입니다. granite-4.0 관련 데이터가 인상적이었습니다. 생각이 바뀌었습니다.
IBM 주제로 시리즈 기사가 나오면 좋겠습니다. 좋은 기사 감사합니다.
읽기 좋은 기사입니다. lanza의 전문가 코멘트가 설득력 있었습니다.
Granite 관련 해외 동향도 궁금합니다.
북마크해두겠습니다. ibm-series 관련 데이터가 인상적이었습니다. 나중에 다시 읽어볼 만합니다.
좋은 정리입니다. granite-4.0의 전문가 코멘트가 설득력 있었습니다. 전문가 의견도 더 듣고 싶습니다.
IBM 관련 데이터가 인상적이었습니다.
lanza 관련 해외 동향도 궁금합니다. 전문가 의견도 더 듣고 싶습니다.
좋은 정리입니다. Granite에 대한 다른 매체 보도와 비교해봐도 잘 정리되어 있습니다.
북마크해두겠습니다. ibm-series 관련 배경 설명이 이해하기 쉬웠습니다.
granite-4.0이 일상에 어떤 영향을 줄지 생각해보게 됩니다. 전문가 의견도 더 듣고 싶습니다.
북마크해두겠습니다. IBM 관련 해외 동향도 궁금합니다. 주변에도 공유해야겠어요.
lanza에 대해 더 알고 싶어졌습니다.
Granite이 일상에 어떤 영향을 줄지 생각해보게 됩니다.
ibm-series 주제로 시리즈 기사가 나오면 좋겠습니다.
이런 시각도 있었군요. granite-4.0 관련 배경 설명이 이해하기 쉬웠습니다. 생각이 바뀌었습니다.
IBM이 앞으로 어떻게 전개될지 주목해야겠습니다.
친구한테도 추천했습니다.
Granite 관련 배경 설명이 이해하기 쉬웠습니다.
ibm-series 관련 배경 설명이 이해하기 쉬웠습니다. 생각이 바뀌었습니다.
granite-4.0 관련 통계가 의외였습니다. 주변에도 공유해야겠어요.
IBM 관련 용어 설명이 친절해서 좋았습니다.
lanza 관련 용어 설명이 친절해서 좋았습니다. 계속 지켜봐야겠습니다.
이런 시각도 있었군요. Granite 주제로 시리즈 기사가 나오면 좋겠습니다. 나중에 다시 읽어볼 만합니다.
참고가 됩니다. ibm-series의 전문가 코멘트가 설득력 있었습니다. 나중에 다시 읽어볼 만합니다.
granite-4.0이 앞으로 어떻게 전개될지 주목해야겠습니다. 해외 동향도 함께 다뤄주시면 좋겠습니다.
다른 기사도 기대하겠습니다.
유익한 기사네요. lanza에 대해 처음 접하는 정보가 있었습니다.
유익한 기사네요. Granite 관련 통계가 의외였습니다.
흥미로운 주제입니다. ibm-series 관련 통계가 의외였습니다.
granite-4.0이 앞으로 어떻게 전개될지 주목해야겠습니다.
이런 시각도 있었군요. IBM 관련 용어 설명이 친절해서 좋았습니다.
lanza 관련 해외 동향도 궁금합니다. 해외 동향도 함께 다뤄주시면 좋겠습니다.
북마크해두겠습니다. Granite 기사에서 언급된 사례가 흥미로웠습니다.
좋은 정리입니다. ibm-series의 향후 전망이 궁금합니다.
참고가 됩니다. granite-4.0 관련 데이터가 인상적이었습니다.
IBM 관련 통계가 의외였습니다. 잘 정리된 기사네요.
북마크해두겠습니다. lanza에 대한 다른 매체 보도와 비교해봐도 잘 정리되어 있습니다. 좋은 기사 감사합니다.
Granite이 일상에 어떤 영향을 줄지 생각해보게 됩니다. 후속 기사 부탁드립니다.
ibm-series에 대한 다른 매체 보도와 비교해봐도 잘 정리되어 있습니다. 주변에도 공유해야겠어요.
granite-4.0의 전문가 코멘트가 설득력 있었습니다.
핵심만 잘 정리해주시네요.
lanza의 향후 전망이 궁금합니다. 잘 정리된 기사네요.
Granite 주제로 시리즈 기사가 나오면 좋겠습니다.
ibm-series에 대해 더 알고 싶어졌습니다.
granite-4.0 기사에서 언급된 사례가 흥미로웠습니다.
읽기 좋은 기사입니다. IBM 주제로 시리즈 기사가 나오면 좋겠습니다. 생각이 바뀌었습니다.
참고가 됩니다. lanza의 향후 전망이 궁금합니다.
Granite에 대해 처음 접하는 정보가 있었습니다.
이런 시각도 있었군요. ibm-series 관련 배경 설명이 이해하기 쉬웠습니다. 나중에 다시 읽어볼 만합니다.
Más de esta serie
Más en IA y Tecnología
Últimas noticias

ICIJ investiga las estrategias de precios y patentes de Merck con Keytruda
El ICIJ revela las estrategias de precios y patentes de Merck con Keytruda en la investigación Cancer Calculus.

Entra en vigor la tregua de 10 días entre Israel y Líbano; la ONU espera que abra negociaciones
Un alto el fuego de 10 días entre Israel y Líbano entró en vigor el 17 de abril a medianoche.

JWST, 성간 혜성 3I/ATLAS에서 메테인 최초 검출…외계 행성계 단서 포착
JWST가 성간 혜성 3I/ATLAS에서 메테인을 최초 직접 검출, 외계 행성계 내부 조성 단서 확보.

IMF, 7년 만에 베네수엘라와 관계 재개…49억 달러 동결 해제 기대
IMF가 2019년 이후 중단됐던 베네수엘라와의 공식 관계를 7년 만에 재개했다.

Los caricaturistas de EE.UU. retratan la semana política en Washington
Los caricaturistas políticos de todo EE.UU. documentan la era mediante sátira semanal.

IMF, 7년 만에 베네수엘라와 관계 재개…49억 달러 동결 해제 가능성
IMF가 7년 만에 베네수엘라와 공식 협력을 재개하기로 결정했다.

Cuando la jungla devoró el hormigón: la paradoja del Conservatorio Barbican de Londres
El fotógrafo Altrath capta en una nueva serie la paradoja espacial del Conservatorio Barbican de Londres.

경상흑자 역대 최대인데 원화는 왜 약해지나
한국은행, 경상흑자에도 원화 약세 이어지는 구조적 원인 공식 분석.





