IA y Tecnología

IBM lanza Granite 4.0 3B Vision: IA multimodal compacta para documentos empresariales

Diseño de adaptador LoRA y dataset ChartNet de 1,7 millones de muestras elevan la precisión en extracción de tablas, gráficos y pares clave-valor

유재민··5 min de lectura·
Granite 4.0 3B Vision: Compact Multimodal Intelligence for Enterprise Documents
Resumen
  • IBM lanzó Granite 4.0 3B Vision, un VLM ligero especializado en el procesamiento de documentos empresariales.
  • El modelo usa ChartNet (1,7 millones de muestras de gráficos) y la arquitectura DeepStack para mejorar la extracción de tablas, gráficos y KVP.
  • El diseño de adaptador LoRA permite que un único despliegue gestione cargas de trabajo multimodales y de solo texto.

IBM presenta Granite 4.0 3B Vision, un VLM compacto especializado en comprensión de documentos empresariales

IBM ha lanzado Granite 4.0 3B Vision, un modelo de visión y lenguaje (VLM, por sus siglas en inglés) ligero diseñado específicamente para el procesamiento de documentos empresariales. Anunciado a través del blog de Hugging Face, el modelo se centra en tres capacidades clave: extracción de estructuras de tablas, interpretación de gráficos y extracción semántica de pares clave-valor (KVP). Se distribuye como un adaptador LoRA sobre Granite 4.0 Micro, el modelo de lenguaje denso de IBM.

Por qué esto es relevante

Automatizar la extracción de información de documentos empresariales —facturas, contratos, informes y formularios financieros— ha sido durante mucho tiempo un desafío persistente. Las soluciones convencionales de reconocimiento óptico de caracteres (OCR) tienen dificultades con diseños complejos o datos codificados visualmente, como gráficos y diagramas.

Granite 4.0 3B Vision apunta directamente a este vacío. Al mantener el número de parámetros en torno a los 3B mientras optimiza la comprensión de estructuras documentales, el modelo busca reducir los costes de inferencia y la complejidad de despliegue en comparación con modelos generalistas de gran escala, lo que lo hace más viable para integrarse en flujos de trabajo internos empresariales.

El soporte oficial para Docling, la biblioteca de procesamiento de documentos de código abierto, añade una ventaja práctica para los equipos que construyen pipelines empresariales. El modelo puede operar de forma independiente o como parte de un pipeline más amplio.

Qué cambia respecto a los enfoques existentes

Tres innovaciones distinguen a Granite 4.0 3B Vision de los VLM convencionales.

① ChartNet: un dataset especializado en comprensión de gráficos

Los gráficos son notoriamente difíciles para los VLM, ya que comprenderlos exige razonar simultáneamente sobre patrones visuales, datos numéricos y lenguaje natural. El equipo de IBM abordó esto desarrollando ChartNet, un dataset de escala millonaria construido mediante un pipeline de síntesis guiado por código.

ChartNet comprende 1,7 millones de muestras de gráficos diversas que abarcan 24 tipos de gráficos y 6 bibliotecas de trazado. Cada muestra incluye cinco componentes alineados: código de trazado, imagen renderizada, tabla de datos, resumen en lenguaje natural y pares de preguntas y respuestas. Esta investigación se presentará en CVPR 2026.

② Arquitectura DeepStack: inyección de características visuales por capas

CaracterísticaEnfoque VLM estándarGranite 4.0 3B Vision (DeepStack)
Punto de inyección visualCapa únicaDistribuido en múltiples capas
Semántica de alto nivelMezclada con detalle espacialInyectada en capas anteriores
Detalle espacial/diseñoRiesgo de pérdidaInyectado en capas posteriores
Comprensión del diseñoLimitadaPreservada mediante enrutamiento separado

La inyección DeepStack dirige las características visuales abstractas a las capas anteriores para la comprensión semántica y las características espaciales de alta resolución a las capas posteriores para preservar el detalle. El resultado es un modelo que comprende tanto qué hay en un documento como dónde está.

③ Diseño modular: despliegue práctico mediante adaptador LoRA

En lugar de ser un modelo independiente, Granite 4.0 3B Vision se distribuye como adaptador LoRA sobre Granite 4.0 Micro. Esto significa que un único despliegue puede atender cargas de trabajo tanto multimodales como de solo texto.

[Análisis experto] El auge de los modelos especializados ligeros está redefiniendo la estrategia de IA empresarial

Este lanzamiento refleja una tendencia más amplia: junto a la carrera por modelos de propósito general cada vez más grandes, los modelos ligeros especializados en dominios específicos están consolidando su propio espacio en los mercados de IA empresarial.

Para las empresas, modelos como GPT-4o o Gemini 1.5 Pro conllevan altos costes de inferencia por documento y son difíciles de desplegar en local por requisitos de seguridad y cumplimiento normativo. Un modelo especializado de escala 3B que pueda ejecutarse en servidores internos o entornos perimetrales —con un rendimiento adecuado al propósito— tiene una alta probabilidad de convertirse en una opción cada vez más atractiva.

La prevista publicación del dataset ChartNet en CVPR 2026 también es destacable. Una vez disponible, podría acelerar los esfuerzos de ajuste fino en toda la industria y elevar el listón para la comprensión de gráficos en modelos competidores. No obstante, la validación en entornos reales sigue siendo clave.

Compartir

댓글 (99)

열정적인여우방금 전

IBM이 일상에 어떤 영향을 줄지 생각해보게 됩니다.

차분한분석가방금 전

다양한 주제를 다뤄주셔서 좋습니다.

성수의사자방금 전

Granite 관련 용어 설명이 친절해서 좋았습니다.

별빛의토끼방금 전

ibm-series에 대해 처음 접하는 정보가 있었습니다. 다른 시각의 분석도 읽어보고 싶습니다.

용감한달방금 전

granite-4.0 관련 데이터가 인상적이었습니다. 계속 지켜봐야겠습니다.

카페의워커방금 전

IBM에 대해 주변 사람들과 이야기 나눠볼 만합니다. 해외 동향도 함께 다뤄주시면 좋겠습니다.

오후의여우방금 전

깔끔한 기사입니다. lanza 관련 통계가 의외였습니다. 후속 기사 부탁드립니다.

제주의워커방금 전

깔끔한 기사입니다. Granite 관련 데이터가 인상적이었습니다.

유쾌한비평가방금 전

몰랐던 사실을 알게 됐습니다. ibm-series에 대해 주변 사람들과 이야기 나눠볼 만합니다. 계속 지켜봐야겠습니다.

비오는날크리에이터방금 전

이런 시각도 있었군요. granite-4.0이 앞으로 어떻게 전개될지 주목해야겠습니다. 나중에 다시 읽어볼 만합니다.

판교의드리머5분 전

IBM이 일상에 어떤 영향을 줄지 생각해보게 됩니다. 해외 동향도 함께 다뤄주시면 좋겠습니다.

도서관의고양이5분 전

잘 읽었습니다. lanza 관련 데이터가 인상적이었습니다. 다른 시각의 분석도 읽어보고 싶습니다.

바람의시민5분 전

잘 읽었습니다. Granite의 향후 전망이 궁금합니다. 다른 시각의 분석도 읽어보고 싶습니다.

강남의리더5분 전

ibm-series 관련 용어 설명이 친절해서 좋았습니다. 전문가 의견도 더 듣고 싶습니다.

아침의판다5분 전

유익한 기사네요. granite-4.0에 대해 주변 사람들과 이야기 나눠볼 만합니다.

열정적인기타5분 전

IBM에 대해 주변 사람들과 이야기 나눠볼 만합니다.

맑은날사자5분 전

lanza에 대해 처음 접하는 정보가 있었습니다. 후속 기사 부탁드립니다.

대전의다람쥐5분 전

좋은 정리입니다. Granite의 향후 전망이 궁금합니다. 생각이 바뀌었습니다.

대전의첼로5분 전

ibm-series에 대한 다른 매체 보도와 비교해봐도 잘 정리되어 있습니다. 계속 지켜봐야겠습니다.

따뜻한커피5분 전

granite-4.0 관련 용어 설명이 친절해서 좋았습니다. 계속 지켜봐야겠습니다.

판교의크리에이터12분 전

좋은 기사 감사합니다.

다정한기록자12분 전

구독 중인데 만족합니다.

대전의바이올린12분 전

Granite의 전문가 코멘트가 설득력 있었습니다. 좋은 기사 감사합니다.

꼼꼼한바람12분 전

이런 시각도 있었군요. ibm-series 관련 용어 설명이 친절해서 좋았습니다.

새벽의아메리카노12분 전

흥미로운 주제입니다. granite-4.0에 대해 더 알고 싶어졌습니다.

한밤의아메리카노12분 전

IBM에 대해 더 알고 싶어졌습니다.

냉철한리더12분 전

lanza에 대해 주변 사람들과 이야기 나눠볼 만합니다. 좋은 기사 감사합니다.

오후의아메리카노12분 전

몰랐던 사실을 알게 됐습니다. Granite의 전문가 코멘트가 설득력 있었습니다. 해외 동향도 함께 다뤄주시면 좋겠습니다.

비오는날분석가12분 전

ibm-series 관련 배경 설명이 이해하기 쉬웠습니다. 다른 시각의 분석도 읽어보고 싶습니다.

별빛의피아노12분 전

몰랐던 사실을 알게 됐습니다. granite-4.0에 대해 주변 사람들과 이야기 나눠볼 만합니다.

신중한판다30분 전

IBM에 대해 더 알고 싶어졌습니다. 잘 정리된 기사네요.

따뜻한여우30분 전

lanza의 향후 전망이 궁금합니다.

햇살의피아노30분 전

Granite의 전문가 코멘트가 설득력 있었습니다. 해외 동향도 함께 다뤄주시면 좋겠습니다.

서울의시민30분 전

언론이 이래야죠.

느긋한여행자30분 전

깔끔한 기사입니다. granite-4.0이 일상에 어떤 영향을 줄지 생각해보게 됩니다. 생각이 바뀌었습니다.

아침의별30분 전

이런 시각도 있었군요. IBM 관련 해외 동향도 궁금합니다. 해외 동향도 함께 다뤄주시면 좋겠습니다.

부지런한관찰자30분 전

참고가 됩니다. lanza에 대해 처음 접하는 정보가 있었습니다. 잘 정리된 기사네요.

여름의첼로30분 전

유익한 기사네요. Granite 기사에서 언급된 사례가 흥미로웠습니다. 생각이 바뀌었습니다.

맑은날펭귄30분 전

ibm-series 기사에서 언급된 사례가 흥미로웠습니다.

판교의녹차30분 전

읽기 좋은 기사입니다. granite-4.0 관련 통계가 의외였습니다. 나중에 다시 읽어볼 만합니다.

저녁의펭귄1시간 전

유익한 기사네요. IBM의 향후 전망이 궁금합니다. 해외 동향도 함께 다뤄주시면 좋겠습니다.

가을의바람1시간 전

유익한 기사네요. lanza 관련 해외 동향도 궁금합니다. 주변에도 공유해야겠어요.

서울의바람1시간 전

Granite에 대한 다른 매체 보도와 비교해봐도 잘 정리되어 있습니다.

아침의리더1시간 전

ibm-series 기사에서 언급된 사례가 흥미로웠습니다. 계속 지켜봐야겠습니다.

진지한별1시간 전

granite-4.0에 대해 더 알고 싶어졌습니다.

진지한여행자1시간 전

요즘 이 매체 기사가 제일 읽기 좋아요.

성수의리더1시간 전

좋은 정리입니다. lanza이 일상에 어떤 영향을 줄지 생각해보게 됩니다.

부산의연구자1시간 전

Granite에 대해 주변 사람들과 이야기 나눠볼 만합니다.

구름위돌고래1시간 전

ibm-series 관련 배경 설명이 이해하기 쉬웠습니다.

별빛의드리머1시간 전

읽기 좋은 기사입니다. granite-4.0 관련 데이터가 인상적이었습니다. 생각이 바뀌었습니다.

가을의구름2시간 전

IBM 주제로 시리즈 기사가 나오면 좋겠습니다. 좋은 기사 감사합니다.

꼼꼼한크리에이터2시간 전

읽기 좋은 기사입니다. lanza의 전문가 코멘트가 설득력 있었습니다.

부지런한탐험가2시간 전

Granite 관련 해외 동향도 궁금합니다.

밝은리더2시간 전

북마크해두겠습니다. ibm-series 관련 데이터가 인상적이었습니다. 나중에 다시 읽어볼 만합니다.

공원의별2시간 전

좋은 정리입니다. granite-4.0의 전문가 코멘트가 설득력 있었습니다. 전문가 의견도 더 듣고 싶습니다.

봄날의첼로2시간 전

IBM 관련 데이터가 인상적이었습니다.

유쾌한해2시간 전

lanza 관련 해외 동향도 궁금합니다. 전문가 의견도 더 듣고 싶습니다.

다정한강아지2시간 전

좋은 정리입니다. Granite에 대한 다른 매체 보도와 비교해봐도 잘 정리되어 있습니다.

신중한여우2시간 전

북마크해두겠습니다. ibm-series 관련 배경 설명이 이해하기 쉬웠습니다.

강남의다람쥐2시간 전

granite-4.0이 일상에 어떤 영향을 줄지 생각해보게 됩니다. 전문가 의견도 더 듣고 싶습니다.

서울의사색가3시간 전

북마크해두겠습니다. IBM 관련 해외 동향도 궁금합니다. 주변에도 공유해야겠어요.

강남의사색가3시간 전

lanza에 대해 더 알고 싶어졌습니다.

냉철한시민3시간 전

Granite이 일상에 어떤 영향을 줄지 생각해보게 됩니다.

바람의사색가3시간 전

ibm-series 주제로 시리즈 기사가 나오면 좋겠습니다.

호기심많은연구자3시간 전

이런 시각도 있었군요. granite-4.0 관련 배경 설명이 이해하기 쉬웠습니다. 생각이 바뀌었습니다.

느긋한드리머3시간 전

IBM이 앞으로 어떻게 전개될지 주목해야겠습니다.

따뜻한드럼3시간 전

친구한테도 추천했습니다.

겨울의녹차3시간 전

Granite 관련 배경 설명이 이해하기 쉬웠습니다.

열정적인고양이3시간 전

ibm-series 관련 배경 설명이 이해하기 쉬웠습니다. 생각이 바뀌었습니다.

용감한드리머3시간 전

granite-4.0 관련 통계가 의외였습니다. 주변에도 공유해야겠어요.

판교의라떼5시간 전

IBM 관련 용어 설명이 친절해서 좋았습니다.

열정적인드럼5시간 전

lanza 관련 용어 설명이 친절해서 좋았습니다. 계속 지켜봐야겠습니다.

홍대의커피5시간 전

이런 시각도 있었군요. Granite 주제로 시리즈 기사가 나오면 좋겠습니다. 나중에 다시 읽어볼 만합니다.

산속의드럼5시간 전

참고가 됩니다. ibm-series의 전문가 코멘트가 설득력 있었습니다. 나중에 다시 읽어볼 만합니다.

강남의사자5시간 전

granite-4.0이 앞으로 어떻게 전개될지 주목해야겠습니다. 해외 동향도 함께 다뤄주시면 좋겠습니다.

해운대의바람5시간 전

다른 기사도 기대하겠습니다.

용감한토끼5시간 전

유익한 기사네요. lanza에 대해 처음 접하는 정보가 있었습니다.

신중한아메리카노5시간 전

유익한 기사네요. Granite 관련 통계가 의외였습니다.

바람의리더5시간 전

흥미로운 주제입니다. ibm-series 관련 통계가 의외였습니다.

카페의고양이5시간 전

granite-4.0이 앞으로 어떻게 전개될지 주목해야겠습니다.

여름의다람쥐8시간 전

이런 시각도 있었군요. IBM 관련 용어 설명이 친절해서 좋았습니다.

신중한달8시간 전

lanza 관련 해외 동향도 궁금합니다. 해외 동향도 함께 다뤄주시면 좋겠습니다.

구름위커피8시간 전

북마크해두겠습니다. Granite 기사에서 언급된 사례가 흥미로웠습니다.

구름위비평가8시간 전

좋은 정리입니다. ibm-series의 향후 전망이 궁금합니다.

차분한강아지8시간 전

참고가 됩니다. granite-4.0 관련 데이터가 인상적이었습니다.

활발한별8시간 전

IBM 관련 통계가 의외였습니다. 잘 정리된 기사네요.

신중한드리머8시간 전

북마크해두겠습니다. lanza에 대한 다른 매체 보도와 비교해봐도 잘 정리되어 있습니다. 좋은 기사 감사합니다.

인천의별8시간 전

Granite이 일상에 어떤 영향을 줄지 생각해보게 됩니다. 후속 기사 부탁드립니다.

판교의분석가8시간 전

ibm-series에 대한 다른 매체 보도와 비교해봐도 잘 정리되어 있습니다. 주변에도 공유해야겠어요.

부산의달8시간 전

granite-4.0의 전문가 코멘트가 설득력 있었습니다.

오후의독자

핵심만 잘 정리해주시네요.

똑똑한첼로

lanza의 향후 전망이 궁금합니다. 잘 정리된 기사네요.

봄날의기록자

Granite 주제로 시리즈 기사가 나오면 좋겠습니다.

따뜻한시민

ibm-series에 대해 더 알고 싶어졌습니다.

열정적인해

granite-4.0 기사에서 언급된 사례가 흥미로웠습니다.

산속의라떼

읽기 좋은 기사입니다. IBM 주제로 시리즈 기사가 나오면 좋겠습니다. 생각이 바뀌었습니다.

재빠른러너

참고가 됩니다. lanza의 향후 전망이 궁금합니다.

부산의라떼

Granite에 대해 처음 접하는 정보가 있었습니다.

용감한관찰자

이런 시각도 있었군요. ibm-series 관련 배경 설명이 이해하기 쉬웠습니다. 나중에 다시 읽어볼 만합니다.

Más de esta serie

Más en IA y Tecnología

Últimas noticias