AI·테크

IBM 그래나이트 4.0 3B 비전, 기업 문서 처리 특화 경량 멀티모달 AI 출시

LoRA 어댑터 구조와 170만 건 차트 학습 데이터로 테이블·차트·KVP 추출 정밀도 높여

유재민··5분 읽기·
Granite 4.0 3B Vision: Compact Multimodal Intelligence for Enterprise Documents
요약
  • IBM이 기업 문서 처리 특화 경량 VLM '그래나이트 4.0 3B 비전'을 공개했다.
  • 170만 건 규모의 차트 학습 데이터셋 차트넷과 딥스택 아키텍처로 테이블·차트·KVP 추출 정밀도를 높였다.
  • LoRA 어댑터 구조로 멀티모달·텍스트 전용 워크로드를 단일 배포에서 처리할 수 있다.

IBM, 기업 문서 이해 특화 경량 VLM '그래나이트 4.0 3B 비전' 공개

IBM이 기업 환경의 복잡한 문서 처리를 위한 경량 시각-언어 모델(VLM, Vision-Language Model) '그래나이트 4.0 3B 비전(Granite 4.0 3B Vision)'을 공개했다. 허깅페이스(Hugging Face) 블로그를 통해 발표된 이 모델은 테이블 구조 추출, 차트 해석, 의미론적 키-값 쌍(KVP, Key-Value Pair) 추출 등 세 가지 핵심 기능을 중심으로 설계됐으며, 기존 밀집형 언어 모델인 그래나이트 4.0 마이크로(Granite 4.0 Micro) 위에 LoRA 어댑터 형태로 탑재된다.

IBM 그래나이트 4.0 3B 비전, 기업 문서 처리 특화 경량 멀티모달 AI 출시
IBM 그래나이트 4.0 3B 비전, 기업 문서 처리 특화 경량 멀티모달 AI 출시

왜 이 모델이 주목받는가

기업 현장에서 문서 자동화는 오래된 과제다. 청구서, 계약서, 보고서, 금융 양식 등 비정형·반정형 문서에서 정확한 정보를 기계가 추출하는 일은 여전히 난제로 꼽힌다. 기존 광학 문자 인식(OCR, Optical Character Recognition) 솔루션은 레이아웃이 복잡하거나 차트·그래프처럼 시각 정보가 핵심인 경우 한계를 드러냈다.

그래나이트 4.0 3B 비전은 이 공백을 겨냥한다. 모델 크기를 3B(30억) 파라미터 수준으로 억제하면서도 문서 구조 이해에 특화된 성능을 목표로 했다는 점이 핵심이다. 대형 모델 대비 추론 비용과 배포 복잡성을 낮추면서 기업 내부 워크플로에 통합할 수 있도록 설계됐다.

특히 문서 처리 오픈소스 라이브러리인 독링(Docling)과의 연동을 공식 지원한다는 점은 기업 파이프라인 구축 측면에서 실질적인 이점으로 작용할 가능성이 높다. 단독 사용과 파이프라인 통합 사용 모두 지원한다.

이전 버전·경쟁 모델과 무엇이 달라졌나

그래나이트 4.0 3B 비전의 차별화 포인트는 크게 세 가지다.

① 차트넷(ChartNet): 차트 이해를 위한 전용 학습 데이터셋

차트는 VLM에게 특히 까다로운 입력이다. 시각 패턴, 수치 데이터, 자연어를 동시에 추론해야 하는데, 기존 VLM 대부분은 이 조합을 제대로 처리하지 못한다. IBM 연구팀은 이 문제를 해결하기 위해 코드 기반 합성 파이프라인으로 구성된 차트넷 데이터셋을 자체 개발했다.

차트넷은 24종 차트 유형과 6개 플로팅 라이브러리를 아우르는 170만 건의 다양한 차트 샘플로 구성된다. 각 샘플은 플로팅 코드, 렌더링 이미지, 데이터 테이블, 자연어 요약, QA(질문-답변) 쌍 등 5개 정렬된 구성요소를 포함해 모델이 차트의 시각적 외형뿐 아니라 인코딩된 구조적 정보를 학습할 수 있도록 설계됐다. 이 연구는 2026년 CVPR(컴퓨터 비전 및 패턴 인식 학술대회)에서 발표될 예정이다.

② 딥스택(DeepStack) 아키텍처: 계층별 시각 특징 주입

항목기존 VLM 일반 방식그래나이트 4.0 3B 비전 (딥스택)
시각 정보 주입 지점단일 레이어다중 레이어 분산 주입
고수준 의미 처리단일 처리로 혼재앞쪽 레이어에 추상 특징 주입
공간적 세부 정보손실 가능성뒤쪽 레이어에 고해상도 특징 주입
레이아웃 이해제한적위치 정보 보존 강화

딥스택 인젝션(DeepStack Injection)은 추상적 시각 특징을 앞단 레이어에, 고해상도 공간 특징을 뒷단 레이어에 분리 주입하는 방식이다. 이를 통해 문서 내 '무엇이 있는지'와 '어디에 있는지'를 동시에 파악할 수 있게 된다. 테이블 추출, 차트 해석, KVP 파싱처럼 레이아웃 정보가 내용만큼 중요한 작업에서 이 구조가 실질적 차이를 만든다고 개발팀은 설명한다.

③ 모듈형 설계: LoRA 어댑터 방식의 실용적 배포

그래나이트 4.0 3B 비전은 독립형 모델이 아닌, 그래나이트 4.0 마이크로 위의 LoRA 어댑터로 패키징된다. 같은 배포 환경에서 멀티모달 워크로드와 텍스트 전용 워크로드를 모두 처리할 수 있어, 혼합 파이프라인 운영 시 별도 모델 교체 없이 유연하게 전환 가능하다.

[전문가 분석] 경량 특화 모델의 부상, 기업 AI 전략을 바꾸다

이번 출시는 대형 언어 모델(LLM, Large Language Model)의 '범용화' 경쟁과 별개로, 특정 도메인에 최적화된 경량 특화 모델이 기업 AI 시장에서 독자적 위치를 확보해가는 흐름을 보여준다.

기업 입장에서 GPT-4o나 Gemini 1.5 Pro 같은 초대형 모델은 문서 처리 비용이 높고 보안·컴플라이언스 측면에서 온프레미스(on-premise) 배포가 어렵다. 반면 3B 규모의 특화 모델은 사내 서버 또는 엣지 환경에 배포하면서도 목적에 맞는 성능을 낼 수 있다는 점에서 현실적인 선택지가 될 가능성이 높다.

차트넷 데이터셋이 CVPR 2026에 공개될 예정이라는 점도 주목할 만하다. 학술 데이터셋이 공개되면 이를 활용한 추가 파인튜닝(fine-tuning)이나 경쟁 모델의 성능 향상에도 기여할 수 있어, IBM의 이번 연구가 업계 전체의 차트 이해 능력 향상을 이끄는 촉매 역할을 할 가능성이 있다.

다만, 실제 기업 환경에서의 성능 검증은 향후 과제다. 발표된 역량들이 실제 다양한 기업 문서 포맷에서 일관되게 발휘되는지는 독립적인 벤치마크와 현장 도입 사례를 통해 확인될 필요가 있다. 독링 연동을 통한 파이프라인 통합이 얼마나 매끄럽게 작동하는지도 실무 도입의 핵심 변수가 될 것이다.

공유

댓글 (92)

가을의기록자방금 전

IBM의 과정이 쉽지 않았을 텐데 결과가 인상적입니다. 심층 분석 기사도 부탁드려요.

진지한러너방금 전

그래나이트 소식을 주변에도 공유했습니다.

다정한여우방금 전

3B 소식을 주변에도 공유했습니다.

공원의바이올린방금 전

기분 좋은 뉴스입니다. ibm-series이 업계 전체에 좋은 자극이 될 것 같습니다.

재빠른러너방금 전

granite-4.0이 사회에 미칠 긍정적 영향이 기대됩니다.

부산의기록자방금 전

IBM 관련자분들의 오랜 노력이 결실을 맺었네요.

햇살의크리에이터방금 전

그래나이트의 과정이 쉽지 않았을 텐데 결과가 인상적입니다. 앞으로가 더 기대됩니다.

비오는날라떼방금 전

놀라운 성과입니다. 3B에 참여한 모든 분들께 박수를 보냅니다.

오후의독자방금 전

ibm-series에 대해 더 자세히 알고 싶어졌습니다. 다들 좋아하네요.

진지한달방금 전

놀라운 성과입니다. granite-4.0이 사회에 미칠 긍정적 영향이 기대됩니다.

열정적인비평가5분 전

희망적인 소식이네요. IBM의 과정이 쉽지 않았을 텐데 결과가 인상적입니다.

밝은러너5분 전

그래나이트의 과정이 쉽지 않았을 텐데 결과가 인상적입니다.

용감한별5분 전

3B 사례가 좋은 선례가 되기를 바랍니다. 심층 분석 기사도 부탁드려요.

겨울의사자5분 전

ibm-series 덕분에 해당 분야에 관심이 더 생겼습니다.

홍대의첼로5분 전

granite-4.0 사례가 좋은 선례가 되기를 바랍니다.

산속의부엉이5분 전

놀라운 성과입니다. IBM에 대해 더 자세히 알고 싶어졌습니다.

솔직한고양이5분 전

기분 좋은 뉴스입니다. 그래나이트이 사회에 미칠 긍정적 영향이 기대됩니다. 앞으로가 더 기대됩니다.

서울의라떼5분 전

기분 좋은 뉴스입니다. 3B 소식을 주변에도 공유했습니다.

냉철한드럼5분 전

축하드립니다! ibm-series 사례가 좋은 선례가 되기를 바랍니다. 후속 소식도 기대하겠습니다!

별빛의드럼12분 전

정리가 깔끔하네요.

봄날의달12분 전

아침에 읽기 딱 좋은 분량이에요.

조용한별12분 전

그래나이트 성과가 세계적으로 인정받는 것 같습니다.

공원의달12분 전

3B의 글로벌 반응도 궁금합니다.

열정적인크리에이터12분 전

기분 좋은 뉴스입니다. ibm-series이 업계 전체에 좋은 자극이 될 것 같습니다. 좋은 보도 감사합니다.

부산의에스프레소12분 전

granite-4.0의 글로벌 반응도 궁금합니다. 관련 분야 전체에 활기를 줄 것 같습니다.

느긋한에스프레소12분 전

축하드립니다! IBM 덕분에 해당 분야에 관심이 더 생겼습니다.

봄날의별12분 전

반가운 소식입니다. 그래나이트에 참여한 모든 분들께 박수를 보냅니다.

아침의별12분 전

유익한 기사네요.

똑똑한첼로30분 전

기사 잘 읽었습니다.

봄날의여우30분 전

반가운 소식입니다. granite-4.0 소식을 주변에도 공유했습니다. 다들 좋아하네요.

햇살의독자30분 전

좋은 기사 감사합니다.

산속의독자30분 전

그래나이트 소식을 주변에도 공유했습니다. 관련 분야 전체에 활기를 줄 것 같습니다.

아침의여우30분 전

희망적인 소식이네요. 3B의 글로벌 반응도 궁금합니다.

활발한펭귄30분 전

ibm-series이 다음 단계로 발전하면 어떤 변화가 올지 기대됩니다.

봄날의기타30분 전

이런 뉴스가 더 많았으면 좋겠습니다. granite-4.0의 성공 비결이 궁금합니다.

부지런한펭귄30분 전

IBM이 업계 전체에 좋은 자극이 될 것 같습니다.

바람의펭귄30분 전

그래나이트 같은 소식이 더 자주 들렸으면 좋겠습니다.

겨울의펭귄1시간 전

3B의 과정이 쉽지 않았을 텐데 결과가 인상적입니다. 해외에서는 어떻게 보는지 궁금합니다.

홍대의고양이1시간 전

다양한 주제를 다뤄주셔서 좋습니다.

해운대의피아노1시간 전

놀라운 성과입니다. granite-4.0 성과가 세계적으로 인정받는 것 같습니다.

열정적인녹차1시간 전

IBM의 글로벌 반응도 궁금합니다.

맑은날시민1시간 전

이런 뉴스가 더 많았으면 좋겠습니다. 그래나이트이 다음 단계로 발전하면 어떤 변화가 올지 기대됩니다.

따뜻한해1시간 전

기대가 됩니다! 3B의 글로벌 반응도 궁금합니다. 다들 좋아하네요.

판교의사색가1시간 전

ibm-series의 글로벌 반응도 궁금합니다.

강남의펭귄1시간 전

오늘 하루가 밝아졌습니다. granite-4.0의 글로벌 반응도 궁금합니다.

한밤의구름1시간 전

이런 뉴스가 더 많았으면 좋겠습니다. IBM 덕분에 해당 분야에 관심이 더 생겼습니다.

새벽의워커2시간 전

그래나이트 사례가 좋은 선례가 되기를 바랍니다.

재빠른독자2시간 전

오늘 하루가 밝아졌습니다. 3B의 성공 비결이 궁금합니다. 관련 분야 전체에 활기를 줄 것 같습니다.

다정한다람쥐2시간 전

ibm-series의 성공 비결이 궁금합니다.

재빠른연구자2시간 전

granite-4.0의 과정이 쉽지 않았을 텐데 결과가 인상적입니다.

여름의시민2시간 전

IBM이 사회에 미칠 긍정적 영향이 기대됩니다.

용감한드리머2시간 전

그래나이트이 사회에 미칠 긍정적 영향이 기대됩니다.

성수의피아노2시간 전

3B 관련자분들의 오랜 노력이 결실을 맺었네요. 후속 소식도 기대하겠습니다!

다정한분석가2시간 전

ibm-series 덕분에 해당 분야에 관심이 더 생겼습니다. 이런 소식이 힘이 됩니다.

인천의펭귄2시간 전

granite-4.0이 사회에 미칠 긍정적 영향이 기대됩니다. 인터뷰 기사도 기대해봅니다.

비오는날아메리카노2시간 전

요즘 이 매체 기사가 제일 읽기 좋아요.

맑은날드럼3시간 전

객관적인 시각이 돋보이는 기사입니다.

현명한기록자3시간 전

3B 관련자분들의 오랜 노력이 결실을 맺었네요. 해외에서는 어떻게 보는지 궁금합니다.

카페의구름3시간 전

ibm-series 성과가 세계적으로 인정받는 것 같습니다.

대전의에스프레소3시간 전

이런 뉴스가 더 많았으면 좋겠습니다. granite-4.0이 다음 단계로 발전하면 어떤 변화가 올지 기대됩니다. 후속 소식도 기대하겠습니다!

새벽의해3시간 전

구독 중인데 만족합니다.

신중한독자3시간 전

그래나이트 사례가 좋은 선례가 되기를 바랍니다. 계속 응원하겠습니다!

인천의피아노3시간 전

기자님 수고하셨습니다.

냉철한구름3시간 전

언론이 이래야죠.

대전의기록자3시간 전

오늘 하루가 밝아졌습니다. granite-4.0 소식을 주변에도 공유했습니다. 앞으로가 더 기대됩니다.

꼼꼼한아메리카노5시간 전

기분 좋은 뉴스입니다. IBM 사례가 좋은 선례가 되기를 바랍니다. 심층 분석 기사도 부탁드려요.

구름위바람5시간 전

그래나이트 소식이 다른 분야에도 긍정적 영향을 줄 것 같습니다.

부산의피아노5시간 전

반가운 소식입니다. 3B의 성공 비결이 궁금합니다. 관련 분야 전체에 활기를 줄 것 같습니다.

저녁의시민5시간 전

ibm-series에 참여한 모든 분들께 박수를 보냅니다. 인터뷰 기사도 기대해봅니다.

바닷가의크리에이터5시간 전

이런 뉴스가 더 많았으면 좋겠습니다. granite-4.0이 사회에 미칠 긍정적 영향이 기대됩니다.

부지런한아메리카노5시간 전

기대가 됩니다! IBM 덕분에 해당 분야에 관심이 더 생겼습니다.

봄날의기록자5시간 전

기대가 됩니다! 그래나이트이 다음 단계로 발전하면 어떤 변화가 올지 기대됩니다.

봄날의러너5시간 전

오늘 하루가 밝아졌습니다. 3B 사례가 좋은 선례가 되기를 바랍니다.

솔직한사자5시간 전

ibm-series 사례가 좋은 선례가 되기를 바랍니다.

가을의해8시간 전

매일 여기서 뉴스 보고 있어요.

진지한다람쥐8시간 전

기대가 됩니다! IBM 소식을 주변에도 공유했습니다. 관련 분야 전체에 활기를 줄 것 같습니다.

차분한워커8시간 전

이런 뉴스가 더 많았으면 좋겠습니다. 그래나이트 관련자분들의 오랜 노력이 결실을 맺었네요. 앞으로가 더 기대됩니다.

해운대의여우8시간 전

3B이 다음 단계로 발전하면 어떤 변화가 올지 기대됩니다.

봄날의라떼8시간 전

다른 기사도 기대하겠습니다.

도서관의시민8시간 전

반가운 소식입니다. granite-4.0의 글로벌 반응도 궁금합니다.

용감한연구자8시간 전

IBM 같은 소식이 더 자주 들렸으면 좋겠습니다. 다들 좋아하네요.

밝은커피8시간 전

그래나이트 소식을 주변에도 공유했습니다. 심층 분석 기사도 부탁드려요.

오후의기타8시간 전

3B 관련자분들의 오랜 노력이 결실을 맺었네요.

냉철한리더

ibm-series 소식이 다른 분야에도 긍정적 영향을 줄 것 같습니다. 심층 분석 기사도 부탁드려요.

똑똑한구름

granite-4.0에 참여한 모든 분들께 박수를 보냅니다.

구름위달

이런 뉴스가 더 많았으면 좋겠습니다. IBM 성과가 세계적으로 인정받는 것 같습니다.

가을의토끼

정말 대단하네요! 그래나이트 관련자분들의 오랜 노력이 결실을 맺었네요.

신중한연구자

반가운 소식입니다. 3B의 과정이 쉽지 않았을 텐데 결과가 인상적입니다. 인터뷰 기사도 기대해봅니다.

밝은에스프레소

ibm-series이 사회에 미칠 긍정적 영향이 기대됩니다. 다들 좋아하네요.

똑똑한시민

정말 대단하네요! granite-4.0의 글로벌 반응도 궁금합니다. 관련 분야 전체에 활기를 줄 것 같습니다.

재빠른여행자

IBM에 대해 더 자세히 알고 싶어졌습니다.

아침의라떼

기분 좋은 뉴스입니다. 그래나이트이 다음 단계로 발전하면 어떤 변화가 올지 기대됩니다.

이 시리즈의 다른 기사

AI·테크 더보기

최신 뉴스