austin-distel-rxpThOwuVgE-unsplash.jpg

AI연구회

경남ICT협회 AI 연구 모임

Docling(도클링)이란 무엇인가요?

Docling(도클링)이란 무엇인가요?

  • IBM Docling은 생성형 AI 애플리케이션을 위한 문서 처리 및 변환을 위한 오픈소스 툴킷 입니다. 제조 분야에서 AI 시스템 개발하시는 분에게 유용한 정보를 제공하겠습니다.
  • PDF문서 추출 Tool을 이것 저것 사용해 봤는데 docling 이 최고인 것 같아 공유합니다. 무엇보다 사용해봐야 알겠죠~

핵심 기능

IBM Research Zurich의 AI for knowledge 팀에서 개발한 Docling은 PDF, DOCX, PPTX, XLSX, HTML, WAV, MP3, 이미지 파일 등 다양한 문서 형식을 파싱하고 처리할 수 있습니다.

주요 특징:

  • 고급 PDF 이해: 페이지 레이아웃, 읽기 순서, 테이블 구조, 코드, 수식, 이미지 분류 등
  • 통합 문서 표현: DoclingDocument 형식으로 구조화된 표현 제공
  • 다양한 내보내기 형식: Markdown, HTML, DocTags, JSON 등으로 변환 가능
  • 로컬 실행: 민감한 데이터와 격리된 환경에서 실행 가능
  • AI 프레임워크 통합: LangChain, LlamaIndex, Crew AI, Haystack 등과 즉시 연결

상세내용은 아래를 클릭하세요~

https://www.gnict.org/blog/130/%EA%B8%80/docling%EB%8F%84%ED%81%B4%EB%A7%81%EC%9D%B4%EB%9E%80-%EB%AC%B4%EC%97%87%EC%9D%B8%EA%B0%80%EC%9A%94/

 

답글  총 1

감사합니다.   잘 보았습니다.

기업 홍보를 위한 확실한 방법
협회 홈페이지에 회사정보를 보강해 보세요.