AI연구회
경남ICT협회 AI 연구 모임
본 문서는 현재 AI 분야에서 중요하게 다뤄지는 8가지 주요 모델에 대한 설명과 비교를 제공합니다. 각 모델의 특징, 용도, 장단점을 분석하여 AI 모델 선택 시 참고할 수 있는 가이드를 제시합니다.
Large Language Model은 대규모 텍스트 데이터로 훈련된 거대한 신경망 모델로, 자연어 이해와 생성에 특화되어 있습니다. GPT, BERT, LLaMA 등이 대표적인 예시입니다.
-----------------------------------------------------------------------------
Latent Consistency Model은 확산 모델(Diffusion Model)의 샘플링 과정을 가속화하기 위해 개발된 모델로, 적은 단계로도 고품질 이미지를 생성할 수 있습니다.
Language Action Model은 자연어 명령을 실제 행동으로 변환하는 모델로, 언어 이해와 행동 계획을 결합한 AI 시스템입니다.
Mixture of Experts는 여러 개의 전문가 모델을 조합하여 효율적으로 대규모 모델을 구성하는 아키텍처입니다. 입력에 따라 적절한 전문가를 선택하여 처리합니다.
참조:
http://www.gnict.org/게시판/ai연구회/llm-아키텍처에-mixture-of-expertsmoe를-활용하기/
Vision Language Model은 시각적 정보와 텍스트 정보를 동시에 처리할 수 있는 멀티모달 AI 모델입니다. 이미지와 텍스트 간의 상호작용을 이해하고 생성할 수 있습니다.
Small Language Model은 상대적으로 작은 크기의 언어 모델로, 효율성과 실용성을 중시하여 설계된 모델입니다. 제한된 자원에서도 효과적으로 동작할 수 있습니다.
(참조: http://www.gnict.org/게시판/ai연구회/llm-아키텍처에-mixture-of-expertsmoe를-활용하기/)
Masked Language Model은 입력 텍스트의 일부를 마스킹하고 이를 예측하도록 훈련된 모델입니다. BERT가 대표적인 예시로, 양방향 컨텍스트를 활용한 언어 이해에 특화되어 있습니다.
Segment Anything Model은 Meta에서 개발한 이미지 분할 모델로, 다양한 객체와 영역을 정확하게 분할할 수 있는 범용 분할 모델입니다.
텍스트 생성 및 대화
이미지 관련 작업
자동화 및 제어
고성능 서버 환경
모바일 및 엣지 환경
클라우드 서비스
제조 AI에 적합한 모델을 위해 여러 모델의 특성과 장단점을 파악하는 것을 목적으로 살펴보았습니다. Large Language Model은 범용성과 높은 성능을 제공하지만 높은 비용이 단점이며, Small Language Model은 효율성을 중시하는 환경에 적합합니다. 그리고 제조 기업 업무에 따른 조직을 고려하면 Mixture of Experts를 고려 할 수 있을 것입니다.
기업 홍보를 위한 확실한 방법협회 홈페이지에 회사정보를 보강해 보세요.