
vol. 3Vision + Language
Multimodal
이미지, 언어, 사운드가 하나의 모델 안에서 만나는 순간을 추적한 멀티모달 이슈.
08 / Magazine
deep daiv. Magazine은 커뮤니티가 공부한 AI 기술을 한 권의 에디토리얼로 엮는 프로젝트다. 화면에서 빠르게 사라지는 글 대신, 다시 펼쳐 읽을 수 있는 깊이를 만든다.
커버로 읽는 발행 기록
TOTAL 4

이미지, 언어, 사운드가 하나의 모델 안에서 만나는 순간을 추적한 멀티모달 이슈.

언어 모델의 구조와 응용, 그리고 텍스트를 이해하는 기계의 한계를 긴 호흡으로 정리한 이슈.

보는 AI가 이미지를 읽고 세계를 재구성하는 방식을 다룬 컴퓨터 비전 이슈.

인공지능의 기본 개념, 2024년의 핵심 키워드, 첫 AI 프로젝트 입문을 엮은 AI 편.