Microsoft 오픈 소스 멀티모달 AI 에이전트 - Magma
오늘 새벽 3시에 마이크로소프트는 공식 홈페이지를 통해 멀티모달 AI 에이전트 - 마그마의 기본 모델을 오픈 소싱했습니다. 마그마는 기존 에이전트와 비교하여 디지털 및 물리적 세계에 걸쳐 멀티모달 기능을 가지고 있으며 이미지, 비디오 및 텍스트와 같은 다양한 유형의 데이터를 자동으로 처리할 수 있습니다. 예를 들어, 마그마를 사용하여 자동으로 전자 상거래 주문을 하고 날씨를 확인할 수 있습니다. 또한 물리적 로봇을 자동으로 작동하거나 실제 체스를 할 때 도움을 받을 수 있습니다. 또한 마그마는 심리 예측 기능이 내장되어 있어 향후 비디오 프레임에서 시공간 역