Gemini 3 Flash에서 Agentic Vision을 쓸 수 있습니다.

원문: https://blog.google/innovation-and-ai/technology/developers-tools/agentic-vision-gemini-3-flash

제가 이해한 바에 따르면, 이제 Gemini 3 Flash가 이미지 이해를 Agentic한 프로세스로 진행하여서 비전 성능을 5~10%(벤치 기준) 끌어올린다고 하네요.

즉... 이미지 이해를 위해서 구글이 넣은 온갖 방법(코드쪽 방법 포함)을 쓴단 말이겠죠.

그간 LLM에게 난제였던 손가락 6개 이모지를 주고, "이거 사진 손가락 몇개게?" 라고 물어봤을 때 6개라고 답하는 걸 보니 꽤 쓸만한 것 같습니다. Gemini 앱에서 3 Flash (Thinking)와, Vertex AI에서 3 Flash를 쓰면 된다고 하네요. 두 경우 모두 '코드 실행' 옵션이 필요하고요. Vertex AI의 API로도 지원하나봐요.

AI 뉴스 게시판

제목	작성자	작성일	조회
국내 한국 정부, AX 전환을 위한 2.4조원 투입 및 전주기 원스톱 지원 계획 프날 01.29. 조회 126 추천 0	프날	01.29.	126
해외 구글, 크롬 내 Gemini 업데이트 프날 01.29. 조회 229 추천 0	프날	01.29.	229
해외 Gemini 3 Flash에서 Agentic Vision을 쓸 수 있습니다. 프날 01.28. 조회 274 추천 0	프날	01.28.	274
해외 OpenAI, 과학적 글쓰기/협업을 위한 프리즘(PRISM) 공개 프날 01.28. 조회 493 추천 0	프날	01.28.	493
해외 Claude는 이제 무료 플랜 사용자에게 파일 생성 및 편집 기능(+Skills)을 제공합니다. 프날 01.27. 조회 305 추천 0	프날	01.27.	305

제목

작성자

작성일

조회

댓글 0

AI 뉴스 게시판

신고하기