VRAM 8GB + 주메모리 32GB 환경에서 24B 모델은 힘들군요 ^^;

로컬 모델 (devstral 2 small)을 써보려 했는데
초당 3토큰정도 나오는 것 같아 포기했습니다. ^^;

퍼플렉시티한테 물어보니 qwen 7B 모델을 쓰거나... 아니면 M4 맥미니 (통합 메모리 24GB) 정도면 그럭저럭 쓸 순 있을 것 같다고 하는데
아무래도 상용 모델 가입해서 쓰는것의 속도를 바라거나 하면 실망하겠죠.

트랜스포머 기반이 아닌 다른 구조가 AI의 대세가 된다면
좀 저비용 고성능으로 1인 1AI를 갖는 시대가 오지 않으련지 생각도 해봅니다.

자유 토론 게시판

제목	작성자	작성일	조회	추천
정보 바이브코딩 등으로 서비스를 만들 때 추천하는 방법 프날 01.26. 조회 317 추천 0	프날	01.26.	317	0
의견 넘쳐나는 Plugin, skills, MCP 뭣이 중헌디?[2] 불혹코딩 01.26. 조회 129 추천 1	불혹코딩	01.26.	129	1
의견 마켓플레이스의 고찰[3] 울새 01.25. 조회 249 추천 2	울새	01.25.	249	2
의견 다시, 스페셜리스트. 프날 01.25. 조회 289 추천 0	프날	01.25.	289	0
의견 VRAM 8GB + 주메모리 32GB 환경에서 24B 모델은 힘들군요 ^^; 프날 01.24. 조회 125 추천 0	프날	01.24.	125	0

제목

작성자

작성일

조회

댓글 0