OpenAI, 비정형 데이터를 스케일링하는 툴킷 '가브리엘' 공개

OpenAI Economic Research 팀은 GABRIEL(이하 가브리엘) 이라는 오픈소스 툴킷을 공개해, 비정형 텍스트와 이미지 데이터를 정량적인 수치로 변환해 분석할 수 있게 합니다. 연구자는 GPT에게 "이 채용 공고가 얼마나 가족 친화적인가?"같은 자연어 질문을 하면, 가브리엘이 같은 기준을 수천/수백만 개 문서에 일관되게 적용해 점수를 돌려줍니다. 이를 통해 사회과학자와 경제학자는 인터뷰, 강의계획서, 논문, 리뷰, 사진 등 방대한 질적 데이터를 손수 라벨링하지 않고도 대규모로 연구할 수 있습니다.

또한 가브리엘은 데이터셋 병합(심지어 컬럼 이름이 달라도!), 중복 제거, 텍스트 구간 코딩, 새로운 이론 아이디어 발굴, 개인정보 비식별화 같은 실무용 유틸리티도 제공합니다. 파이썬 라이브러리로 바로 제공된다고 합니다. OpenAI는 학계 피드백을 반영해 가브리엘을 계속 개선하고, 질적 데이터가 담고 있는 인간의 이야기를 더 많이 연구로 끌어들이는 것을 목표로 한다고 합니다.

즉, 정량 측정 되어있지 않은 비정형 데이터를 정량화시킬 수 있네요. 이걸 사람에게 시키면 수십개 수준에선 일관적 점수를 매길 수 있겠지만(사실 안된다고 봅니다. 10개 넘어가면 집중력이 흐트러져서..), AI의 도움을 받으면 수백만개 문서를 일관된 기준으로 평가해준대요.

가브리엘은 파이썬 라이브러리에 GPT 키를 연결하여 사용할 수 있습니다. (즉, 챗지피티에서 바로 사용할 순 없습니다.)

전통적으로 인간의 역할은 창조와 평가였습니다. 생성형 AI가 등장한 이후 창조 영역은 제일 먼저, 빠르게 대체되고 있습니다. 프로그래밍의 과정 중 코드를 직접 짜는 그런 일이 현저히 줄었습니다. 사람은 AI가 짠 코드를 평가하고, 요청하고, 조율하는 오케스트레이터의 역할로 변모할 것이라고 생각했습니다.

이젠 비정형적인 평가 마저도 AI가 한다고 합니다. 앞으로 AI는 AI가 짠 코드를 평가하고, 개선할 것입니다. 트랜스포머 전에 유행했던 GAN이 그랬듯이, 신경망이 신경망과 공진화하는 그런 시대가 왔네요. 사람의 역할에 대해서, 유의미한 삶에 대해서 고민하게 만드는 철학적 기사였습니다.

Link: https://openai.com/index/scaling-social-science-research/

제목	작성자	작성일	조회
해외 Gemini 3.1 pro 공개 프날 02.20. 조회 124 추천 0	프날	02.20.	124
해외 제미나이 음악 생성 기능 추가 프날 02.19. 조회 371 추천 0	프날	02.19.	371
해외 OpenAI, 비정형 데이터를 스케일링하는 툴킷 '가브리엘' 공개 프날 02.14. 조회 491 추천 0	프날	02.14.	491
해외 구글, Gemini 3 Deep think 새 버전 업데이트 발표 프날 02.13. 조회 191 추천 0	프날	02.13.	191
해외 OpenAI, GPT 5.3 Codex Spark 공개 프날 02.13. 조회 203 추천 0	프날	02.13.	203

OpenAI, 비정형 데이터를 스케일링하는 툴킷 '가브리엘' 공개

댓글 0

AI 뉴스 게시판

댓글 0

AI 뉴스 게시판

신고하기