기사보기 : https://www.aitimes.com/news/articleView.html?idxno=167079벤치마크 결과 (사진=UC 버클리) 하지만 수학 문제 모음 'MATH500'에서 초기 'o1-프리뷰' 버전보다 우수한 성능을 보였으며, 코딩 평가 데이터셋 '라이브코드벤치'의 난이도 높은 문제에서도 o1-프리뷰를 뛰어넘는...