Opus 4.8 공개, 코덱스 ChatGPT 통합, 저는 구버전이 낫습니다 (주간 AI)
관심사 유튜브 채널 전일 영상 번들로 수집한 YouTube 자료. 채널: 달비의 작업실, 게시: 2026-06-10 23:44 KST.
핵심 메타데이터
- URL: https://www.youtube.com/watch?v=2dKoMER7q0w
- Video ID:
2dKoMER7q0w - Channel: 달비의 작업실
- Raw: 2026-06-10-yt-2dkomer7q0w-opus-4-8-공개-코덱스-chatgpt-통합-저는-구버전이-낫습니다-주간-ai
기존 관련 문서 연결
설명
역대 최강이라는 Claude Opus 4.8을 일주일 써보고, 결국 Opus 4.6으로 돌아갔습니다. 벤치마크 1위 모델이 실제 작업에서는 왜 생산성을 깎는지, 그리고 같은 주에 OpenAI가 Codex를 ChatGPT 안으로 통합하고 채팅창에서 웹사이트가 통째로 나오는 Sites를 공개한 의미를 정리합니다. 샘 알트먼이 “내가 틀렸다”고 말한 맥락도 같이 다룹니다. 이 영상에서 다루는 내용: • Opus 4.8 벤치마크 최
TRANSCRIPT
대부분의 사람들이 AI를 일단 써 보면 될 거라고 성과가 알아서 따라올 거라고 착각합니다. 새로운 AI 모델이 나오고이 모델에게 이전에 해 본 적 없던 새로운 업무를 시켜보죠. 하루 종일 거기에 매달려 있습니다. 일주일이 지나고 아무것도 남지 않았죠. 이런 방법은 완전히 틀렸습니다. AI 프론티어 레벨에 있는 사람들이 해야 될 연구 업무를 왜 우리가 하고 있냐고요? 저번 주 역대 최강의 AI 모델이 나왔습니다. 오프스 4.8 벤치마크 최상급이고 더 정직한 AI라는 소리를 듣고 있죠. 그럼에도 불구하고 저는 오래된 오프스 4.6 모델로 무려 두 버전이나 롤백해서 쓰고 있습니다. 25년 5월에 업데이트가 끊기고 더 이상 지식이 추가되지도 않는 모델인데요. 그런데도 제 작업 퀄리티는 오히려 점점 더 나아지기 시작했습니다. 대체 왜 그런 걸까요? 보세요. 저는 하루 10시간씩 뭐 AI를 하루 종일 끼고 삽니다. 유튜브 채널도 운영하고 저만의 지식 창고도 만들고 앱이랑 웹사이트까지도 만들어 봤어요. 기획부터 제작 분석, 배포까지 모든 작업을 AI랑 함께 합니다. 그런데 이런 저도 오퍼스 4.8을 더 이상 반가운 마음이 안 들더라고요. 이번 영상에서는 이번 주 가장 중요했던 AI 뉴스 세 가지와이 뉴스들을 보지 곧대로 따라가면 안 되는 이유에 대해서 말씀드리겠습니다. 클로드 오퍼스 4.8 나오자마자 써 봤는데 굉장히 이상한 일이 하나 있었습니다. 워크플로우라는 기능을 쓸 수 있다고 하는데요. 테스트할 겸 간단한 작업을 하나 시켰어요. 평소가 탔으면 서브 에이전트 두 개 정도 켜는 일인데 혹시나 몰라서 한번 찍어 봤죠. 이게 바로 제 첫 번째 실수입니다. 새로운 기능 나왔다고 득대같이 달려 들어서는 별로 필요하지도 않은 작업을 먼저 시켜 보는 거죠. 결과는 생각보다 더 심각했습니다. 잠깐 자리 비우고 오니까 5분 만에 5시간 한도를 전부 다 썼더라고요. 말이 안 된다 생각해서 기록을 한번 까봤거든요. 서브 에이전트가 무려 40개나 스폰이 되었습니다. 비교적 싼 모델 있는 하이쿠나 소네로 돌린 것도 아니고요. 오프스 4.8 그 비싼 모델을 40개나 스폰해 버린 거죠. 심지어 40개가 제대로 일도 못 했어요. 왜요? 5시간 리밋이 5분만에 다 차버렸으니까 제대로 일하지도 못했죠. 제가 이거 이후로 엄청나게 호통을 치니까 당연히 죄송하다 다시는 안 그러겠다. 메모리에다 박아두겠다라고 말을 하긴 합니다. 그런데 제가 이걸 믿을 수가 있을까요? 메모리 하나 박는다고 해서 앞으로 절대 이런 일이 벌어지지 않을까라고 생각을 했을 때는 아니라는 생각이 들더라고요. 제가 뭐 일부러 실패하라고 지시를 한 것도 아니고 그냥 간단하게 이거 한번 해보자. 워크플로우 새로 나왔으니까 써 보자라고 했는데도 이렇게 실패를 한 거면 앞으로는 더 실패할 가능성이 높지 않겠어요? 여기서이 두 번째 실수는 AI에게 애초에 제대로 하지 못할 작업. 사실상 필요 없는 작업을 시키면서도 잘할 거라고 막연히 기대하는 거였어요. 원래 AI가 잘하는 작업이라면 뭐가 떠오르시나요? 저는 분석이라고 생각하는데요. AI는 여러 장 수천 개의 데이터를 한 번에 모아와서 분석하는 거에 거의 도가 떴습니다. 유튜브 대본 분석 같은 것도 할 수 있고 경쟁 경쟁사나 아니면 레퍼런스 사물만 유튜브 대본을 다 분석할 수가 있죠. 독자가 되어서 내 대본을 실제로 읽어보고 비평해 주라고도 할 수 있죠. 게다가 팩트 체크까지 인터넷 검색해 가지고 내가 쓴 정보가 실제로 논리적으로 부합하는지 말해 줘라고 할 수도 있죠. 그런 AI가 아주 잘하는 것들을 여기 남겨 둔 채로 이런 반복 작업이나 분석 작업 AI를 쓸 수 있는데도 불구하고 그 생각을 하지 않고 냅다 새로운 기능 나왔다고 머리 받고 있으니까 생산성 커녕 그냥 시간 낭비를 한 셈이 되는 거죠. 물론 저는 유튜브를 해야 되기 때문에 유튜버기 때문에 여러분한테 이걸 보여 드리고 싶어서 한 번씩 꼭 하긴 하는데 여러분 같은 경우에는 유튜브 하실 거 아니라면 이런 새로운 기능 매몰되지 마시고 내가 원래 하던 일 아니면 하고 싶었던데 못 했던 일단 머리 박아가면서 숙련을 먼저 하고 그다음에 AI를 한번 붙여 보는게 어떨까 생각하고 있습니다. 물론 이미 숙면자이신 분들은 AI 얼른 배우시고요. 결국 저는 오포스 4.6 버전으로 돌아왔습니다. 클로드 CLI에서 슬래시 모델 치고 클로드 하이픈 오프스 하이폰 4 하이픈 6 이렇게 치면 쓸 수가 있고요. 웹 버전에서는 그냥 모델 변경하면 클릭클릭으로 할 수 있더라고요.대 체감상 코드 쓰는 건 4.8이 잘합니다. 근데 한국어를 더 잘 쓰는 건 4.6이에요. 이거 관련해서 경험 있으신 분 있으면 댓글 써 주세요. 저만 이런 거 아니더라고요. 요즘 느끼는 건 AI가 생산성을 높이는 부분이 있고 오히려 더 감소시키는 부분이 있다는 겁니다. 성과를 내기 전에 시스템의 온 신경을 다 갈아놓는게 굉장히 비효율적이라는 생각이 들어요. 무슨 소리냐? AI가 시스템을 짜는 걸 기가 막히게 해 줍니다. 근데 그게 하우스한 시스템이거든요. 왜냐하면 내가 그걸로 성과를 내본 적이 없잖아. 예를 들어서 제가 유튜브를 하고 싶어요. 유튜브를 하고 싶어서 유튜브 채널을 개설을 해. 그다음부터 유튜브 대본 작성 방법에 대해서 엄청나게 연구를 하기 시작합니다. 영상 하나도 올리지 않고 그냥 냅다 대본을 어떻게 쓰는가에 대해서 강의를 막 수십만 원씩 결제를 합니다. 이게 말이 되는 행동일까요? 그런데 AI는이 행동을 자연스럽게 인간에게서 유도를 해냅니다. 어, 제가 이거 만들 수 있을 것 같은데요. 제가 대본 분석 같은 거 해 볼 수 있을 것 같은데요. 대본에 대한 거, 유튜브 대본을 어떻게 쓰면 될지에 대해서 병렬 조사를 해 볼까요? 어, 되게 혹하죠? 뭔가 해 보면은 충분히 배울 수 있을 것 같아. 그러면서 일주일 한 달, 세 달이 흘러가고 유튜브에 올라오는 건 아무것도 없습니다. 하나도 올리면 다행이죠. 정말 이상하고 마음에 들지 않은 영상이더라도 일단 영상을 내보내야지 그 다음 영상을 개선하든 할 거 아닙니까? 베이스라인이 하나 깔려 있어야 그거보다 좀 더 나은 영상을 만들 수 있는 건데이 베이스라인 같은 거 없이 시스템만 하루 종일 개선하고 있으니까 그런 건 하지 말자는 거죠. 이게 제 세 번째 실수였습니다. 그런데 반대로 세상을 잠깐 보니까 쓸모 없는 AI 도구들이 너무나 많이 쏟아지고 있더라고요. 먼저 코덱스가 주간 사용자 500만 명을 찍었습니다. 100만 명마다 토큰 초기화 한번 시켜 준다고 했던 세마트먼 말대로 실제 초기화가 일어났고요. 오픈 AI가 5월 달까지 진행했던 코덱스 두 배의 사용량 프로모션이 끝나 버려서 살짝 부족하긴 하더라고요. 한 번 더 해줬으면 좋겠어. 그리고 연이어서 어 코덱스에서 사이츠라는게 나왔는데요. 웹사이트랑 웹을 통지로 만들어서 완전히 배포할 수 있는 기능이에요. 들어보셨을지 모르겠는데 러블 플립 V0 이런 데서 하는 배포 서비스까지 모두 같이 해 주는 거예요. 그러니까 어깨 채강자가이 빌더 업계에다가 어 내가 할 거니까 다 나오십시오라 하는 거죠. 당장은 엔터프라이즈 요금제에서만 켜져 있고 저희는 쓸 수가 없습니다. 나중에 나오면 한번 써 볼게요. 그리고 GPT 리얼타임 2라는 AI 모델을 통해서 맥OS를 완전히 음성만으로만 제어하는 시연이 나왔었거든요. 자기 앱을 만들어서 홍보하는 거였는데는 그게 엄청나게 바이러럴 스포티파이도 켜고 VS 코드도 켜 주고 뭐 코드 작성도 해 주고 난리가 났었죠. GPT 5.5랑은 다른 실제 음성을 위한 모델이에요. 음성으로 지시를 하면 그대로 코드를 작성해 줄 수 있는 모델이라고 할 수 있죠. 단점 좀 비쌉니다. 이런 것들이 전부 한 주 안에 나왔었고요. 대부분은 이런 홍수에 자기가 걸어 들어가서 빠져 버립니다. 저도 그랬고요. 일단 따라가서 먼저 한번 빠져보자. 다른 사람들 쓰기 전에 너도 한번 써 보자라고 빠지는 거죠. 이게 1년 전까지만 해도 되게 유효했었거든요. 일단 먼저 해 보면 내가 웹사이트 만들어 버려, 앱 하나 만들어 버려, 그리고 수익커 해 버려 가능했는데 오히려 이제는 너무 많이 풀리고 상형 편준화가 되다 보니까 내가 이거 기능 좀 한다고 해서 내 업무에 뭐가 달라지지라는 생각이 먼저 드는 거죠. 이렇게 얼리 어댑터를 하는게 겉으로 봤을 때 멋있게 보일 수도 있는데요. 사실 생산성 함정에 계속해서 빠지게 되는 거랑 똑같습니다. 실제로 내가 쓰고 있는 내 작업 흐름에다가 클로드를 끼워 맞추는게 더 중요하고 그리고이 끼워 맞추는 거는 클로드 4.6에서도 되고 4.5에서도 되고 4.4에서도 됩니다. AI 모델 자체가 중요한게 아니라 AI를 내 워크플로우에 어떻게 넣느냐가 중요한 거니까요. AI가 발전하는 걸 옆에서 보고 있다가 아 모르겠어 일단 따라해 봐야겠어 하고 열심히 따라가지 말고 쟤네가 하는 거는 뭐 신기하구나 하고 우리는 실제로 업무에 적용할 수 있는 부분을 파보자는 거죠. 저 같은 경우에는 기획이나 글 쓰기 대본 교정 팩트 체크 이런 것들을 AI에게 맡겨 봤었는데요. 앞에 두 개는 실패했고 뒤에 두 개는 괜찮았고 이런 것도 시도를 해 봐야지 알 수 있는 거죠. 경험을 해 봤으니까 알 수 있는 거고 얘가 검증이나 분석을 정말 잘하니까 내가 앞단의 기획을 막고 얘가 뒷단의 분석이나 피드백 이런 걸 맞게 하자라고 있는 결론을 낼 수 있는 겁니다. 그리고이 말에 근거를 더해 주는 발언들이 생겨나고 있는데요. AI가 인간을 반드시 대체할 것이라고 말하던 사람들이 IPO를 눈앞에 두고 말을 바꾸기 시작했습니다. 샘말트먼 5월지 26일 이렇게 말했어요. 아무래도 내가 좀 틀린 거 같다. 그리고 틀려서 굉장히 기쁘다. 원래는이 시점에 초급 사무직, 신입 사무직들이 엄청나게 사라졌을 거라고 생각했는데 그렇게 많이 사라지진 않았더라. 실제로 고용률이 오르고 있다. 내가 틀린 거 같다라고요. 엔스로픽 CEO인 다리오 아모데이는 그 이후로 이렇다 할 코멘트를 하진 않았거든요. 그나마 5월 초에 AI가 생산성을 10열 배씩 늘려 준다 정도의 낙관만 하고 있는 모습이었죠. 유역하자면 AI가 아직 그 정도가 아니지 않나라는 흐름이 계속해서 보이고 있는 거 같고요. 다시 돌아와서 저는 초반에 4.6이라는 작년에 지원이 끊긴 모델을 사용하고 있습니다. 그럼에도 불구하고 생산성은 더 높아진다는 느낌을 받았고요. 그 이유는 실제로 AI가 잘하는 부분에 AI를 전방 배치를 하고 저는 AI가 애초에 못 하는 부분이나 좀 삐걱거린 부분에서 제가 일을 하고 있기 때문이에요. 나중에 AI가 지금 발전해서 클로드 5, 6, 7 이렇게 나온다면은 그것까지 맡길 수 있을지 모르겠으나 당장은 엄청난 변화가 있지 않은 이상이 상태로 계속 유지할 것 같습니다. AI에게 쓸데 없는 짓 그만시키고 얘가 원래 잘했던 거 시켜 보려고 합니다. 일단 AI 열심히 써 보자. 그냥 나왔으니까 써 보자. 이런게 아니라 내가 일단 일 열심히 하고이 일을 하다 보면 아, 여기는 반복이 좀 있네. 심하네. AI 한번 붙여 볼까? 붙여보고 웬만하면 잘 될 겁니다. 붙여보고 안 되면 또 다시 사람이 하고 이런 상태가 굉장히 이상적이라고 봐요. 이게 요즘 사람들이 말한 도메인 지식이랑 좀 관련이 있죠. 도메인 지식 플러스 AI가 붙으면 엄청나게 큰 효과가 난다가 이거에서 되는 거고요. 유튜브 영상 편집 같은 경우에도 AI에 많이 맡기고 있는데요. 저는 영상 편집을 이미 많이 해 봤고 실제로 영상 편집자로서 아직까지 일을 하고 있기 때문에 반복 작업이 일어나는 부분을 정확히 알고 있습니다. 여기서 숨소리 같은 거 잘라내는 거, 반복 발화 같은 거 잘라내는 거, 문구간 잘라내는 거 이런 것들은 반복 작업이라서 AI한테 지킬 수 있죠. 그런데 뭐 이미지를 선택한다거나 아니면 흐름 같은 걸 전체적으로 기획하고 잘라내고 하는 거는 인간이 해야 될 몫시고요. 정리하겠습니다. 역대 최고이 나오고 도구 막 쏟아지고 세계적인 거당들도 막 말을 바꾸고 있는 사이에 저는 오히려 AI를 조금 더 톤다운 쓰자. 프론티어 AI한테 너무 매달리지 말아라라는 얘기를 하고 싶었습니다. 이제 여러분들 당할만큼 당했잖아요. 우리 이제 프론티어 랩들이. 아, 이제 무슨 벤치마크가 뭐 300% 400% 달성했습니다. 이런 선동에 좀 당하지 마시고요. A한테 운전대 막 다 맡기지 말고 사람이 실제로 운전대를 잡고이 보소적인 역할만 AI에게 맡기는게 좋다라고 생각을 하고 습니다.