"최근에 인공지능 '초거대 AI' 이야기 많이 나옵니다. 2015년 처음으로 사람보다 이미지 인식을 더 잘하는 AI 모델이 공개가 됐습니다. 그 때 학습했던 데이터의 양이 한 100만 장 조금 넘었어요. 최근에 나오는 연구들을 보면 일단 모델 크기가 한 100배 이상이 되고요. 이미지 인식 관련해서 학습하는 데이터 양이 30억 장이 넘습니다. 무려 수천 배 이상 커졌죠 모델도 커지고 데이터도 커지고 있습니다."
"자연어 언어를 이해하는 모델도 마찬가지여서 요즘 핫하다고 하는 GPT3 들어보신 분 혹시 계신가요? 네 아이고 훌륭하십니다. 네 크게 되실 거예요. 네 반짝이는 도시인님 좋구요.GPT3가 이 모델이 크기가 엄청 큽니다. 기존에 나와 있는 이전 모델들보다 거의 천 배 이상 커졌죠. 문제는 데이터가 엄청 커진겁니다. 정답 달아주고 학습하라 그러면 이 데이터들마다 정답을 달아줘야 되는 이슈가 생깁니다."
"자, 이미지 10억 장에다가 이 이미지 안에 있는 물체는 사람들이 다 정답을 단다면 너무힘들죠 그래서 나온 방법이 사람이 이미지에 정답을 다는 게 아니라 그냥 사람이 정답을 달아주지 않고도 임의로 정답을 만드는 방법을 씁니다. 그것이 자가 지도 학습 혹은 셀프 슈퍼바이즈드 러닝이라고 하는 방법이구요."
"방법을 설명해 드릴게요. 사진을 그냥 임의로 90도를 돌리든 혹은 170도를 돌려놓고 AI 모델한테 이 사진 몇 도가 돌아갔을까? 맞춰보라 라고 하면 됩니다. 그럼 사람이 정답을 안 달고도 어떤 답이 있는 문제가 되는 거고, 그걸 가지고 열심히 학습하는 거죠. 이렇게 학습을 해도 학습이 잘 됩니다. 이런 초대규모화 되는 게 어느 정도 패턴으로 가고 있느냐 GPT3가 1750억 개 정도의 어떤 매개 변수 아까 말했던 그 연결선으로 표현이 되어 있는데요."
"마이크로소프트와 엔비디아가 함께 공개한 튜링 에너지라고 하는 AI가 있습니다. 초거대 AI크기가 5300억 개 매개면수를 갖습니다. 그 크다는 GPT3의 3배 규모입니다. 전 세계가 초대규모 AI를 위해서 달리고 있다는 얘기죠 도대체 왜 이렇게 크게 만들어요? 자원도 많이 들고 돈도 많이 들고 전기세도 많이 들고 탄소도 많이 나오는데..."
"GPT3가 쓴 글을 사람들에게 많은 사람들에게 자 이게 AI가 쓴 글일까요? 사람이 쓴 글일까요? 맞혀보세요를 했더니, 정확도가 50% 나옵니다. 둘 중에 하나 찍는 거지 않습니까? 찍어도 50%인데 열심히 고민해서 풀어도 50%예요. 사람이 구분할 수 없다라는 뜻입니다. 그만큼 글을 잘 써요. 글만 잘 쓰냐 심지어 이미지도 굉장히 생성을 잘하고요. 왼쪽 그림 보시면 그냥 녹색 시계인데 사각형 모형으로 된 거 그려봐라 했더니, 저렇게 그려줍니다. 세상에 저런 시계는 존재하지 않습니다. 오른쪽은 프로그래밍 좋아하시는 분들 계실 것 같은데, 코덱스라고 해서 AI가 프로그램을 짜줍니다. 순서대로 정렬하는 프로그램을 짜줘라고 하면, 네 그냥 그걸 하는 프로그램을 짜주는 거죠. 전 분야에서 잘 되냐 아직은 그렇지는 않구요. 테스트 단계에 있긴 하지만 어쨌든 머지않아서 사람 프로그래머랑 AI가 함께 프로그램을 만드는 시기가 오지 않을까라고 생각을 하는 거죠."
"실제로 정량적으로 봐도 결국 모델을 키우는 게 중요한 이유는 모델이 커지고 데이터가 커질 때 서로 제한을 주지 않으면 계속 커지면 커질수록 성능이 좋아지더라 혹은 지금까지 안 되던 게 되더라 라는 게 확인이 됐기 때문입니다. 그거는 어떤 언어 쪽도 마찬가지고 시각 쪽도 마찬가지고 음성 쪽도 마찬가지다 라는 게 증명이 되었죠."
"이러한 시대에 네이버 클로버는 무얼 하고 있는가? 이런 AI 기술, 열심히 연구 개발하고 서비스도 만들고 있습니다. 아무래도 스피커에 많이 친숙하실 것 같은데, 특히 최근에 어떤 저희가 전 세계 최초 책을 대신 읽어주는 램프라고 하죠. 클로바램프 많은 분들이 좋아하시고요. 아마 어린이분들 어린이가 집에 있는 분들 많이 도움을 받고 있는 것으로 알고 있습니다. 심지어 저도 굉장히 도움을 많이 받고 있어요."
Copyright © Gwangju Munhwa Broadcasting Corporation. All rights reserved.
보도본부 디지털뉴스팀장
