Docs |
Src
| A- | A+
| -/-
Metadata
(요약) [칼럼] 우리는 AI의 실수를 얼마나 잡아낼 수 있나
- 대형언어모델(LLM)은 오류가 있어도 망설임 없이 틀린 답을 유창하게 내놓는 기술임.
- 저자는 한국 시도별 김 생산량을 지도로 시각화하려다 복잡한 수작업이 필요함을 깨달음.
- 인공지능 소프트웨어에 그림 생성을 요청하자 1분 만에 우아하고 깔끔한 결과물을 제공함.
- 그러나 충청북도에 색깔이 칠해져 있는 것을 발견하고, 바다가 없는 지역이라 오류임을 확인함.
- 전체적으로 그럴 듯해 보이지만 군데군데 틀린 곳이 있어 정확한 결과를 위해서는 전수 검토가 필요함.
- LLM은 얼핏 보기에 그럴 듯해 보이도록 내용을 꾸며서 보여주기 때문에 내용 전체를 덜컥 믿게 됨.
- 환각 현상은 줄어들었지만 전체적으로 그럴 듯하면서 사이사이 잘못된 결과가 끼어 드는 사례는 여전함.
- 이는 LLM이 자연스러워 보이는 대화를 이어가는 것을 목적으로 개발된 기술이기 때문임.
- 과거 SF 속 로봇은 감성적인 말은 못 했지만 수치와 사실은 정확했으나 LLM은 그 반대임.
- LLM은 감성적인 문장이나 창의적인 표현에 더 좋은 성능을 발휘할 때가 많음.
- 따라서 정리나 분석 작업을 시킬 때는 계산이나 사실 관계의 오류를 검토하는 대책이 필요함.
- LLM 서비스 접속 시 "실수를 할 수 있습니다. 중요한 정보는 재차 확인하세요."라는 경고가 있음.
- 인공지능을 조직적으로 활용하는 곳에서는 오류 찾기와 재검토를 위한 별도의 수단을 마련하기도 함.
- 검토가 쉬운 내용이나 세부 사항이 중요하지 않은 작업에 LLM을 쓰는 편이 좋음.
- 사람들은 인공지능의 말을 사람의 말처럼 받아들이는 습관 때문에 오류를 쉽게 믿게 됨.
- 사람은 잘 아는 분야일수록 자신감 있게 말하지만, LLM은 믿을 수 없는 자료여도 망설이지 않고 답을 줌.
- LLM이 빠르고 자신감 있는 말투로 답을 주면 그만큼 더 믿을 만하다고 착각하게 됨.
- 실제로 맛집 추천이나 세금 처리 문제에서 LLM의 잘못된 정보를 믿었다가 문제가 발생한 사례가 있음.
- 변호사들이 LLM이 제시한 세상에 없는 판례를 믿었다가 문제가 된 사건들이 미국, 호주, 한국에서 발생함.
- 인공지능이 피지컬 AI 형태로 현실 세계에 적용될 경우 오류 예방은 더욱 중요해짐.
- 수백 톤 물건을 운반하는 로봇 팔이나 자율주행 자동차의 오류는 막대한 피해를 초래할 수 있음.
- 한국은 산업용 로봇 안전 검사 기준을 통해 비상정지 장치 등에 대한 규정을 갖추고 있음.
- 비상정지 장치는 눈에 잘 뜨이는 모양, 전기 직접 차단 방식, 임의 재작동 방지 등을 원칙으로 함.
- 그러나 전시회 로봇이나 스마트폰 인공지능 오류 발생 시 즉각적인 정지 수단은 부족한 상황임.
- 클라우드나 가상화 서버에서 작동하는 인공지능은 사용자 손이 닿지 않는 곳에서 문제를 일으킬 수 있음.
- 결론적으로 오류에 대한 대책에 더 많은 투자와 경쟁이 필요함.