AI를 배워가는 과정들이 대기업 위주에서 이제는 중견 중소기업까지 확산되고 있다. 그만큼 AI에 대한 인식이 높아져 잘 이해 하고 있다는 방증이다. 제조나 산업 분야에서는 AI를 도입하고자 할 때 어떤 부분들을 고려하면 되는지 살펴보고, 그런 측면에서 마키나락스의 솔루션과 서비스를 소개하고자 한다.
AI 기술은 놀라운 속도로 발전하고 있다. 2016년 전만 해도 AI가 글자나 이미지 등을 인식하는 정도의 수준까지 오는데 약 10년이 걸렸다면 2016년 이후엔 사람의 인식 능력을 따라 잡는데 2~3년 밖에 걸리지 않을 정도로 급속히 빨라지고 있다. 이게 가능할 수 있었던 이유는 AI를 활용할 수 있는 기반 기술들이 성장했기 때문이다. AI를 잘 하려면 여러 가지 데이터 특성들을 분류할 수 있게 모델 사이즈가 커져야 하는데, 최근 강력한 컴퓨팅 파워를 보유한 기업들이 등극하며 산업적으로 기술적으로 성장하면서 연간 10배 정도 모델 사이즈가 커지고 AI 성능도 크게 향상되고 있다.
제조 산업과 AI
바야흐로 AI 시대가 시작됐다. 그렇다면 제조와 산업에서 AI는 어떻게 활용되고 있을까? 제조 산업은 상대적으로 ICT나 IT 산업보다 AI 활용도가 높지 않다. 그러나 AI에 대한 기대는 매우 높은 편이다. 월드 이코노믹 포럼에서 발표한 설문 결과에 따르면 2030년까지 산업 전반에서 AI 및 분석이 창출할 수 있는 잠재적 연간 가치 총액이 6.7T 달러였다. 또 제조기업 대다수 경영진들은 앞으로 AI가 핵심적인 경쟁력을 만드는 도구가 될 거라고 전망하고 있다. 그러나 실제로 AI 관련해서 당초 생각했던 목표를 성공적으로 달성한 기업의 비율은 16%로 여전히 낮다. 2020년에만 해도 10% 미만이었던 점과 비교하면 높아지긴 했지만 다른 산업에 비해서 여전히 AI 활용도가 낮은 상황이다.
그 이유는 제조 산업이 갖는 유니크한 환경에 기인한다고 볼 수 있다. 서비스 기업의 경우라면 챗GPT와 같은 AI를 활용한 애플리케이션을 많이 이용하겠지만, 제조 산업은 그런 형태로 AI를 활용하기에는 한계가 존재한다. AI로 풀고자 하는 문제가 기업마다 다르고, AI를 적용해야 하는 환경 또한 제각각이기 때문이다. 따라서 제조 산업에 들어가는 AI 모델은 개발 시 일반적인 AI 모델보다 깊은 도메인 지식이 필요하다. 또한 AI 모델을 제조 현장에 적용하려면 기존 시스템과의 연동 및 호환이 되어야 하고 이것들을 확산하기 위해서도 기업 특성이나 비즈니스 로직에 맞는 다양한 배포 방식과 환경이 필요하다.
그러면 AI를 잘 활용하기 위해서는 어떠한 것들이 필요할까? 첫째는 데이터다. AI가 최신 기술이라고 하지만 결과적으로는 데이터 정보들을 활용해서 인사이트를 주는 것들이기 때문에 데이터가 가장 중요하다. 둘째는 이 데이터로 우리가 원하는 모델을 만들고 운영할 수 있는 ML 인프라스트럭처를 갖춰야 한다. 마지막으로는 이런 환경에 올려서 인사이트를 도출할 수 있는 목적이 특화된 AI 모델이 필요하다.
여기서 이해를 돕기 위해 ML 인프라스트럭처와 특화된 AI 모델에 대해서 좀 더 살펴보겠다. 먼저, ML 인프라스트럭처란 뭔가? 다소 생소할 수도 있지만, 이와 관련해 최근 나온 키워드가 ML Operation (MLOps)이다. 실제로 우리가 데이터를 받아서 분석해보니 상관관계가 어떻게 나오고 이걸 가지고 예측을 해보면 어떤 결과 값이 나온다. 그리고 이런 단계를 넘어서서 반복적으로 분석할 수 있는 모델을 개발하여 현장에 서비스로 이용할 수 있도록 하기 위해서는 다양한 소프트웨어들이 필요하다. 우리가 알고 있는 인공지능 모델이나 딥러닝 모델은 그 중 일부에 불과하다. 다른 많은 부분들이 갖추어져 있어야 ML 모델을 실제 데이터에 넣어서 현장에 활용할 수 있다.
그러면 MLOps란 뭔가? MLOps는 쉽게 말해 머신러닝 모델을 운영하고 ML 라이프 사이클을 관리하여 기업이 AI의 비즈니스 잠재력을 극대화할 수 있도록 지원하는 인공지능 운영 체계이다. 그렇다면 MLOps가 반드시 필요한 것일까? 만약 한두 개 정도 모델을 개발해 서비스하는 것이 AI 모델 활용의 한계라면 이러한 복잡한 운영도까지 고려할 필요가 없다. 데이터를 계속 축적하고 있고 그 데이터로 다양한 모델을 만들고 모델을 지속적으로 업데이트 할 수 있다면 결과적으로 이러한 과정이나 체계에 투자하는 것이 오히려 전체적인 ROI를 높이는데 도움이 될 것이다.
많은 분석 결과들이 ML 모델의 현 시스템에서는 전문가들의 소유물이었다. 전문 분석가들이 데이터를 분석해서 머신러닝 모델을 만들고 그 만든 모델을 배포하여 시스템을 만들게 되는데, MLOps가 없는 상황에서 ML 모델 혹은 AI 모델 활용도는 결과적으로 개개인 역량들의 한계에 부딪치게 된다. 복잡하게 얽힌 이해 관계자들이 협업하는 과정에서 체계가 갖춰져 있지 않은 상황이라면 특정 전문가나 시스템의 부재가 결국은 AI 모델 활용의 한계가 되기 때문이다.
MLOps는 이런 부분들을 일정 역량에 기대하지 않고 체계적으로 만들어서 시스템화하는 운영 체계이다. 자동화하는 부분이 결국은, 많은 도메인 지식을 갖고 있는 특정 전문가들이 산업과 제조업의 퀄리티를 결정짓는 것을 넘어서서 체계적으로 관리하고 전체적인 생산성을 높이는 쪽으로 접근을 하게 되는데, AI를 개발하고 운영하는 프로세스들도 이런 체계를 적용해서 개개인의 역량이 아닌 시스템의 역량을 높이고자 하는 것이 MLOps의 지향점이라고 할 수 있다.
MLOps 플랫폼 ‘런웨이’
엔터프라이즈 AI 기업 마키나락스는 MLOps 플랫폼 ‘런웨이’를 개발하고 현장 구축에 주력하고 있다. 이 플랫폼의 특장점은 데이터 사이언티스트와 머신러닝 엔지니어에 높은 자유도를 제공함으로써 다양한 유형의 ML 모델을 쉽게 개발하도록 지원한다.
MLOps를 개발하는 사람들은 보통 파이썬 주피터 노트북을 가지고 데이터를 분석하고 개발하게 되는데, 이런 플랫폼에 제품을 쓰게 되면 제품에서 강제하는 방식으로 모델을 개발해야 한다. 그러다 보니 성능을 도출하는데 한계를 느끼게 된다. 마키나락스의 제품은 기존 사용하던 주피터 그대로 활용하면서 어렵게 만들어진 코드들을 소프트웨어 형태로 자동으로 변화해주는 기능들을 가지고 있다.
여기에 그치지 않고 시티즌 데이터 사이언티스트 대상으로도 노코드(no code) 및 로우코드(low code) 활용을 지원한다. 산업 현장에는 ML 모델을 만들기 위해 전문 인력들을 수급하는 데는 한계가 있다. 설령 전문 인력들이 있어 데이터 분석이나 머신러닝 코드를 잘 만들더라도 현장에 대한 노하우는 부족한 것이 현실이다. 반대로 현장에 대한 노하우가 많은 사람들은 데이터 전문가가 아니기 때문에 코드 레벨을 다루지 않고도 쉽게 ML 모델을 만들고 싶어 한다. 마키나락스의 ‘런웨이’는 데이터 전문가가 아니어도 노코드 및 로우코드 기반으로 일종의 프로세스를 만들어 학습된 모델을 개발할 수 있도록 지원한다.
또 이렇게 해서 AI 모델이 만들어졌다면, 만들어진 모델을 잘 운영하는 것도 되게 중요하다. 운영에는 수평 전개뿐만 아니라 특정한 기준으로 데이터를 재학습해서 모델의 성능을 업데이트 하는 일도 포함되는데, ‘런웨이’는 그런 운영을 복잡한 소프트웨어를 모르더라도 드래그 앤 드롭만으로 진행할 수 있도록 제공한다. 그 외에도 머신러닝이나 딥러닝, 혹은 AI 전문지식이 없더라도 쉽게 AI 운영과 유지보수를 할 수 있는 편의성도 갖췄다.
사례
마키나락스는 MLOps 플랫폼 ‘런웨이’ 외에도 다양한 산업 분야에서 활용되고 있는 여러 가지 AI 모델을 개발한 경험을 가지고 있다. 이 경험들을 바탕으로 중소·중견 기업들이 AI를 도입하는 시점에서 고민하는 부분들을 해결하기 위해 노력하고 있다. 한 가지 사례를 소개한다.
산업용 로봇의 이상탐지 사례다. 산업용 로봇은 자동차 공장을 포함해서 여러 제조 공장의 자동화에 많이 적용된다. 산업용 로봇은 특성상 잘 고장이 나지 않는다. 로봇 자체에는 여러 가지 알람 조건들이 있다. 그런데 이 각각의 알람 조건들은 개별 데이터들을 가지고 상한치를 넘어서느냐 넘어서지 않느냐를 가지고 판단하게 된다. 실제로 도메인 전문가들이 알람 정보를 활용하는 방식들은 하나의 알람 정보만 가지고 활용하는 것이 아니라 여러 가지 알람을 복합적으로 해석해서 이상징후가 있는지를 판단하게 된다. AI 강점이 그런 부분들인데, 기존에 알람 정보가 잘 나온다 하더라도 이것들을 마치 도메인 전문가들이 하는 것처럼 복합적으로 다차원 해석해서 상태가 어떤지를 얘기해주는 기능들을 하게 된다.
마키나락스가 만든 AI 솔루션은 진동센서 등 추가적인 센서 없이 로봇에서 제공되는 데이터를 활용해 감속기나 엔코더와 같은 구동부의 고장을 사전에 탐지하고, 이 로봇이 티칭되어 있는 동작을 정상적으로 하고 있는지 부하가 증가되고 있는지 혹은 동작 품질의 이상 상황이 발생하는지 등을 복합적인 데이터 분석을 통해서 알려 준다.
현재 자동차 2개 공장에서 가동되고 있는 240대 로봇에 시범 적용되고 있다. 실제로 고장을 사전 탐지하고 동작 품질을 줄여서 사이클 타임을 줄이는 일을 하고 있다.
모델 개발부터 운영까지
그러나 이러한 AI 모델을 만드는 과정은 생각보다 매우 복잡하다. 마키나락스가 밟았던 과정을 보면, 먼저 데이터를 받아서 하드웨어에 저장해 가지고와 전문 분석가들이 분석을 하게 된다. 오프라인 데이터를 분석해 보면 기존 방식 대비 유의미한 결과를 얻게 되고, 고장 데이터와 정상 데이터를 잘 분류할 수 있다고 확신을 얻게 된다. 이런 확신을 가지고 다음 단계로 넘어가게 되는데. 실 데이터를 기반으로 만들어진 모델을 확장 적용해 보면 대부분의 경우 오프라인 데이터에서 했던 거와 같은 결과들을 만들기가 어려운 부분들이 나온다.
그림 2를 보면 윗부분이 이상적인 데이터를 나타낸다. AI 모델이 여러 가지 데이터를 해석해서 일종의 이상 점수를 출력하게 되는데 정상 상태에서는 이상 점수를 낮게 출력하다가 고장이 다가오면서 이상 점수가 높아진다. 그런데 실제로 마키나락스가 100대 로봇의 과거 실제 운영 데이터를 가지고 AI 모델을 학습했던 결과를 보면 아래 그림의 데이터를 보게 되는 경우가 많았다. 이것은 활용할 수 없는 모델이 된다. 그 원인은 실 데이터들은 오프라인에서 받는 데이터들보다 노이즈가 훨씬 많고 복잡하기 때문이다. 데이터를 잘 해석하는 관점에서 여러 가지 메타 정보들이 필요한데 과거 데이터를 볼 땐 메타 정보를 잘 알고 있기는 하지만, 실시간 기반 데이터를 분석하는 메타 정보는 사전에 알기는 매우 어렵다. 그리고 이런 데이터들을 검증해서 모델을 개선할 수 있는 프로세스나 피드백 루프들을 구하는 거 자체가 어렵다.
마키나락스가 그랬듯이 많은 부분들이 어찌됐든 문제를 해결하게 된다. 그러나 일정 정도의 기준을 정해서 성능을 검증하고 성능을 확인하게 되면 또 다른 도전이 기다린다. AI 모델을 개발하는데 들어간 비용이 얼마고 현장에 적용했을 때 비즈니스 임팩트는 어떻게 나오는지 등 말이다. 고장 예지는 고장 자체가 잘 발생하지 않기 때문에 고장이 매우 중요하지 않는 이상은 ROI가 대부분 잘 나오지 않거나 고장을 검증할 수 있는 방법을 찾기가 어렵다. 고장이 많이 발생한다고 하면 AI 모델을 도입하는 것보다 라인 자체를 리뱀핑(Revamping) 하는 게 났다. 안정화된 상태에서 예상치 못한 고장을 잡는 것이 목적인데, 그런 고장 하나를 잡아서 생산성 손실이 5억이 나고 AI 모델을 만들고 배포하는데 3~4억이 든다면 유의미한 접근은 아닐 것이다. 마키나락스 역시 이런 도전에 직면했을 때 비즈니스적으로 유의미한 솔루션인지를 고민했다. 그런데 이런 한계를 극복할 수 있는 사람은 도메인 전문지식을 갖고 있는 분들이다.
도메인 전문가들이 처음에는 어떤 데이터를 분석해서 어떻게 해결해야 하는지를 잘 알지 못하기 때문에 어떤 비즈니스 밸류를 만들지에 대한 아이디어를 내는 데 한계가 있었다. 그러나 이런 과정들을 거치면서 도메인 전문가들은 AI 문제 해결 방식을 이해하여 도입 효과를 높일 수 있는 새로운 아이디어를 제시할 수 있다.
앞서 예로 든 마키나락스의 산업용 로봇 적용 사례를 보면, 자동차 공장에는 산업용 로봇들이 좌우 대칭으로 동작하게 된다. 일관된 동작을 하기 때문에 데이터 분포가 같아야 한다. 그런데 같은 동작을 했음에도 불구하고 각 축별로 데이터 분포가 다르게 나오는 경우를 보게 된다. 이것은 부하가 많이 걸리거나 잦은 티칭 변경으로 인해서 최적화된 티칭 동작들을 하지 않고 다른 동작을 하기 때문이다. 이렇게 되면 인터락을 유발하거나 사이클 타임을 길게 만드는 원인이 된다. 도메인 전문가들이 이러한 인사이트를 해결할 수 있는 MLOps를 빠르게 적용해서 성능을 구현하고 시각화한다면 단순히 고장 탐지를 넘어서서 정상 범위에서 로봇이 잘 작동하는지를 검증하는 또 하나의 비즈니스 목표가 만들어지게 되고, 이게 잘 적용 확대되면 더 많은 데이터를 얻을 수 있게 된다. 또 이러한 데이터를 활용해서 신기술 적용을 통한 AI 모델 고도화라는 선순환 구조가 만들어지게 된다.
AI 솔루션 ‘MRX·ray’와 ‘MRX·CtRL’
산업 현장의 AI 문제는 크게 두 가지 형태로 분류된다. 하나는 데이터를 가지고 데이터의 분포가 이상적으로 나오는지를 탐지하는 문제와, 또 하나는 데이터 분포의 이상이 아니라 여러 가지 시나리오 중에서 좋은 시나리오를 찾는 문제이다.
마키나락스는 전자의 문제를 해결하기 위해 산업장비 종합관리 AI 솔루션인 ‘MRX·ray’를 내놓았다. MRX·ray는 수년간 검증된 마키나락스의 머신러닝과 딥러닝 기술을 활용해 고객 상황에 적합한 모델을 개발하고 쉽게 사용할 수 있는 머신러닝 운영 환경을 통합하여 사용자 친화적인 데이터 및 분석 결과 시각화 기능을 제공한다.
또한 후자를 위해서도 ‘MRX·CtRL’을 출시해 공급하고 있다. MRX·CtRL은 공정과 제조 환경에서의 최적 제어를 위한 인공지능 기반 솔루션으로 산업 현장의 에너지 효율화, 목표 생산량 및 요구 조건 달성을 위한 최적의 제어로직을 제공한다.
오토메이션월드 임근난 기자 |