컴퓨터 비전(Computer vision)이란? 정의, 활용 사례, 방법

컴퓨터 비전(CV)의 정의와 활용 사례, 전망, 한계점 그리고 개선 방법까지

정의

컴퓨터 비전(Computer Vision, CV)은 인간 비전 시스템을 모방한 기술로써 시각적 데이터를 수집 및 분석한 후 이에 대한 결정을 내리는 기계의 기능입니다. 다시 말해, 기계는 컴퓨터 비전을 통해 이미지, 패턴 또는 개체를 감지하고 인식할 수 있습니다.

 

기술 동향

컴퓨터 비전 시스템은 이미지 처리 뿐만 아니라 구조화되지 않은 데이터를 해석하는 데에도 활용됩니다. 이는 자율주행차의 시각적 데이터 분석부터 농업용 로봇의 작물분류 까지 다양한 영역에서 혁신적으로 활용되고 있습니다.

컴퓨터 비전은 몇십 년 전부터 존재했지만 초기에는 모양이나 가장자리를 인식하는 시스템을 구축하는 데 초점을 맞췄으며, 제한된 하드웨어로 인해 한계가 있었습니다. 그러나 지난 20년 동안의 발전은 더 빠른 하드웨어, 더 나은 소프트웨어, 특히 머신러닝과 딥러닝을 통한 혁신으로 컴퓨터 비전의 가능성이 높아졌습니다.

 

활용 사례

자율주행

자율주행차의 컴퓨터 비전 활용 사례

컴퓨터 비전 기술을 통한 이미지 인식 기능은 보행자, 도로 표지판 및 경로를 식별합니다. HERE는 영상, 이미지, 텍스트 데이터를 통해 정확한 지도를 제작하는 기업입니다. 이 회사는 거리 표지판 감지 알고리즘을 통해 ML로 지원된 동영상 객체 추적 기능을 구현하고 있으며, 해당 플랫폼은 상업용 간판의 경계 상자가 있는 광학 문자 인식 알고리즘을 활용하여 비즈니스를 정확하게 식별합니다. 뿐만 아니라 HERE는 위성 이미지의 픽셀 수준 시맨틱 분할을 통해 건물에 대한 라벨링을 추가하며, 보행자 입구와 층 수 등의 세부 정보를 정확하게 기록합니다. 또한 자동차와 보행자를 추적을 위해 동영상 어노테이션 기술을 적극적으로 활용하고 있습니다. 저희 에펜이 제공하는 어노테이션 툴은 이러한 객체의 움직임을 효과적으로 추적하여 해당 객체에 대한 라벨링을 관리하는 데 있어서 모델의 향상된 기계 지원을 제공합니다.

 

의료

의료 분야에서의 컴퓨터 비전은 2019년 4억 달러에서 2025년 말까지 13억 달러로 성장할 것으로 예상됩니다. CV를 활용한 의료 영상 분석(CT 스캔 및 방사선 이미지)은 진단 및 치료 과정에서 혁신적인 역할을 수행할 전망입니다.

스탠포드 대학교의 연구에서는 피부 이미지를 통해 피부암을 정확하게 진단하는 심층 신경망을 개발했습니다. 또한 스마트폰을 사용하여 피부 상처를 촬영하고 3D 측정을 수행하는 소프트웨어도 등장하고 있습니다. 이러한 기술은 빠르고 정확한 진단을 제공하며, 비용과 시간을 절약하여 의료 현장에서의 효율성을 높입니다.

 

온라인 쇼핑몰

소매업체의 30%는 향후 12개월 동안 최신 컴퓨터 비전 기술을 도입할 것으로 예측되며, CV는 마케팅 및 검색 경험을 향상해 참여도를 높입니다. 또한 최적화된 광고 게재를 통해 안전하지 않은 콘텐츠를 식별하는 데 사용됩니다.

Shotzr는 7천만 개 이상의 이미지로 구성된 이미지 데이터베이스를 제공하는 기업으로, 마케팅 담당자를 위한 최적화된 검색 경험을 위해 에펜과 협력했습니다. 저희 에펜은 컴퓨터 비전 기술을 활용하여 다양한 카테고리에 속하는 이미지 데이터 라벨링 작업을 함께 했습니다. 이 과정을 통해 이미지는 해당 플랫폼의 검색 알고리즘에 입력되어 추천 및 검색 경험이 향상되었습니다. 결과적으로 마케팅 담당자는 보다 관련성이 높은 이미지와 콘텐츠를 찾을 수 있었고, 이로 인해 참여도가 20% 증가했습니다.

GumGum은 웹페이지 콘텐츠를 검토하고 내용에 따라 분류하여 광고주에게 가장 적합한 웹페이지를 식별하는 서비스를 제공하는 기업입니다. 광고의 관련성과 브랜드 안전성을 고려하여 운영을 확장하고 더 많은 웹페이지를 검토하기 위해 GumGum은 에펜의 지원을 받았습니다. 에펜의 어노테이션 작업자들은 웹페이지 콘텐츠 검토를 통해 유해한 콘텐츠나 사람의 얼굴, 동물 등 다양한 속성에 대한 라벨링을 작성했습니다. 또한 데이터 어노테이션 플랫폼을 활용하여 라벨링 작업을 빠르게 처리하고 고객에게 더 나은 서비스를 제공할 수 있었습니다. 또한 다양한 데이터 작업자를 활용하여 유해한 콘텐츠의 정의나 지리적, 문화적 차이에 따른 뉘앙스를 캡처하는 데도 성공할 수 있었습니다. 전 세계의 다양한 위치에서 가져온 어노테이션을 활용하여 유명인의 얼굴과 같은 콘텐츠를 더 정확하게 식별할 수 있었습니다. 결과적으로 GumGum은 광고 관련 웹페이지를 효과적으로 선별하고 서비스를 개선할 수 있었습니다.

 

소매업

로봇 공학은 컴퓨터 비전을 중심으로 한 흥미로운 AI 분야 중 하나입니다. 특히, 소매업에서는 기업들이 재고 관리를 개선하고 재고 부족이나 품절된 제품을 식별하기 위해 매장에 로봇을 도입하고 있습니다. 전 세계적으로 매년 4,480억 달러에 이르는 매출이 품절로 인해 손실되고 있다는 현실을 고려하면, CV 기술은 주요 소매업체에게 상당한 비용 절감 가능성을 제시합니다.

로봇은 이미지 어노테이션을 활용하여 객체 감지 기능을 수행합니다. 이를 통해 제품의 재고 여부를 확인하고, 광학 문자 인식을 이용하여 바코드를 스캔하고 제품 이름과 가격을 읽어내어 출력합니다. 이러한 프로세스를 자동화함으로써 인간의 감독이나 개입 없이도 신속하게 정확한 재고 정보를 얻을 수 있습니다. 이는 효율적인 비즈니스 운영과 함께 품절로 인한 매출 손실을 최소화하는 데 도움이 됩니다.

 

농업

농업 분야의 컴퓨터 비전 활용 사례

인도의 농업 기술 스타트업 Imago AI는 컴퓨터 비전 시스템을 활용하여 작물 생산량과 품질을 자동으로 측정하는 혁신적인 시스템을 도입했습니다. 이 기술은 인간보다 75% 더 빠르게 데이터를 수집하며, 정확하고 신속하게 작물의 형태와 건강을 분석합니다. 이를 통해 새로운 작물을 개발하는 데 필요한 데이터 수집 시간을 현저히 단축하고 있습니다.

또 다른 예로, John Deere는 컴퓨터 비전 알고리즘을 도입하여 농장에서의 잡초를 식별하고, 이를 통해 살충제 사용을 효율적으로 관리하고 있습니다. 이를 위해 AI는 픽셀 수준의 이미지 분할 기술을 활용하여 어떤 부분이 작물이고 어떤 부분이 잡초인지를 학습합니다. 결과적으로 농부들은 드론을 활용하여 정확히 잡초가 자라는 지역에만 농약을 적용할 수 있어, 농약 비용을 최대 90%까지 절감할 수 있었습니다.

 

보험

이미지 데이터를 통해 자동차 사고의 피해를 판단하거나 위성사진을 분석하여 산불 위험을 판단하는 AI 시스템과 같이 다양한 분야에서 컴퓨터 비전이 적용되고 있습니다.

작동 원리

​컴퓨터 비전은 머신러닝과 딥러닝 방법을 사용합니다. 전통적인 머신러닝은 작은 응용프로그램을 프로그래밍하여 이미지에서 패턴을 식별하는 방식으로 작동하며, 통계 학습 알고리즘이 이미지를 분류하고 객체를 감지합니다.

딥러닝은 머신러닝과는 다른 방식으로, 주어진 사례에서 패턴을 식별하여 문제를 해결하는 신경망에 기반합니다. 이때, 신경망은 다양한 사례를 통해 물체를 식별하는 방법을 학습하게 됩니다. 현재 대부분의 컴퓨터 비전 프로그램은 딥러닝 기술을 사용합니다.

 

접근법

컴퓨터 비전은 이미지를 처리하고 해석하기 위해 머신러닝을 사용합니다. 모델을 학습할 때에는 고품질 이미지 데이터가 필요한데요, 이때 여러 가지 주요 접근 방식 중 하나 또는 두 가지 이상의 조합을 사용하여 정확도를 높일 수 있습니다.

  • 인식(Recognition): 이미지에서객체를인식하고해석합니다. 예를들어, 자율주행차에서정지신호를식별하는것이인식에포함됩니다.
  • 재구성(Reconstruction): 시각적데이터를사용하여여러유형의움직임을감지하고이미지의다양한관점을인식합니다.
  • 등록(Registration): 서로다른데이터셋을하나의좌표계로변환합니다.
  • 분류(Categorization): 이미지의범주를그룹화하고분류합니다.

 

컴퓨터 비전 프로젝트에 접근하는 핵심은 확장 가능하고 자동화된 모델 파이프라인을 구축하는 것입니다. 쉬운 이해를 위해 자율 주행 자동차를 예로 들어 접근 방법을 설명해 보겠습니다.

1.비즈니스 문제 정의

  • 기업에가치를제공할명확한비즈니스문제를정의합니다. 이때, 자율주행자동차의경우, 수익증대나경쟁우위확보등을가치로선정할수있습니다.
  • 프로젝트에관련된이해관계자를인식하고컨펌을받습니다.
  • 프로젝트에투자할리소스의우선순위와수준을평가합니다.

2. 데이터 준비

  • 데이터준비는수집, 정리, 분할, 라벨링달기, 처리, 분석등의단계를포함합니다.
  • 데이터거버넌스절차를구현하여보안문제를모니터링합니다.
  • 자율주행자동차의경우, 카메라, LiDAR, RADAR와같은센서에서수집된데이터를중앙저장장치로이동시킵니다.

3. 모델 구축

  • 준비된데이터와하이퍼파라미터를사용하여알고리즘을학습합니다.
  • 특징추출을최적화하고출력을분석하며, 원하는정확도에도달할때까지모델을재교육합니다.
  • 초기모델을사용하여 A/B 테스트를실행합니다.
  • 원하는모델을얻기위해서는수백또는수천번의반복이필요할수있습니다.

4. 배포

  • 챔피언모델이정의한비즈니스문제를해결하고의도한가치를제공하는지평가합니다.
  • 모델이준비되면기존비즈니스프로세스와통합하고배포합니다.
  • 배포후모델의성능을계속모니터링하고측정할수있는도구를마련합니다.

5. 능동 학습 및 튜닝

  • 모델이배포된후에도지속적인업데이트와모니터링이필요합니다.
  • 인간참여형(Human-In-The-Loop) 접근 방식을 통해 모델 드리프트를 완화하고 정보와 성공 모니터링을 제공합니다.
  • 모델예측의편향을지속적으로확인하고필요한경우모델에피드백을제공합니다.
  • 자율주행자동차의경우, 도로상황의변화에대응하기위해지속적인 AI 업데이트가필요합니다.

 

한계와 개선 방법

컴퓨터 비전의 한계와 개선 방법

컴퓨터 비전을 효과적으로 훈련시키기 위해서는 엄청난 양의 고품질 학습 데이터가 필요합니다. 블루베리가 잘 익었는지를 판별하는 것과 같은 간단한 판단도 적절한 학습 데이터 없이는 불가능하죠. 학습 데이터의 품질과 다양성은 컴퓨터 비전 시스템이 다양한 작업에 대해 정확한 판단을 내릴 수 있도록 결정적인 역할을 합니다.

컴퓨터는 사람이 아니기 때문에 여전히 이미지 내의 모든 맥락이나 실제 상황을 이해하는 데 한계가 있습니다. 따라서 이미지 어노테이션 작업은 여전히 사람이 수행해야 합니다. 학습 데이터에는 적절한 라벨링이 지정되어 있어야 하며, 이는 이미지나 동영상의 마크업 및 라벨링을 신속하게 제공하는 숙련된 데이터 작업자 및 툴의 도움이 필요합니다. 예를 들어, 앞서 언급했던 Imago AI는 위치, 날씨, 기타 기준에 대한 데이터로 태그 된 이미지 데이터베이스를 활용하여 농부들이 가장 적합한 작물을 선택하고 생산량을 예측할 수 있도록 지원하고 있습니다.

컴퓨터 비전은 다양성과 윤리적 AI에 관한 주요 고려 사항을 다뤄야 합니다. 다양성 부족으로 인해 CV 기술에서 격차가 발생한 사례도 있습니다. 최근에는 안면 인식 AI에서 인종 차별이 발견되는 등 다양성의 중요성이 강조되고 있습니다. 실제 데이터의 다양성이 부족하면 모델이 특정 그룹에 대해 편향될 수 있습니다. 이처럼 수집된 데이터의 다양성 부족은 모델이 다양한 상황에서 작동하는 데 어려움을 초래할 수 있습니다. 이를 극복하기 위해 다양한 작업자 풀을 사용하여 광범위한 관점을 수집하는 것이 중요합니다.

하지만 기업에서 직접 라벨링 된 이미지의 데이터셋을 구축하려면 상당한 시간과 리소스가 필요합니다. 이러한 문제를 해결하기 위해 데이터 수집 및 어노테이션 작업을 외부 데이터 전문 기업에 아웃소싱하는 것은 효과적인 전략일 수 있습니다. 저희 에펜과 같은 데이터 통합 서비스 제공업체는 고품질 이미지 어노테이션 데이터를 빠르게 생성할 수 있으며, 이를 통해 고객은 핵심 IP에 집중하고 알고리즘을 개선할 수 있습니다.

 

데이터셋 수집 방법

프로젝트에 적합한 데이터셋을 생성하기 위해서는 특정 사용 사례 시나리오에 관한 실제 이미지 데이터를 수집해야 합니다. 기존의 오픈 소스 데이터셋을 활용할 수도 있지만 특정 사용 사례에 관련된 데이터 수집을 통해 관련성을 높이는 것이 가장 중요합니다. 이때, 컴퓨터 비전 솔루션을 훈련하기 위해서는 수천 개에서 수백만 개의 이미지가 필요할 수 있습니다. 단순한 분류 작업이라면 수천 개의 이미지면 충분할 수 있지만, 세분화된 카테고리를 분류하는 경우 수백만 개의 이미지가 필요합니다.

기업은 기존 데이터셋을 구매하거나 데이터 공급업체와 협력할 수 있습니다. 특정 사례의 데이터가 요구되는 경우라면 에펜과 같은 학습 데이터 전문 제공업체와의 협력을 통해 데이터 수집 및 가공 작업을 수행할 수 있습니다.

 

학습 데이터 전략

컴퓨터 비전을 위한 학습 데이터 전략

모든 머신러닝 프로젝트의 핵심은 정확한 학습 데이터입니다. 양질의 학습 데이터가 없으면 AI 모델은 신뢰도가 낮은 예측을 하게 될 수 있습니다. 따라서 AI를 구축할 때는 효과적인 데이터 관리 전략을 수립해야 합니다. 다음은 고려해야 할 항목입니다:

1.목표 설정

  • 데이터품질목표는무엇인가요?
  • 모델을학습하고조정하는계획은어떤가요?
  • 데이터요구사항은무엇인가요?

2. 데이터 수집

  • 얼마나많은데이터가필요한가요?
  • 데이터의출처는어디인가요?
  • 데이터의다양성이충분하게고려됐나요?
  • 데이터이동은어떻게이루어지나요?
  • 배포후, 어떤방법을통해데이터를지속적으로수집할예정인가요?

3. 데이터 가공

  • 어떤유형의데이터라벨링이필요한가요?
  • 어떤라벨링도구가가장적합한가요?
  • 데이터라벨링작업자는누구인가요?
  • 데이터가공시, 특정기술이나언어가필요한가요?

4. 데이터 파이프라인 및 확장

  • AI 데이터파이프라인을어떻게자동화할것인가요?
  • 휴먼인더루프를통합할계획이있나요?
  • 어떻게모델에지속적인학습을제공할예정인가요?

이러한 질문들은 고품질 학습 데이터를 준비하고 성공적인 모델을 구축 및 유지하는 데 필요한 경로를 탐색하는 데 도움이 됩니다.

 

데이터 편향을 방지하는 법

데이터 편향성은 모델의 정확성에 부정적인 영향을 미칠 수 있는 중요한 문제입니다. 편향된 데이터로 모델을 훈련하면 모델이 실제 상황을 정확하게 반영하지 못하게 됩니다. 이를 피하기 위해 다음 전략을 사용할 수 있습니다:

  • 다양한데이터 수집: 학습 데이터의 다양성을 보장하기 위해 계절, 지리적 분포 등을 고려하여 데이터를 수집합니다.
  • 변수조작: 데이터에색상, 크기, 조명등을변경하여모델이다양한환경에서도효과적으로작동하도록합니다.

이와 같이 학습 데이터의 품질을 향상하기 위해 이미지 회전, 자르기, 색상 및 조명 값 변경과 같은 방법을 사용할 수 있습니다. 에펜의 이미지 어노테이션 툴을 이러한 작업을 효율적으로 수행하며, AI가 작업자의 작업을 보조하여 효율성을 향상합니다. 또한 실제 환경에서 발생할 수 있는 모든 뉘앙스와 모호함을 식별하고 데이터를 조작하여 모델의 강건성(Robustness)을 향상하는 것이 중요합니다.

 

전망

컴퓨터 비전 전망

2025년까지 컴퓨터 비전 시장은 182억 4천만 달러의 가치를 갖추게 될 것으로 예상되며, 2026년까지 680억 달러를 달성할 것으로 예상되는 전 세계 AI 시장에서 상당한 부분을 차지합니다. 이에 따라 최근 기업들은 컴퓨터 비전 투자를 통해 결과 예측과 의사결정을 빠르게 내릴 수 있는 능력을 키우고 있습니다. 특히, AI 솔루션을 구현하기 위해 기계 처리에 사용 가능한 대량의 이미지 데이터에 의존하고 있습니다.

컴퓨터 비전은 모든 주요 산업에 걸쳐 넓은 사용 범위를 가지며, 우리의 일상에서 빠르게 통합되고 있습니다. 그러나 이는 머신러닝에서 가장 어려운 문제 중 하나이기도 합니다. 이에 따라 기업은 모델에 적절한 양의 학습 데이터가 지속적으로 제공되도록 하는 등의 기본 프레임워크를 개발하고 있습니다. 컴퓨터 비전 애플리케이션은 계속해서 발전하며, 데이터 가용성과 컴퓨터 처리 능력이 증가함에 따라 더욱 강력한 기능을 제공할 것으로 예상됩니다.

 

인사이트

  1. 성공 기준 정의하기: 프로젝트를 시작하기 전에 성공 기준을 정의하세요. 이는 주로 명확한 수학적 측정 기준을 포함합니다. 예를 들어, 객체 감지 프로젝트의 IoU이나 객체 추적 프로젝트의 MOTA 등을 기준으로 잡을 수 있습니다.
  2. 세부 사항 시각화하기: 핵심 지표 외에도 과학자들은 실험을 추적하고 잘못된 매개 변수로 인한 문제를 이해하기 위해 세부 사항을 시각화해야 합니다. 잘못된 매개 변수는 일부 시각 아티팩트로 이어지는 경우가 많기 때문에 컴퓨터 비전 프로젝트에서 시각화는 정확도가 높아야 합니다. 저희 에펜은 작업 레벨에서 픽셀 레벨에 이르는 모든 수준의 시각화를 활용합니다.
  3. 인간과 기계의 추론 결과 통합하기: 다중 인간 및 알고리즘에서 가장 좋은 판단이 가능하도록 고려하세요. 이는 불확실성을 감소시키고 응용 프로그램의 위험을 지속적으로 감소시킬 수 있습니다.

 

에펜의 컴퓨터 비전

저희 에펜은 맞춤형 데이터 어노테이션수집 서비스를 제공합니다. 또한 인공지능 데이터 글로벌 리더로서 머신러닝 및 AI 전문팀은 컴퓨터 비전 프로그램 요구에 맞는 대량의 고품질 이미지동영상 데이터를 신속하게 제공합니다.

​뛰어난 컴퓨터 비전 솔루션을 구축하기 위해서는 올바른 학습 데이터의 확보가 필수적입니다. 이때, 데이터 어노테이션은 이러한 학습 데이터를 구축하는 핵심 요소이며, 저희 에펜은 20년 이상의 경험을 바탕으로 고객의 요구에 특화된 솔루션을 제공합니다. 고품질 컴퓨터 비전 솔루션 구축, 저희 에펜과 함께 하세요.

에펜의 컴퓨터 비전 문의하기

Language