전이 학습(Transfer learning)이란? 정의, 종류, 장단점, 단계

2023/09/19

인공지능에 사용되는 대표적 학습 방법

대부분의 AI는 지도 학습을 통해 구축됩니다. 지도 학습(Supervised Learning)은 입력한 데이터와 정답이 되는 데이터에 대한 레이블을 사용하여 모델을 훈련시키는 머신러닝의 한 방법입니다. 이는 대규모 데이터셋에 액세스 할 수 있는 기회와 컴퓨팅 능력의 증가로 함께 발전해 왔으며 인공지능 개발의 핵심이 됩니다. 그러나 리소스 부족으로 인해 많은 AI 프로젝트가 성과를 내지 못하는 경우도 있기 때문에 지도 학습보다 더 효율적인 방법을 찾는 것이 중요해지고 있습니다.

전이 학습의 정의

전이 학습(Transfer Learning)은 효율성을 높이면서도 품질을 유지할 수 있어 최근에 주목을 받고 있는 머신러닝 기술 중 하나입니다. 또한 전이 학습은 자체 학습 데이터를 활용하고 사전 학습된 모델을 활용하여 기존 모델을 최적화하는 방법으로, 처음부터 데이터 작업을 시작할 필요가 없기 때문에 초기 투자 비용을 낮출 수 있습니다. 따라서 전이 학습은 AI 프로젝트 구축 시간을 단축하며 앞으로 더 다양한 응용 분야에서 활용될 가능성이 큽니다.

전이 학습은 사전 학습된 모델을 다른 관련 작업을 해결하는 데도 활용됩니다. 사전 학습된 모델은 새로운 작업에 대해 완벽한 정확도를 제공하지 않을 가능성이 높기 때문에 특정 사용 사례에 맞게 조정이 필요합니다. 예를 들어, 고양이를 식별하기 위해 훈련된 모델이 있다고 가정해 보겠습니다. 이때 전이 학습을 활용하면 해당 모델을 재사용하고, 그것을 파인튜닝하여 살쾡이를 식별하는 작업에 활용할 수 있습니다.

전이 학습은 기존 모델의 지식을 새로운 작업에 적용함으로써 효율성을 높이고 더 빠른 학습과 성능 향상을 이끌어내는 중요한 방법 중 하나입니다. 이를 통해 머신러닝의 적용 범위가 확대되고 다양한 응용 분야에서 유용하게 활용될 수 있습니다.

전이 학습과 파인튜닝 차이

전이 학습과 파인튜닝 두 가지 모두 딥 러닝에서 사전 훈련된 모델을 활용하기 위한 방법으로 사용됩니다. 하지만 이 두 가지 방법은 접근 방식에서 다른 특성을 나타냅니다. 전이 학습은 사전 학습된 모델을 그대로 활용하여 새로운 작업에 맞는 일부 레이어만을 학습하는 데 중점을 둡니다. 특징 추출기 역할을 하는 고정된 사전 학습된 레이어를 사용하여 새로운 작업에 대한 출력 레이어만 학습합니다. 반면, 파인튜닝은 전이 학습의 일환으로, 사전 학습된 모델의 전체 또는 일부를 새로운 작업에 맞게 재학습합니다. 모델의 특정 레이어를 파인튜닝하여 새로운 작업에 더 적합하도록 합니다.

전이 학습과 파인튜닝 모두 AI 모델 학습 시간을 단축하고, 작은 데이터셋으로도 높은 성능을 얻을 수 있게 해 준다는 장점이 있습니다. 둘 중 어떤 방식을 사용하느냐는 해결하고자 하는 문제의 복잡성이나 가용 데이터 양, 보유한 자원에 따라 달라질 수 있습니다.

전이 학습의 단점

전이 학습은 제대로 실행되지 않거나 사전 학습된 모델이 학습한 도메인과 새로운 도메인이 크게 다를 경우, 학습 성능이 오히려 저하되어 부정적 전이로 이어질 수 있다는 단점이 있습니다. 이에 따라 전이 학습을 위한 작업 선택과 지식 공유 방법은 학습의 잠재력을 최대한 발휘하는데 매우 중요합니다.

또한 양이 많지 않은 데이터로 사전 학습된 모델을 파인튜닝할 때, 모델이 새로운 데이터에 과적합될 수 있습니다. 따라서 모델을 학습할 때는 고품질의 충분한 데이터가 꼭 필요합니다.

사전 학습된 모델은 많은 데이터를 담고 있기 때문에 매우 크고 복잡할 수 있습니다. 따라서, 리소스가 제한된 환경에서는 사용하기 어려울 수 있습니다. 이를 해결하기 위해서는 모델 압축이나 경량화가 필요할 수 있습니다.

전이 학습의 장점

머신러닝 모델을 처음부터 구축하고 학습하는 작업은 상당한 리소스와 노력을 필요로 합니다. 이 작업에는 고도로 전문화된 데이터 사이언티스트와 머신러닝 전문가로 이루어진 팀, 도메인 전문 지식을 보유한 데이터 어노테이션 작업자, 대량의 데이터 수집라벨링 지정, 알고리즘 개발과 프로그래밍, 훈련 및 테스트, 배포, 프로덕션 모니터링 등 다양한 작업이 포함됩니다. 이 모든 과정은 시간과 비용이 많이 들며 전반적으로 머신러닝 모델을 처음부터 구축하는 데 막대한 자원이 소비됩니다.

반면에 전이 학습은 시간을 절약하면서 원하는 성능을 유지할 수 있는 효율적인 대안입니다. 사전 학습된 모델을 활용함으로써 전체 데이터셋에 라벨링 할 필요가 없다는 장점도 있습니다. (단, 일부 데이터에는 여전히 라벨링이 필요할 수 있습니다.) 따라서 이러한 모델을 사용하면 데이터 사이언티스트나 머신러닝 전문가를 고용하지 않아도 되는 경우가 있습니다. 이는 AI 및 ML 분야에서 기술 격차를 줄이는 데 중요한 역할을 할 수 있습니다.

전이 학습은 작업에 사용 가능한 데이터가 한정적일 수 있지만 관련 데이터가 많은 경우에 매우 유용합니다. 이후 해당 작업을 해결하면서 얻은 지식을 활용하여 새로운 작업을 효과적으로 처리할 수도 있습니다. 이러한 이유로 AI 분야에서 전이 학습은 아주 중요한 역할을 하며, 기업은 고도로 전문화된 직군을 고용하지 않고도 고품질의 AI 제품을 신속하게 개발하고 혁신할 수 있는 기회를 얻게 됩니다. 이러한 변화는 AI 분야에 진입하는 장벽을 낮추고 실험과 혁신을 촉진하는 데 도움이 될 것입니다.

전이 학습 종류

전이 학습은 다양한 방법과 접근법으로 구현될 수 있습니다. 주로 사용되는 전이 학습의 종류는 다음과 같습니다:

Domain Adaptation

사전 학습된 모델을 라벨링 된 데이터가 부족한 다른 도메인에 적응시키는 방법입니다. 이 방법은 사전 학습된 도메인과 타겟 도메인이 다르지만 유사성이 있을 때 효과적입니다.

Multi-task learning

여러 관련 작업을 동시에 학습하는 방법으로 다양한 전이 학습 스타일이 포함됩니다. 가장 중요한 특징은 둘 이상의 작업을 해결하기 위해 하나의 모델을 교육하는 것입니다. 또한 하나의 모델이 여러 작업을 학습함으로써 각 작업 간의 공통된 정보를 활용할 수 있습니다.

Feature extraction

사전 학습된 모델이 학습한 기본 패턴을 가져와 문제에 더 적합하도록 출력을 조정하는 방법입니다. 이는 모델의 초기 레이어는 변형하지 않고, 마지막 레이어만 재학습합니다.

Fine tuning

파인튜닝은 사전 학습된 모델 전체 또는 일부 레이어를 새로운 작업에 맞게 재학습하는 방법입니다. 이 방법은 사전 학습된 모델의 원래 기능을 유지하면서 보다 전문적인 사용 사례에 맞게 조정하는 데 사용됩니다.

위에 설명한 네 가지 종류 외에도 전이 학습에는 다양한 접근법과 변형이 존재하며, 각 접근법은 문제의 특성이나 데이터의 가용성, 컴퓨팅 리소스 등에 따라 선택적으로 적용될 수 있습니다.

전이 학습 단계

1. 모델 선택

모델 선택은 전이 학습의 중요한 첫 번째 단계입니다. 모델은 해결하려는 사용 사례와 매우 유사한 것을 선택하는 것이 좋습니다. 이때 선택할 수 있는 모델은 무료 및 오픈 소스로 제공되거나 타사 데이터 공급업체에서 구매하는 등 다양한 모델을 선택할 수 있습니다. 예를 들어 NVIDIA는 얼굴 인식, 객체 감지 및 기타 여러 일반적인 ML 사용 사례에서 사전 학습된 광범위한 모델을 포함하는 Transfer Learning Toolkit을 제공합니다. 모델 품질은 소스에 따라 달라지므로 원하는 품질 표준에 맞는 모델을 선택하세요.

2. 모델 정리

새 작업에 활용하려는 소스 모델의 속성을 선택하세요. 모델의 일부만 사용한다면 모델 아키텍처만 사용할 수 있고 만약 신경망의 경우 네트워크의 특정 레이어만 사용하는 것을 고려할 수 있습니다. 이 선택은 해결하려는 문제의 성격과 작업 중인 모델 유형에 따라 달라집니다. 필요한 경우 3단계를 완료한 후에도 모델을 정리할 수 있습니다.

3. 모델 미세 조정

성능을 최대화하려면 계속해서 모델을 미세 조정하고 정밀도를 확인해야 합니다. 이를 위해서는 현재 사용 사례에 대한 추가 학습 데이터가 필요합니다. 갖고 있는 학습용 데이터셋을 사용하거나 데이터 어노테이션 작업이 필요한 경우 효율적인 라벨링을 위한 작업자와 데이터 라벨링 플랫폼을 제공하는 제3자 데이터 제공업체를 찾는 것이 좋습니다. 추가 데이터 소싱이 필요한 경우 에펜과 같은 데이터 공급자에게 라벨링 된 데이터셋을 제공받을 수도 있습니다. 이후 모델이 필요한 성능 수준에 도달할 때까지 새 데이터로 모델을 계속 학습할 수 있습니다. 강력한 학습 데이터 파이프라인을 설정하면 이 단계가 장기적으로 더 빠르고 확장 가능해집니다. 특히 배포 후 정기적인 재훈련이 필요한 모델이 필요할 경우, 이 단계는 매우 중요합니다.

전이 학습 데이터에 대해 더 궁금한 점이 있으시다면 고품질 데이터 공급업체 에펜의 데이터 전문가에게 지금 바로 상담받아보세요!

머신러닝 프로젝트 지원이 필요하신가요? ML 전문가가 답변해 드립니다.