데이터 필터링을 통해 검색 관련성(Search Relevance)을 향상하는 방법

2024/03/09

의류를 구매하기 위해 선호하는 온라인 쇼핑몰을 방문합니다. 검색 창에 원하는 의류 항목을 입력합니다. 이때, 고객은 매우 정확하고 검색 결과의 관련성이 높으며 빠른 결과를 기대합니다. 어떤 웹사이트를 이용하든지 혹은 검색어에 오타가 있더라도 고객은 항상 고품질의 검색 결과를 원합니다. 검색 관련성은 원하는 제품이나 정보를 정확하게 찾을 수 있는 능력을 의미하며, AI 기술을 통해 이러한 높은 수준의 검색 관련성을 달성할 수 있습니다.

검색 관련성 평가

검색 관련성은 비즈니스에 매우 중요한 역할을 합니다. 그러나 이 기능이 얼마나 잘 작동하는지를 확인하는 것은 어떻게 할까요? 웹사이트 검색을 평가하는 가장 효과적이고 간단한 방법 중 하나는 인간을 활용한 검색 관련성 평가입니다. 이 방법은 웹사이트가 잘 처리할 것으로 예상되는 검색어 샘플을 사용하여 작동합니다. 해당 쿼리에 대한 상위 결과를 확인한 다음 사람들에게 해당 검색 결과의 정확성과 관련성을 평가하도록 합니다. 이러한 평가는 검색이 관련 결과를 제공하는지 여부를 판단하고, 개선이 필요한 부분을 파악하는 데 도움이 됩니다.

검색 관련성을 최적화하면 고객에게 최상의 온라인 경험을 제공할 수 있을 뿐만 아니라, 더 높은 수익을 창출하고 더 적은 비용을 지출하도록 합니다. 검색 관련성 평가는 회사의 온라인 성과를 향상하고, 고객의 만족도를 높이며, 비즈니스 성과를 향상하는 데 중요한 도구로 작용합니다.

인간을 통한 데이터 필터링

인간이 필터링한 데이터의 필요성은 다양한 이유로 설명됩니다. 먼저 검색 결과를 평가하기 위해 참여한 개별 작업자는 명확한 관련성 판단을 가능하게 합니다. 이는 클릭 수보다 더 높은 품질의 지표로 작용하며 최적화에 도움이 됩니다. 예를 들어, Etsy는 검색어에 가장 일치하는 제품이 검색 결과 상단에 표시되도록 하는 방법을 통해 브랜드 선호도 문제를 해결하고자 했으며, 이를 위해 저희 에펜과 협업을 진행했습니다. 이는 인간의 판단이 필요한 문제였으며, 아이쇼핑을 즐기는 사용자도 함께 고려해야 하기 때문에 일반적인 클릭 수 데이터만으로 충분하지 않았습니다.

인간이 필터링한 데이터의 또 다른 예시는 크라우드 작업자를 통해 필터링된 검색을 생성하는 것입니다. Etsy는 수백만 개의 제품으로 이루어진 생태계에서 더 나은 사용자 경험을 제공하기 위해 에펜의 솔루션을 활용했습니다. 이러한 작업은 대규모로 이루어지며, 인간의 판단과 참여가 필요합니다.

인간이 필터링한 데이터를 기반으로 한 관련성 점수 시스템을 설정하는 것은 중요합니다. 초기에는 개별 작업자를 통해 현재 검색 알고리즘의 기준선을 설정하는 것이 좋습니다. 이후에는 각 사이트에 맞는 측정항목을 기반으로 변경을 수행하고 이전 알고리즘에 대해 새 알고리즘이 생성하는 쿼리-결과 쌍을 테스트할 수 있습니다. 이러한 과정을 통해 새로운 알고리즘이 개선되었는지 또는 추가 변경이 필요한지를 이해할 수 있습니다.

데이터 필터링을 통해 알고리즘을 개선하는 방법

  • 쿼리-결과 쌍 점수 매기기: 작업자가 쿼리-결과 쌍을 평가하여 관련성을 측정합니다. 기여자는 각 쿼리-결과 쌍에 점수를 부여하여 검색 관련성 알고리즘이 얼마나 잘 작동하는지 평가합니다. 이를 통해 알고리즘의 성능을 높일 수 있는 방안을 찾을 수 있습니다.
  • 추가 태그 지정: 제품의 메타데이터에 추가 태그를 지정하는 것은 검색 관련성을 향상하는 데 도움이 됩니다. 기여자는 제품 데이터베이스를 더 풍부하게 만들기 위해 자동화된 머신러닝 지원 태깅과 함께 작업할 수 있습니다. 이를 통해 검색 결과의 다양성을 높일 수 있습니다.
  • 데이터 정리 및 제품 분류: 제품 데이터베이스를 정리하고 분류하는 것은 검색 관련성을 향상하는 데 중요합니다. 제조사는 유사한 제품에 대해 서로 다른 용어를 사용할 수 있고, 유통업체는 제품을 다르게 설명할 수 있습니다. 또한, 여러 이미지가 하나의 제품에 관련될 수 있습니다. 작업자는 이러한 데이터 불일치를 해소하고 제품 데이터베이스를 정리하여 검색 결과의 정확성을 향상합니다.

검색 관련성의 중요성

현대의 온라인 사용자들은 구글이나 아마존과 같은 대표적인 플랫폼에서와 마찬가지로 정확하고 관련성 높은 결과를 기대합니다. 검색하는 동안 정보를 찾거나 제품을 비교하고 구매하는 등 다양한 목적으로 온라인 플랫폼을 활용하는 고객들에게 검색 관련성은 매우 중요한 요소입니다. 고객 전환율을 높이기 위해서는 검색 결과의 관련성을 측정하는 것이 필수적입니다.

검색 관련성은 검색 엔진의 효율성을 평가하는 중요한 지표 중 하나입니다. 사용자가 제품을 검색할 때 해당 결과가 사용자의 의도와 일치하는지 여부가 관건입니다. 이를 위해 재현율과 정밀도라는 두 가지 지표가 주로 사용되는데요, 재현율은 모든 관련 결과를 반환하는 능력을 의미하며, 정밀도는 관련성 있는 결과만을 반환하는 능력을 의미합니다.

검색 관련성을 최적화하는 것은 복잡하고 지속적인 프로세스입니다. 사용자의 요구를 이해하고 해당하는 결과를 제공하는 것뿐만 아니라 개인화된 서비스와 특정 비즈니스 요구를 충족시키는 것이 필요합니다. 또한, 사용자가 음성 지원 장치나 디지털 보조 장치를 통해 상호 작용하는 경우, 이에 맞춰 새로운 인터페이스를 고려해야 합니다. 이를 위해 엔지니어들은 머신러닝과 자연어 처리를 활용하여 대화형 검색을 개선하고 있습니다. 이러한 프로세스에는 텍스트, 음성, 동영상 등 다양한 데이터를 사용하여 관련성을 높이기 위한 노력이 필요합니다.

에펜의 검색 관련성 솔루션

저희 에펜은 26년 이상의 검색 관련성 전문 지식을 보유하고 있습니다. 이 오랜 기간 동안 다양한 Adobe Stock을 포함한 다양한 고객의 독특한 검색 요구 사항에 맞춰 고품질의 학습 데이터를 제공함으로써 성공적으로 검색 관련성 솔루션을 지원해 왔습니다. 에펜의 검색 관련성 솔루션 관련하여 궁금하신 점이 있으시다면 지금 바로 에펜의 전문가에게 상담받아보세요!

NLP 프로젝트 지원이 필요하신가요? 자연어 처리 전문가에게 문의하세요.