자연어 처리: 텍스트 및 음성 솔루션


Appen의 포괄적인 수집 및 어노테이션 능력, 풍부한 언어 경험과 데이터 세트 및 자체 개발한 어노테이션 플랫폼이 고효율, 고품질로 고객의 자연어 및 음성 프로젝트를 지원할 수 있습니다.


얻는 방법




인간-기계 상호작용의 체험이 날로 개선되면서 자연어 처리(Natural Language Processing, NLP) 기술도 지속적으로 향상되고 있습니다. NLP는 컴퓨터가 텍스트를 읽고 음성을 이해한 후 이를 해석, 요약하고 그 안의 감정을 판단할 수 있게 합니다. NLP는 많은 AI 솔루션의 원동력이지만 학습하기 위해 유연하게 처리, 태그 및 정리된 대량의 학습 데이터가 필요합니다. 모델을 학습하는 데이터가 많을수록 모델 피드백 결과가 더 정확해집니다.

Appen은 수십 년 동안 언어학 분야를 깊이 있게 연구하고 풍부한 전문적인 경험을 쌓아왔습니다. 당사의 글로벌 크라우드소싱 리소스는 170개 이상의 국가/지역에 퍼져 있으며, 235개 이상 언어의 전문지식을 지원합니다. 당사는 소매/전자상거래, 금융, 보험, 의료, 교통 등 산업의 많은 기업들이 자연어 처리 프로젝트를 성공적으로 정착시키도록 도왔습니다.

당사는 챗봇, 음성 비서, 검색 관련성, 감정 분석 등과 같은 다양한 AI 시나리오에 적용 가능하며, 인간 텍스트와 음성을 이해하고 그 안의 의미를 추출할 수 있는 스마트 시스템을 구축하도록 돕는 학습 데이터를 제공합니다.


ImageImage Image




Image

엔드 투 엔드 데이터 수집:



Image

텍스트 수집



다양한 소스의 텍스트 데이터를 해석하는 세계적 수준의 언어 기반 머신 러닝 애플리케이션을 구축하기 위해, 당사의 음성 및 텍스트 데이터 수집 서비스는 전 세계 여러 언어와 방안을 다룹니다. 당사의 음성 및 텍스트 수집 서비스는 챗봇 및 기타 대화형 AI 모델을 학습시키기 위한 대량의 고품질, 맞춤형 텍스트 데이터를 수집하도록 도와드릴 수 있습니다. 당사의 텍스트 생성 서비스는 원어민 간 시나리오 기반의 응답 또는 대화의 생성에 활용할 수 있습니다. 선택 가능한 후속 시맨틱 어노테이션은 챗봇 학습 또는 자연어 처리를 위한 텍스트 코퍼스 생성에 활용할 수 있습니다.


Image

음성 및 오디오 수집



음성 안내를 탑재한 가상 비서, 음성 제어 검색 기능, 전사 서비스, 음성 텍스트 변환 기능을 학습시키기 위한 대량의 고품질, 맞춤형 음성 및 오디오 데이터를 수집합니다. 당사의 데이터 수집은 독자적으로 제공하는 서비스 옵션일 수 있으며, 필요에 따라 납품 성과물의 일부(예: ASR 음성 데이터베이스, 일반적으로 음성 데이터, 전사, 발음 사전 및 특정 언어 파일 포함)로 다른 관련 제품을 경품증정할 수도 있습니다.







완제품 데이터 세트

또한 당사의 풍부하고 다양한 완제품 데이터 세트를 확인할 수 있습니다. 250여 개의 승인된 데이터 세트에는 11,000여 시간 이상의 오디오, 25,000여 장의 이미지, 80개 언어와 다양한 방언을 포함한 870만 개 이상의 단어가 포함됩니다. 포함 사항:

  • 방송, 콜센터, 차량탑재와 전화 애플리케이션을 위한 완전 전사 데이터 세트
  • 범용 및 특정 분야의 발음 사전(예: 이름, 지명, 자연수)
  • POS 태그가 있는 사전 및 어휘목록
  • 형태학적 정보 및 명명된 엔터티를 어노테이션한 텍스트 코퍼스

더 알아보기




Image

포괄적이고 고품질의 NLP 어노테이션 능력



당사의 다중 어노테이션 능력은 스마트 어노테이션 특징을 갖추고 있고, 데이터 어노테이션 프로세스에 머신 러닝 지원 기능을 내장하고 있어 자동화를 구현하고 데이터 수집 및 어노테이션 프로젝트의 생산성, 정확도 및 납품율을 향상시켰습니다. 당사의 자연어 처리 및 음성 어노테이션 능력:





Image

감정 분석


  • 정서 판단
  • 캐릭터 분석
  • 음악 정서 종류
Image

시맨틱 분할


  • 시맨틱 어노테이션
  • 동의 표현
  • 의도 판단
Image

명명된 엔터티 인식 NER


  • 엔터티 추출
  • 시맨틱 소환 엔터티
  • 분야 관련성 query QU
  • 애플릿 슬롯
  • NER 내포 엔터티
Image

품사 어노테이션


  • 분사 어노테이션
  • 텍스트 농축
  • 분사 입도
Image

음성 인식 ASR


  • 시간 축 어노테이션

  • 음성 인식&심사

Image

음성 합성 TTS


  • 음성 합성

  • 대화형 에이전트를 위한 음성 수집
Image

텍스트 오류 수정


  • 오타 인식 및 수정

  • 짧은 텍스트, 긴 텍스트, 음성 인식 결과 등 다양한 텍스트 시나리오 콘텐츠

Image

클러스터링 어노테이션


  • 텍스트 클러스터링
  • 이미지 및 비디오 클러스터링

  • 신인류 클러스터링

Image

비디오 NLP 어노테이션


  • 인터넷 서비스 크리에이티브 비디오 산업





Image

언어학




인간-기계 상호작용 AI의 설계, 개발 및 조정에 언어학자를 참여시켜 대인 커뮤니케이션과 추리(사용자의 행복지수를 높임)를 복제하고 확장하기 위한 AI 제품을 구축합니다. 자연어 커뮤니케이션, 언어 행동 및 구조 방면의 전문가인 언어학자가 고객이 사용자 행동의 인과 관계 및 해당 솔루션을 이해하도록 도와드릴 수 있습니다.

연구개발 단계마다 당사의 언어학자 및 언어 전문가가 고객과 협력하여 샘플 출력을 평가하고 AI 엔진, 학습 데이터 및 규범에 대해 맞춤형 조정을 지원합니다. 당사의 목표는 높은 효율의 엔드 투 엔드 제품 연구개발 협력 파트너쉽을 구축하여 빠르고 저비용으로 고객에게 이상적인 결과물을 납품하는 것입니다. 당사의 서비스 항목:

  • 언어 기술 품질 검사(QA) 및 가용성 테스트
  • 사전 및 텍스트 코퍼스
  • 현지화 컨설팅
  • 언어학 컨설팅

Image Image