자연어 처리: 텍스트 및 음성 솔루션
Appen의 포괄적인 수집 및 어노테이션 능력, 풍부한 언어 경험과 데이터 세트 및 자체 개발한 어노테이션 플랫폼이 고효율, 고품질로 고객의 자연어 및 음성 프로젝트를 지원할 수 있습니다.
인간-기계 상호작용의 체험이 날로 개선되면서 자연어 처리(Natural Language Processing, NLP) 기술도 지속적으로 향상되고 있습니다. NLP는 컴퓨터가 텍스트를 읽고 음성을 이해한 후 이를 해석, 요약하고 그 안의 감정을 판단할 수 있게 합니다. NLP는 많은 AI 솔루션의 원동력이지만 학습하기 위해 유연하게 처리, 태그 및 정리된 대량의 학습 데이터가 필요합니다. 모델을 학습하는 데이터가 많을수록 모델 피드백 결과가 더 정확해집니다.
Appen은 수십 년 동안 언어학 분야를 깊이 있게 연구하고 풍부한 전문적인 경험을 쌓아왔습니다. 당사의 글로벌 크라우드소싱 리소스는 170개 이상의 국가/지역에 퍼져 있으며, 235개 이상 언어의 전문지식을 지원합니다. 당사는 소매/전자상거래, 금융, 보험, 의료, 교통 등 산업의 많은 기업들이 자연어 처리 프로젝트를 성공적으로 정착시키도록 도왔습니다.
당사는 챗봇, 음성 비서, 검색 관련성, 감정 분석 등과 같은 다양한 AI 시나리오에 적용 가능하며, 인간 텍스트와 음성을 이해하고 그 안의 의미를 추출할 수 있는 스마트 시스템을 구축하도록 돕는 학습 데이터를 제공합니다.



엔드 투 엔드 데이터 수집:
완제품 데이터 세트
또한 당사의 풍부하고 다양한 완제품 데이터 세트를 확인할 수 있습니다. 250여 개의 승인된 데이터 세트에는 11,000여 시간 이상의 오디오, 25,000여 장의 이미지, 80개 언어와 다양한 방언을 포함한 870만 개 이상의 단어가 포함됩니다. 포함 사항:
- 방송, 콜센터, 차량탑재와 전화 애플리케이션을 위한 완전 전사 데이터 세트
- 범용 및 특정 분야의 발음 사전(예: 이름, 지명, 자연수)
- POS 태그가 있는 사전 및 어휘목록
- 형태학적 정보 및 명명된 엔터티를 어노테이션한 텍스트 코퍼스

포괄적이고 고품질의 NLP 어노테이션 능력
당사의 다중 어노테이션 능력은 스마트 어노테이션 특징을 갖추고 있고, 데이터 어노테이션 프로세스에 머신 러닝 지원 기능을 내장하고 있어 자동화를 구현하고 데이터 수집 및 어노테이션 프로젝트의 생산성, 정확도 및 납품율을 향상시켰습니다. 당사의 자연어 처리 및 음성 어노테이션 능력:

감정 분석
- 정서 판단
- 캐릭터 분석
- 음악 정서 종류

시맨틱 분할
- 시맨틱 어노테이션
- 동의 표현
- 의도 판단

명명된 엔터티 인식 NER
- 엔터티 추출
- 시맨틱 소환 엔터티
- 분야 관련성 query QU
- 애플릿 슬롯
- NER 내포 엔터티

품사 어노테이션
- 분사 어노테이션
- 텍스트 농축
- 분사 입도

음성 인식 ASR
시간 축 어노테이션
음성 인식&심사

음성 합성 TTS
음성 합성
- 대화형 에이전트를 위한 음성 수집

텍스트 오류 수정
오타 인식 및 수정
짧은 텍스트, 긴 텍스트, 음성 인식 결과 등 다양한 텍스트 시나리오 콘텐츠

클러스터링 어노테이션
- 텍스트 클러스터링
이미지 및 비디오 클러스터링
신인류 클러스터링

비디오 NLP 어노테이션
인터넷 서비스 크리에이티브 비디오 산업

언어학
인간-기계 상호작용 AI의 설계, 개발 및 조정에 언어학자를 참여시켜 대인 커뮤니케이션과 추리(사용자의 행복지수를 높임)를 복제하고 확장하기 위한 AI 제품을 구축합니다. 자연어 커뮤니케이션, 언어 행동 및 구조 방면의 전문가인 언어학자가 고객이 사용자 행동의 인과 관계 및 해당 솔루션을 이해하도록 도와드릴 수 있습니다.
연구개발 단계마다 당사의 언어학자 및 언어 전문가가 고객과 협력하여 샘플 출력을 평가하고 AI 엔진, 학습 데이터 및 규범에 대해 맞춤형 조정을 지원합니다. 당사의 목표는 높은 효율의 엔드 투 엔드 제품 연구개발 협력 파트너쉽을 구축하여 빠르고 저비용으로 고객에게 이상적인 결과물을 납품하는 것입니다. 당사의 서비스 항목:
- 언어 기술 품질 검사(QA) 및 가용성 테스트
- 사전 및 텍스트 코퍼스
- 현지화 컨설팅
- 언어학 컨설팅
