자연어 처리(Natural Language Processing, NLP)는 컴퓨터가 텍스트를 이해하고 음성을 해석하여 그 안의 감정을 판단하는 기술을 의미합니다. 자연어 처리 프로젝트에서 가장 중요한 것은 정확한 데이터 가공을 위한 많은 양의 학습 데이터입니다.
에펜은 수십 년간의 언어학 연구와 전문적인 경험을 기반으로 대규모 학습 데이터를 보유하고 있습니다. 또한, 글로벌 크라우드소싱 리소스를 활용하여 170개 이상의 국가 및 지역에서 235개 이상의 언어 전문지식을 지원합니다. 이를 바탕으로, 저희는 소매/전자상거래, 금융, 보험, 의료, 교통 등 다양한 산업의 자연어 처리 프로젝트를 성공적으로 수행해왔습니다.
Appen의 NLP 솔루션은 챗봇 및 음성 비서, 검색 관련성 및 감성 분석 등 다양한 AI 시나리오에 적용할 수 있습니다. 또한, 텍스트와 음성을 이해하고 의미를 추출하는 스마트 시스템을 구축할 수 있는 학습 데이터를 제공합니다.
자연어 처리 (NLP) 데이터 수집
자연어 처리 데이터셋
에펜의 다양한 NLP 데이터셋을 확인해보세요. 250개의 승인된 데이터셋에는 11,000시간 이상의 오디오와 25,000장의 이미지, 80개 언어와 다양한 방언을 포함한 870만 개 이상의 단어가 포함되어 있습니다.
- 방송, 콜센터, 차량탑재와 전화 애플리케이션을 위한 전사 데이터셋
- 범용 및 특정 분야의 발음 사전(예: 이름, 지명, 숫자)
- POS 태그가 있는 사전 및 어휘목록
- 형태학적 정보 및 명명된 엔터티를 라벨링한 말뭉치
고품질 자연어 처리 (NLP) 라벨링 서비스
감정 분석
감정 인식
캐릭터 분석
음악 감성 종류
시맨틱 분석
- 시맨틱 라벨링
- 동의 표현
- 의도 판단
명명된 엔터티 인식 (NER)
- 엔터티 추출
- 시맨틱 엔터티 검색
- 분야 관련성 query QU
- 애플릿 슬롯
- NER 내포 엔터티
품사 라벨링
- 어의 명확화
- 분사 세그멘테이션
- 텍스트 농축
- 분사 입도
음성 인식 ASR
- 시간 축 어노테이션
- 음성 전사와 세그멘테이션
- 음성 인식과 심사
Text to Speech (TTS)
- 음성 합성
- 대화형 음성 데이터 수집
텍스트 오류 수정
- 오타 인식 및 수정
- 짧은 텍스트, 긴 텍스트, 음성 인식 결과 등 다양한 텍스트 시나리오 콘텐츠 지원
클러스터링 라벨링
- 텍스트 클러스터링
- 이미지 및 동영상 클러스터링
- 신인류 클러스터링
동영상 NLP 어노테이션
숏 비디오 산업
고도화된 자연어 처리 프로젝트
자연어 처리 모델은 AI 모델이 인간의 의사소통과 추론을 모사하고 확장합니다. 이를 위해, NLP 커뮤니케이션에 전문화된 에펜의 언어학자들은 AI 개발 단계에 참여하여 유저 행동의 이유를 설명하고 해당 솔루션을 이해할 수 있도록 합니다.
연구개발 단계마다 appen의 언어 전문가는 고객과 협력하여 샘플 출력을 평가하고 AI 엔진, 학습 데이터 및 규범에 따라 맞춤형 서비스를 지원합니다. 에펜과 함께 합리적인 비용으로 더 빠른 end-to-end 제품 연구개발을 구축하세요.
- 언어 기술 품질 검사(QA) 및 가용성 테스트
- 사전 및 말뭉치
- 현지화 컨설팅
- 언어학 컨설팅