프랑스어 음성 인식 모델 개발 성공 사례 - MediaInterface

2025/05/18

프랑스어 음성 인식 모델 개발 프로젝트

"저희는 신규 시장인 프랑스로 사업을 확장하고 있었습니다. 당시 프랑스어로 된 소프트웨어는 보유하고 있었지만, 고객에게 최적의 사용 경험을 제공할 데이터는 부족했습니다. 하지만 Appen의 프랑스어 음성 인식 데이터를 통해 이 문제를 해결할 수 있었습니다." – Ines Wendler, MediaInterface 제품 관리자

기업 소개

MediaInterface는 20년 이상 독일, 오스트리아, 스위스 등 유럽 의료기관에 언어 기반 기술 솔루션을 제공해 온 기업입니다. 주력 제품인 SpeaKING은 음성 인식 모델을 통해 의료 문서 작성을 자동화하여 빠르고 정확한 문서화를 지원합니다. 현재 600여 개 병원과 700개 진료소에서 7만 5천 명 이상의 의료 전문가가 사용 중인 글로벌 헬스케어 솔루션 기업입니다.

프로젝트 과제

MediaInterface는 프랑스 시장의 잠재력을 확인하고 사업 확장을 계획했습니다. 그러나 진출에 있어 프랑스어에 특화된 음성 데이터를 확보하는 데 어려움을 겪었습니다.

  • 15년간 축적해 온 음성 인식 모델 데이터는 독일어 기반으로, 프랑스어에는 적용할 수 없었습니다.
  • 특히 환자 정보 문서에서 자주 등장하는 프랑스어 이름과 지명이 포함된 데이터가 부족했습니다.
  • GDPR(유럽 개인정보 보호 규정)으로 인해 건강 관련 데이터는 철저히 익명화되어, 실제 인명과 지명이 포함된 데이터를 자체적으로 수집하기 어려웠습니다.

MediaInterface는 이러한 공백을 채우기 위해, 규제 요건을 충족하면서도 고품질 데이터를 제공할 수 있는 외부 파트너를 필요로 했습니다.

솔루션

MediaInterface는 음성 기술 분야 국제 컨퍼런스 INTERSPEECH 2015를 통해 에펜을 처음 알게 되었습니다. 이후 2019년, 프랑스 시장 확장을 본격 추진하면서 에펜에 프랑스어 데이터를 요청했습니다. 이때 에펜이 제공한 전처리된 프랑스어 어휘 데이터셋은 MediaInterface의 프랑스 시장 진출 니즈에 완벽히 부합했고, 이를 기반으로 파트너십이 공식적으로 시작되었습니다. 해당 데이터셋은 21,000개의 프랑스어 이름과 14,000개의 프랑스 지명이 포함되어 있어, 프랑스어 음성 인식 모델에 있어 가장 큰 데이터 공백을 효과적으로 메울 수 있었습니다. 또한 에펜이 제공한 데이터셋을 바탕으로 배경 어휘집을 구축했으며 이를 통해 프랑스 사용자에게 특화된 AI 언어 모델을 성공적으로 개발할 수 있었습니다.

프로젝트 성과

MediaInterface는 에펜의 프랑스어 음성 인식 데이터를 통해 다음과 같은 성과를 달성했습니다.

  • 프랑스 의료 기관의 받아쓰기 및 음성 인식 요구사항을 정확하게 충족하는 음성 인식 모델 구축
  • 프랑스어에 맞게 현지화된 음성 인식 모델 개발
  • SmartLearning 기능과 배경 어휘를 결합하여 사용자 맞춤형 어휘 인식 구현
  • 음성 인식 정확도를 높이고 사용자 경험 개선

이로써, MediaInterface는 프랑스 시장에서 가장 신뢰할 수 있는 의료 음성 인식 모델로 자리매김하게 됐으며 에펜이 제공한 프랑스어 데이터셋은 제품 출시 기간 단축과 고객 기반 확대에 크게 기여했습니다.

에펜의 음성 인식 모델 솔루션

에펜의 전처리된 프랑스어 데이터셋은 빠른 제품 개발과 음성 인식 모델의 정확도 향상, 시장 확장을 동시에 실현하도록 성공적으로 지원했습니다. 현재 MediaInterface는 에펜의 음성 인식 모델 솔루션을 통해 유럽 외 다른 언어권 시장으로의 진출 가능성도 모색하고 있습니다.

맞춤형 데이터셋 지원이 필요하신가요? 데이터 전문가에게 문의하세요.