AI-ML·중요도 6·2026. 06. 28.·r/MachineLearning

NagaTranslate: Building a translation and voice pipeline for low-resource Nagaland creoles (Whisper, VITS, LLMs) [P]

── KO ──────────────────

NagaTranslate는 저자원 나가 언어를 위한 번역 및 음성 파이프라인 구축을 목표로 한다.

NagaTranslate 프로젝트는 인도의 저자원 나가 언어(현재 Nagamese, Ao, Sema)를 위한 번역 및 음성 파이프라인을 구축하는 데 중점을 두고 있다. 저자는 LLM API와 최적화된 프롬프트를 활용한 텍스트 번역 기능을 설명하며 초기 fine-tuning 된 NLLB 모델에서 전환한 이유를 공유한다. 주요 도전 과제는 데이터 부족 상황에서 자연스러운 대화를 지원하는 방법을 찾는 것이다.


── EN ──────────────────

NagaTranslate aims to build a translation and voice pipeline for low-resource Nagaland languages.

The NagaTranslate project focuses on building a translation and speech pipeline for low-resource languages of Nagaland, India, currently supporting Nagamese, Ao, and Sema. The author discusses the use of an LLM API for text translation and why they transitioned from a fine-tuned NLLB model. A significant challenge is to ensure natural conversational flow while operating under data scarcity.

원문 보기 →목록으로