차세대 오디오 모델이 API에 도입되었습니다.
개발자들은 이제 텍스트 음성 변환 모델에 특정한 음성 표현을 지시할 수 있습니다. 예를 들어, '동정 어린 고객 서비스 에이전트처럼 말하게 해주세요'와 같은 명령을 통해 음성 에이전트의 맞춤성을 높일 수 있습니다. 이는 음성 기술의 새로운 가능성을 열어주는 중요한 발전입니다.
Next-generation audio models have been introduced in the API.
For the first time, developers can instruct the text-to-speech model to convey specific tones, such as, 'talk like a sympathetic customer service agent.' This functionality unlocks a new level of customization for voice agents, representing a significant advancement in voice technology. The ability to tailor speech delivery enhances user interaction and experience.