一款高效的语音语言模型,能够快速生成音频和文本内容。 低延迟,首次音频生成时间从236毫秒缩短到53毫秒;推理速度提升3-5倍;开源数据训练,包含20万小时音频
一款高效的语音语言模型,能够快速生成音···
VoiceCanvas 是一个先进的多语言语音合成···
阿里推出的Qwen系列旗舰多模态模型,能够···
ChatNio 是一个综合了各种流行的 AI 模型···
一款能够深度推理的多模态视觉语言模型,···
一款高效的语音语言模型,能够快速生成音···