肯定是需要一个人物站出来了文字转WAV音频