第二层的更高阶梯文字转WAV音频