便只能向后者发展文字转WAV音频