另一个结论则是文字转WAV音频