大部分的质量是没有参与聚变的文字转WAV音频