必然是同等级中的最弱文字转WAV音频