考虑到修真者和普通人的人口比例文字转WAV音频