他应该是只从自己一点头文字转WAV音频