一个有声有图像的视频,怎么才能将声音单独提取出来成为一个音频文件?