在这个视频中,将视频开头的提示音识别成了foregin,后面的一句话开头两个单词被遗漏,只能分句的效果也不佳,断句基本都是错误的