对算法工程师一职的思考

ZMonster at 
目录从做过的工作说起再谈这个职位参考从做过的工作说起说话人分割(Speaker Diarization): 对一段音频,确定 何人在何时说话情感识别: 对一段音频,判断说话者在其中表达的是 正面的情感 还是 负面的情感题库搜索 OCR 学生能力评估音频格式转换收到的客户的音频数据往往格式杂乱,而且这些音频为了便于保存和传输,大都是经过压缩的格式,在进行转换后可能会有一定程度的失真。去除明显的非人声和静音,所谓非人声包括: 通信噪音、场景噪音、音乐对于与人声不重叠的非人声,可以通过语音活性检测(Voice Activity Detection, VAD)来进行区分,难点在于如何处理与人声混杂在一……