人工智能识别主持人情感
摘要:
随着以深度学习为基础的人工智能的不断发展,未来势必越来越多的特定脑力辅助性领域工作将会被取代。人工智能通过语音识别辨识出主持人实时表达的情绪,再通过调用事先准备的大数据库,使用"情感标签"调用相应的背景音乐和图像实现自动配乐和配景。本文使用语谱图作为主持人语音情感识别的特征,利用深度残差网络(Resnet)对原始输入特征进行提取,然后使用长短记忆网络(LSTM)对Resnet的输出特征进行进一步提取,使其具有上下时刻关联性,大大提高了最终的识别结果,最后将提取出的特征通过支持向量机(SVM)进行分类,输出"情感标签"。 v
年份:2019
求助
推荐
收藏
表情
图片
附件