山东大学新闻网
山大邮箱 | 投稿系统 | 高级检索 | 旧版回顾

视点首页 > 学术纵横 > 正文

张伟教授课题组关于视频描述的最新成果在国际顶尖期刊IEEE TPAMI发表

发布日期:2019年06月27日 08:02 点击次数:

[本站讯]近日,国际顶级期刊IEEE Transactions on Pattern Analysis and Machine Intelligence(TPAMI)接收了控制学院张伟教授课题组的论文“Reconstruct and Represent Video Contents for Captioning via Reinforcement Learning”。TPAMI是计算机视觉与模式识别领域的顶尖期刊,是中国计算机学会(CCF)推荐的人工智能领域A类期刊,2018年的影响因子(IF)为17.73。

该论文提出了一种新的用于视频描述(video captioning)的“编码器-解码器-重构器”深度模型,简称RecNet。该模型可以充分挖掘视频内容与文字描述之间的双向信息,所提出的重构器融合策略可以在全局层面和局部层面同时重构视频片段特征,从而首次实现了视频特征和自然语言的双向映射。RecNet模型在多个国际公认的大规模视频语义描述数据集上,都取得了目前最好的测试结果。

该论文第一作者单位为山东大学,由张伟教授和其硕士研究生王柏瑞完成(文章发表于:IEEE Transactions on Pattern Analysis Machine Intelligence On page(s):1-14,Print ISSN:0162-8828,Online ISSN:0162-8828,Digital Object Identifier: 10.1109/TPAMI.2019.2920899)。论文的合作单位为腾讯AI Lab(人工智能实验室),该实验室拥有70余位来自世界知名院校的科学家,并与世界顶级院校与机构合作,共同打造产学研用一体的 AI 生态。其研究成果在微信、QQ、天天快报等上百个腾讯产品应用。张伟教授课题组长期与腾讯AI Lab密切合作,该成果即是双方产学研用结出的丰硕成果。

论文链接https://ieeexplore.ieee.org/document/8731706


【供稿单位:控制学院    作者:汤庆新 王柏瑞    编辑:新闻中心总编室    责任编辑:王学娟 张丹丹  】

 匿名发布 验证码 看不清楚,换张图片
0条评论    共1页   当前第1拖动光标可翻页查看更多评论

免责声明

您是本站的第: 位访客

新闻中心电话:0531-88362831 0531-88369009 联系信箱:xwzx@sdu.edu.cn

建议使用IE8.0以上浏览器和1366*768分辨率浏览本站以取得最佳浏览效果

欢迎关注山大视点微信