中国电子学会举办《2017全国图像图形处理技术应用大会》

2017年11月18日 0:00 至 2017年11月19日 18:00 ，中国电子学会在北京·北京南粤苑宾馆·北京市丰台区南三环西路86号（玉泉营立交桥西南侧）举办《2017全国图像图形处理技术应用大会》。

会议通知

2017全国图像图形处理技术应用大会

2017全国图像图形处理技术应用大会宣传图

自2013年中国电子学会成功地举办了4届“全国图形图像处理技术应用大会暨中国全国图形图像处理工程师年会”，会议受到广大参会代表的好评。为此，中国电子学会拟于2017年11月继续在北京举办“2017年全国图像图形处理技术应用大会暨2017中国图像图形处理工程师年会”，本次会议较几届大会报告内容更加丰富,更加集中，旨在进一步加强图像图形处理技术应用领域中企业之间、高校与企业之间、研发工程师与应用工程师之间的交流和沟通，有力推动图像图形处理技术的进步与应用水平的长足进展，以满足各个行业的发展需求。现就有关事项通知如下：

一、大会主题：拓宽研发思路提高应用能力

二、时间地点：2017年11月17?19日 17日报到地点：北京

三、大会组织机构：

主办单位： 中国电子学会

媒体支持：中国图象图形学报、太赫兹科学与电子信息学报、模式识别与人工智能

四、大会主席： 张勇东中科院计算所

五、大会交流形式

1.特邀演讲：大会将邀请国内图像图形处理技术领域的著名专家，就图像图形处理技术的应用和最新动态做特邀报告。

2.宣传展示：邀请图像图形技术相关科研单位和高新技术企业，宣传展示他们在图像图形技术领域的研究成果、新产品和市场化内容。

3.大会发表的新成果、新产品、新技术及研究报告

六、拟邀请大会报告

1.题目：待定

报告人：陈定佳北京快手公司

2.题目：网络空间视觉内容理解

报告人：操晓春中国科学院信息工程研究所研究员

摘要：互联网络的发展和普及达到空前规模，促进社会繁荣的同时也带来安全风险。反动、虚假、不良的媒体内容充斥于网络空间，存在识别难、时效差、耗费多三大现实挑战。团队提出运用“兼视则明、道法自然”的思想，探索协同多源信息、建模自然统计特征和运用细粒度层次化的表述方法，建立了一套视觉有害内容协同检测与识别框架。

3.题目：Visual Question Answering with deep learning

报告人：俞俊杭州电子科技大学教授

摘要：Visual question answering (VQA) is challenging because it requires a simultaneous understanding of both the visual content of images and the textual content of questions. The approaches used to represent the images and questions in a fine-grained manner and questions and to fuse these multi-modal features play key roles in performance. In this talk, I will introduce a Multi-modal Factorized Bilinear (MFB) pooling approach to efficiently and effectively combine multi-modal features, which results in superior performance for VQA compared to other bilinear pooling approaches. For fine-grained image and question representation, we develop a ‘co-attention’ mechanism using an end-to-end deep network architecture to jointly learn both the image and question attentions. Combining the proposed MFB approach with co-attention learning in a new network architecture provides a unified model for VQA. Experimental results demonstrate that the single MFB with co-attention model achieves new state-of-the-art performance on the real-world VQA dataset.

4.题目： Multi-modal Learning towards Micro-video Analytics

报告人：聂礼强山东大学

摘要： Bite-sized videos enforcing the shorter-is-better strategy, are taking the social media world by storm with the rising of the micro-video sharing services, like Vine, Snapchat, and Viddy. Micro-videos can benefit lots of commercial applications, such as brand building. Despite their value, the analysis and modeling of micro-videos is non-trivial due to the following reasons: 1) micro-videos are short in length and of low quality; 2) they can be described by multiple heterogeneous channels, spanning from social, visual, and acoustic to textual modalities; and 3) there are no available benchmark dataset. In this research, we build a large-scale dataset and attempt to solve two sub-problems of micro-videos: venue category estimation and popularity prediction. We jointly learn the optimal latent common space from multi-modalities, whereby the popularity or venue category of micro-videos can be better identified. From the common latent spaces found, we then develop a tree-guided multi-task multi-modal learning model to estimate the venue category, and a novel transductive multi-modal learning method to predict the popularity of micro-videos. We validated the effectiveness of the models on our collected dataset. The data and codes have been released to facilitate other researchers. This talk presents our current research and future work towards leveraging micro-videos for better social media analytics.

5.题目：视觉检索中的重排序方法

报告人：白翔华中科技大学

摘要：视觉检索是计算机视觉领域的一个重要研究方向，广泛应用于多媒体数据挖掘、安防监控与刑侦、医学影像分析等。传统基于内容的图像检索系统在排序和索引过程中仅考虑了样本两两之间的相似性度量；与之不同的是，重排序方法（Re-ranking）充分利用了样本的上下文信息及数据间潜在的流形结构，因此它常常能在初始排序的基础上显著地提升检索精度。本报告将介绍本课题组在重排序方法及其计算机视觉领域应用的最新研究进展。我们的重排序方法可以分为两大类：基于扩散模型的方法和基于向量空间的方法；这些方法在图像检索、3D形状检索、行人重识别等计算机视觉任务中均获得了很好的应用效果，相关研究成果发表在重要国际会议（CVPR, ICCV, AAAI, BMVC等）和国际期刊（IEEE TIP, IEEE TMM等）。

6.题目：待定

报告人：查正军中国科技大学

7.题目：人工智能芯片初探

报告人：程健中科院自动化所

摘要：近年来，以深度神经网络为代表的人工智能方法在计算机视觉、语音识别等领域取得了巨大成功。然而，深度神经网络结构非常复杂，一方面给传统通用处理器的运算带来巨大压力；另一方面，随着移动应用和物联网的普及，高效低耗也成为芯片设计需要考虑的关键因素。本报告将介绍近年来芯片设计面临的一些挑战，人工智能芯片发展现状和未来趋势。同时，也将分享本人课题组在这方面做的一些最新工作进展

8题 目：视频多目标语义信息提取与压缩

报告人：林巍峣上海交通大学

摘要：视频中的目标（如行人等）是描述视频内容的关键，因此对于视频目标的语义信息提取十分重要。此外，随着目标语义信息的不断丰富，语义信息的数据量也变得越来越大，给视频内容分析与处理带来挑战。在本次报告中，将主要介绍我们在视频多目标语义信息提取及压缩中的最新成果。首先，我们将介绍我们在多目标检测与跟踪方面的工作，利用超平面匹配的一体化多目标检测与跟踪算法，实现对视频中目标位置、轨迹等语义信息的压缩与编码。其次，我们将介绍我们目标行为识别、行为检测方面的工作，上述工作实现了目标行为语义的有效提取。最后，我们将介绍我们提出的时空关联位置及轨迹压缩技术，实现对语义信息的压缩及编码。

9.题目：感知视频编码：从视觉感知到编码优化

报告人：陈震中，武汉大学教授

摘要： 近年来，随着宽带网络的普及以及各式移动网络和设备的飞速发展，各类视频应用以及用户的快速增加，视频数据量也呈现爆炸性增长，如何高效压缩传输视频并且提升视频服务的用户体验显得尤为重要。视频编码技术经历了多年的发展，形成了H.264/AVC,HEVC/H.265等一系列标准，编码效率的进一步提高遇到了极大的瓶颈和挑战。随着对人类视觉系统的研究和了解，如何结合人类视觉系统特性优化视频编码技术显得尤为重要。本报告将汇报报告人在视觉感知建模、感知视频编码优化等方面的相关工作，探讨如何结合视觉感知机理将智能化视觉信息处理引入视频编码技术中，优化视频主观质量，改善用户体验。

10.题目：视频编码技术的演进：从高效压缩到智能分析

报告人：马思伟北京大学信息科学技术学院教授

摘要：传统视频编码的压缩对象主要是影视节目，目标是以较低的存储空间或传输带宽为人们提供较好的观看质量。而随着视频应用的普遍展开，如视频监控、无人驾驶等生成大量非以观看为目的的视频内容，更注重的是在前端采集时能够对视频内容进行即时的分析理解，后期还能对海量的视频内容进行更高效的检索管理等，此时传统编码方法的不足已十分凸显。在此背景下出现了视觉特征编码等技术，用以辅助满足视频分析需求。同时随着前端采集技术的进步，如深度、点云等视觉数据类型，作为辅助数据也正在改变视频内容的表示形式，进而影响视频编码算法甚至整个编码框架的设计。本报告将对近期视频编码从面向高效压缩到智能分析的演进过程中一些特色技术进行介绍。

11.题目： High Coherence Image Retargeting And Its Applications

报告人：颜波复旦大学计算机科学技术学院教授

摘要：In this talk, we will introduce our recent work in image retargeting. In addition, we elaborate on other applications extended from retargeting techniques, which have not been discussed before. We show how to apply the retargeting techniques in other fields to solve their challenging problems, and reveal that retargeting technique is not just a simple scaling algorithm, but a thought or concept, which has great flexibility and is quite useful. We believe this talk can help researchers to solve the existing problem of media retargeting and bring new ideas in their works.

12.题目：单像素红外成像技术及其应用

报告人：索津莉清华大学自动化系,副教授、博士生导师

摘要：红外成像具有非常重要的应用价值，然而现有红外相机受限于红外面阵传感器的发展水平，其成像质量和产品成熟度方面远远不及可见光谱段，因此性能受限、价格昂贵。相反，新兴的单像素成像方法采用空间光调制和单个光电二极管进行成像，具有谱段宽、成本低、灵敏度高等一系列优点，在红外成像方面具有很大的发展前景。单像素成像是一种新兴的成像方法，吸引了来自光学、信号处理、计算机应用等学科的广泛关注和大量投入。近年来，单像素成像快速发展，在成像的速度、分辨率方面取得了显著的研究进展。本报告将对单像素成像的发展历史、基本机制进行介绍，展示该领域的最新研究进展，并探讨可能的产业化应用。

13.题目：数据驱动的人体运动仿真技术

报告人：夏时洪中国科学院计算技术研究所研究员

摘要：报告主要介绍人体运动仿真研究相关的应用案例，以及对于其中关键问题研究的新进展，特别是数据驱动的人体运动仿真成果。

七、参会人员

1.国内外知名企业研发和工程技术人员

2.国内外大、专院校科研技术人员

3.行业组织、研究机构、应用工程单位等

4.新闻媒体代表

中国电子学会

中国电子学会（Chinese Institute of Electronics）是由电子信息界的科技工作者和有关企事业单位自愿结成、依法登记的学术性、非营利性的全国性法人社团，是中国科学技术协会的组成部分，中国电子学会总部是工业和信息化部直属事业单位。中国电子学会于1962年在北京成立，现在拥有个人会员10万余人，团体会员600多个，专业分会44个，工作委员会8个，编委会1个和一个百人的办事机构。30个省、自治区、直辖市设有地方学会组织。中国电子学会的宗旨是团结和动员电子信息科技工作者，遵守宪法、法律、法规和国家政策，遵守社会道德贵规范；尊重知识，尊重人才，积极倡导“团结、创新、求实、奉献”的精神，促进电子信息科学技术的繁荣和发展，促进电子信息科学技术的普及和应用，促进电子信息科学技术人才的成长和提高，促进电子信息科学技术与经济的结合，为社会主义物质文明和精神文明建设服务；反映电子信息科技工作者的意见，维护电子信息科技工作者的合法权益，为电子信息科技工作者服务。中国电子学会的主要任务是开展国内外学术、技术交流；开展继续教育和技术培训；普及电子信息科学技术知识，推广电子信息技术应用；编辑出版电子信息科技书刊；开展决策、技术咨询，举办科技展览；研究和推荐电子信息技术标准；接受委托评审电子信息专业人才技术人员技术资格，鉴定和评估电子信息科技成果；发现，培养和举荐人才；奖励优秀电子信息科技工作者。

会议日程

即将更新，敬请期待

会议嘉宾

即将更新，敬请期待

参会指南

收费标准：1980元/人，会议期间食宿统一安排，费用自理。

北京南粤苑宾馆

交通指南：北京西站、丽泽商务区驾车距离8.8公里（约15分钟）；总部基地、丰台体育中心、南宫地区驾车距离6.7公里（约18分钟）；南苑机场驾车距离10.7公里（约36分钟）；首都国际机场驾车距离39.9公里（约64分钟）

北京南粤苑宾馆系一家涉外酒店，位于南三环西路玉泉营立交桥西南侧，紧临三环路，交通十分便利。　　北京南粤苑宾馆拥有标准客房，豪华套房，商务套房等多种房型。所有房间均安装了集计算机网、通讯网、有线电视网三网合一的多媒体系统，利用计算机网络实现多媒体服务。客房里可充分享受在电视上选择网络浏览、电影点播、互联游戏等全新视听服务。　　北京南粤苑宾馆拥有四个风格各异的餐厅，和多间设备先进，功能齐全的会议室，能满足不同需求。其中有能一次容纳300人同时开会的报告厅，同时配备先进的红外同声传译系统, 可以接待大型的国际会议。同时宾馆还拥有丰富多彩的娱乐健身项目。宾馆将始终秉承“以人为本”的服务宗旨，“宾至如归”的服务理念，提供热情，全面，周到的服务。

中国电子学会举办《2017全国图像图形处理技术应用大会》

会议通知 会议内容 主办方介绍

会议日程

会议嘉宾

参会指南 会议门票 场馆介绍

会议通知

参会指南