机器之心&ArXiv Weekly Radiostation
参与:杜伟,楚航,罗若天
本周的重要论文有 Bengio 参与、LeCun 点赞的开源图神经网络权威基准,以及 Nature 新研究中摄像头充当神经网络,速度超传统方法千倍。
目录:
Benchmarking Graph Neural Networks
How Much Can A Retailer Sell? Sales Forecasting on Tmall
Knowledge Graphs
Ultrafast machine vision with 2D material neural network image sensors
DefogGAN: Predicting Hidden Information in the StarCraft Fog of War with Generative Adversarial Nets
Inverse Graphics GAN: Learning to Generate 3D Shapes from Unstructured 2D Data
ArXiv Weekly Radiostation:NLP、CV、ML更多精选论文(附音频)。
论文 1:Benchmarking Graph Neural Networks
论文链接:
表 1:提议基准数据集的汇总统计信息。
示例图和超像素图。SLIC 的超像素图(其中 MNIST 最多 75 节点,CIFAR10 最多 150 节点)是欧几里得空间中的 8 个最近邻图形,节点颜色表示平均像素强度。
不同方法在基于 MNIST 和 CI-FAR10 的标准测试集上的测试结果(数值越高越好)。该结果是使用 4 个不同种子运行四次结果的平均值。红色为最佳水平,紫色为高水平。粗体则表示残差链接和非残差连接之间的最佳模型(如两个模型水平相同则皆为粗体显示)。推荐:这一新的研究有深度学习先驱 Yoshua Bengio 的参与,也得到了 Yann LeCun 的关注。论文 2:How Much Can A Retailer Sell? Sales Forecasting on Tmall
论文链接:
摘要:时间序列预测是学界和业界的一项重要任务,可以用于解决现实生活中的很多预测问题,如股票、供水和销售预测等。在本文中,来自蚂蚁金服的研究者对天猫平台上的零售商销售预测案例展开了研究。通过数据分析,他们得出了以下两个观察结果,其一是将不同的零售(商)分组后呈现出的销售季度性,其二是将销售状况转化为预测值后呈现出的 Tweedie 分布。基于观察结果,研究者设计了两种销售预测机制,即季节提取(seasonality extraction)和分布转化。具体而言,他们首先采用傅里叶分解方法来自动提取不同零售商的季度性,这之后可进一步作为任何已创建回归算法的额外特征。然后他们提出在对数变换后对销售的 Tweedie 损失进行优化。最后,研究者将这两种销售预测机制应用于经典回归模型,即神经网络和梯度提升决策树。
天猫平台上不同零售商的销售呈季度性波动。
两组零售商的季度性提取结果。推荐:根据天猫数据集上的实验结果,研究者表示,他们提出的这两种机制均能够大幅提升零售商的销售预测效果。论文 3:SLIDE : IN DEFENSE OF SMART ALGORITHMS OVER HARDWARE ACCELERATION FOR LARGE-SCALE DEEP LEARNING SYSTEMS
论文链接:
摘要:深度学习模型的训练和推理加速近来是研究领域关注的重点。虽然普遍观点认为,GPU 相比 CPU 有更强的算力优势。但在近日,莱斯大学的计算机科学家们公布了新的研究成果,其提出的深度学习框架,在大型工业级的推荐数据集上验证了在没有类似于 GPU 的专业硬件加速条件下,也可以对深度学习进行加速。在论文中,研究者指出,尽管已有的研究表明,在算法端对模型进行优化无法显示出如同 V100 GPU 那样强大的性能提升,但是他们提出的 SLIDE 引擎却可以实现。这一模型可以显著地减少训练和推理阶段的运算,比在 GPU 上 经过 TensorFlow 高度优化过的算法还要快。
局部敏感哈希的图示。对于一个输入,可以从对应的哈希桶中抽取哈希码。
SLIDE 系统架构。
TF-CPU 与 SLIDE 之间的可扩展性测试,很明显 SLIDE 要强很多。推荐:这篇论文的亮点在于,即使只验证了全连接网络,但至少说明高性能 CPU 真的能满足大模型的训练,能大量降低硬件成本。论文 4:Knowledge Graphs
论文链接:
包含两个命名图以及默认图描述事件和路径的图数据集。推荐:这篇长达 130 页的知识图谱综述论文可以让读者总览所有相关知识图谱的信息。论文 5:Ultrafast machine vision with 2D material neural network image sensors
论文链接:
与人脑一样,新芯片能以纳秒级的速度感知、分类简单的图像。
a 为训练分类器与自编码器的实验配置,b 为用于测量 time-resolved 的实验设置,c 为光学实验的近景照片。推荐:本文的亮点在于将神经网络与感光能力结合到一起,在感光的同时产生电流,在产生电流的同时完成视觉任务,这样的芯片还是非常有意思。论文 6:DefogGAN: Predicting Hidden Information in the StarCraft Fog of War with Generative Adversarial Nets
论文链接:
DefogGAN 的预测效果图与 Groud truth 的对比。图中分别以绿色和红色代表己方和敌方战斗单元。DefogGAN 能够预测未观察到的敌方战斗单元。
DefogGAN 整体架构图。
金字塔式重建损失。推荐:DefogGAN 不仅是对抗学习提升战争迷雾机制的最早应用之一,而且它还可以应用到现实世界中的其他马尔科夫决策过程(POMDP)问题。论文 7:Inverse Graphics GAN: Learning to Generate 3D Shapes from Unstructured 2D Data
论文链接:
摘要:通常来说,训练这样的框架需要通过栅格化处理来进行微分步骤渲染,因此,过去研究人员在该领域的努力都专注于开发定制渲染模型。然而,通过此类模型处理的图像会显得不够真实自然,也不适合用于生成游戏以及图形产业的工业效果图。微软的研究人员这一次做了新的突破——他们在论文中详细介绍了一个框架,该框架采用的「可缩放」训练技术是第一次被用于这一领域。研究人员提到,在使用 2D 图像进行训练时,该框架始终可以比现有的模型生成效果更好的 3D 形状。
通过在渲染自三个 ShapeNet 类的非结构化 2D 图像上训练 IG-GAN,由此生成的 3D 图示例。