首页 > 计算语言学的盛会: ACL2018见闻 | 语言学午餐

计算语言学的盛会: ACL2018见闻 | 语言学午餐

发布时间：2018-08-10 11:44

ACL 是计算语言学会 (the Association for Computational Linguistics) 的缩写。如果后面跟着年份，则是指当年的 ACL 年度学术会议。

在计算语言学界，最激动人心的活动无疑是的计算语言学协会ACL的年度学术会议啦！

这是计算语言学和自然语言处理领域的顶级会议，是一场学术的盛会。参会者不仅能在此展示自己的科研成果，关注各方向的发展动态，还能和众多优秀学者亲密交流。

今年的ACL于7月底在澳大利亚墨尔本召开，小编有两篇文章被录用，同时也有幸成为了会议的志愿者。作为第一次参加国际学术会议的萌新，午餐君对一切都感到十分新鲜，心情可以说是十分激动啦！

今天的午餐，就让小编把会场的个人见闻烹饪给大家吧！

开幕式、ACL会议手册、墨尔本旅游指南、小编的名牌和志愿者衣服

会议规模增长迅速，机器翻译趋于饱和

据统计，今年ACL共收到1544篇投稿，在1600余名审稿人的审核下，最终录用了381篇论文，录用率为24.7%。

ACL 2017录用论文的标题中出现最多的词汇有 “machine” 和 “translation”，说明 “机器翻译” 是去年最大的研究热点；而今年的统计却发现 “learning” 一词频率最高，侧面说明今年有很多论文侧重于将新的机器学习方法运用到各类NLP任务上。

在被拒绝的文章标题中，“translation” 和 “word” 是最常见的词汇，这也许意味着有关 “机器翻译” 以及 “词级别语义” 的研究渐渐趋向饱和。

ACL2018被录取和被拒绝的词频统计

ACL的亚太地区分会（AACL）成立啦！

在第一天的欢迎会上，ACL主席宣布了一个令人兴奋的消息：ACL的亚太分会 AACL (the Asia-Pacific Chapter of the ACL) 正式成立了！ AACL分会成立的主要目的是促进亚太地区50多个国家/地区在计算语言学方面的发展。

目前，ACL已有三个分会：北美地区的NAACL、欧洲地区的EACL，和亚太地区的AACL。AACL 会议将会在偶数年进行举办，第一次的举办时间定在了2020年。

从组织名单中我们可以看到，华人学者占据了非常重要的地位。比如，百度研究院院长王海峰担任主席——王海峰是唯一做过ACL主席的华人，也是目前最年轻的ACL Fellow。另外，清华大学的刘洋教授担任秘书。

学术热点概览

被录用的论文主要分为口头报告 (Oral Presentation ) 和海报 (Poster) 两种形式。

口头报告按照研究方向分为若干个track，一天四轮展示，上下午各两轮；同时并行6个session，每个session一般包含4~5篇文章。论文的作者会上台结合幻灯片来展示他们的论文，并回答在座听众的提问。

每个session都会有一个 Area Chair 作主持人，也有志愿者协助控制演讲流程。因为很多session是并行的，而且不同session之间的地点也不是很近，所以大多数参会者会挑自己最感兴趣的领域的几个session来听。（小编还想着每个session都问一个问题，后来发现实在太难了！）

听众在排队向讲者提问

Poster session是在午餐的时间，共有两个小时。在一个宽阔的中央大厅里，摆满了挂着海报的展板，每个展板前都有论文作者给感兴趣的人进行讲解。展板周围有丰富的食物和饮料，所以学者们可以一边端着盘子吃午餐，一边交流学术问题。

小编当时因为分身乏术，索性把自己的两张海报放在了一个展板上，没想到成为焦点，被围观了。

小编最感兴趣的领域主要是信息抽取 (information extraction)、自动问答 (question answering) 和语义解析 (semantic parsing)，因此较为仔细关注的也主要是这几个领域和相关的研究进展。

简单分享三个感受给大家：

抽象语义表示 (Abstract Meaning Representation, AMR) 更加热门了。AMR是一种语义表征方式，其特点是把相同语义的不同句子抽象表征为同样的图结构。小编这次至少看到了四篇有关AMR的文章，并且主题非常相近。AMR作为新一代的语义表征方式，有望在各NLP任务中提供帮助，所以它有更高的热度也很好理解啦。
通过引入外部知识来提升神经网络模型成为了新的热点。今年有至少三篇论文探讨如何高效使用外部知识来提高深度模型的效果。
迁移学习 (Transfer Learning) 在NLP中的应用更加广泛了。跨语言的模型迁移 (cross-lingual model transfer) 也开始逐渐变为热点。

另外，小编也发现关注于模型评测和错误分析的论文也开始多了起来。比如在知识图谱表征 (Knowledge Graph Embedding) 方面，今年就有一篇研究如何通过分析embedding空间几何性质的文章；还有一篇文章是专注于关于如何利用统计学方法更科学地评测NLP模型的。

有趣的是这个作者做完演讲之后，非常“勇敢”地在问答环节讽刺了下现在大家不怎么读统计学的书，结果被一群老教授排队攻击，火药味异常浓烈。

特邀报告 & 最佳论文

今年的会议有两个特邀报告，标题分别是——

1. “Who is the Bridge between the What and the How”

2. “Deep Neural Networks, and What They’re Not Very Good at”。

第一个报告由 CMU-LTI 的Carolyn Rosé教授主讲。她希望大家重视社会语境对自然语言处理的影响。

小编特别喜欢她的 “social meaning as wind” 的比喻。她把社会语义比作一阵风：一阵风刮过，我们虽然看不见，但是往往对一部分语义的影响非常显著。因此在做自然语言处理问题的时候，考虑语言在不同社群间的变化是非常必要的。

第二个报告由University of Adelaide 的Anton van den Hengel教授主讲，以Visual Question Answering (VQA) 任务为主题，论述了深度神经网络 (deep neural networks) 在很多需要外部知识的地方效果不稳定。

Anton 用了一个图片举例，图片中一个网球运动员将球打到网上，可机器却无法真正理解该选手是否得分了。这种需要推理和常识的问题成为了神经网络模型的共同弱点。

在主会议的最后一天，小编有幸担任最佳论文会场的志愿者，所以没有错过这次异彩缤纷的展示。这次一共有2篇最佳短文和3篇最佳长文，还有1篇最佳demo奖颁发给了 USC/ISI 关于机器翻译的工具包，当场还对若干优秀文章进行了颁奖 (Honorable Mentions)。

最佳论文们的研究方向各不相同，有的从如何构建更好的数据集的层面提出SQuAD 2.0；有的研究了如何更好利用社区问答系统 (community QA，比如知乎和百度知道)，从而提高自动问答系统的效果；有的则利用传感器来检测人体在理解语言时的电波信号 (如EEG)，从而提高parsing的效果....

可以说最佳论文们确实从各个方向拓宽了计算语言学领域的发展！

Social Events!

学术会议虽然以学术为主题，但是社交也是学术会议的核心功能之一。在一些较为放松的场合，学者之间们的互相交流不仅可以促进未来的合作，也让整个社群的凝聚力更强了。

在主会议的第二晚，ACL官方别出心裁地组织了一场在水族馆的social event！在水族馆里，参会者端着酒杯一边观赏神奇的生物，一边聊天，还有专业的乐队伴唱。（还看到若干尬舞的学者，非常可爱了！）

小编和偶像 (Stanford NLP Group的Chris Manning教授) 的合影

学术界与工业界的交流也是学术会议的重点之一。会议的赞助商中不乏 Apple，Google，Microsoft, Facebook、Amazon 等科技巨头企业，也有字节跳动、百度、京东、腾讯等国内企业的身影！这些企业在会场不仅充分展示了自己的前沿科技，还组织晚餐聚会招揽学术人才加入他们。（小编最喜欢蹭吃蹭喝了！）

澳大利亚的自然风光！

参加学术会议的另一大好处就是可以借机旅游啦！小编在会议结束后的几天里和小伙伴们把墨尔本和悉尼玩了个遍！在企鹅岛看到了萌萌的野生小企鹅，了解了心愿！毫无保留的海洋、悉尼歌剧院、塔隆加动物园里神情忧郁的动物们...说着说着小编又想回到澳大利亚了！

企鹅归巢

被淘气的鹦鹉咬了....

不知道大家看了小编参加学术会议的游记，有没有产生加入科研队伍，多多发paper的动力呐？（手动斜眼

往期精彩内容

计算语言学漫游计算语言学院校信息机器翻译机器作诗 志玲姐姐送命题翻译腔语言学期刊郭敬明语码转换妇女谁是卧底《降临》 “在吗？” 倒装句高翻毕业生希拉里的笑语言学老师新概念英语怪癖怎样让大排不硬外语口音