第一百二十六章 老不正经杰姆斯?(2/5)

  【学霸从谈恋爱开始】小说免费阅读,请收藏 全本免费小说【qbmfxs.com】

  金恩熙?

  看到这小哥一脸骄傲的模样,苏飞表示完全没听过,但他还是耐着性子微笑着示意对方接着说。

  “然后,我提出的论文还有参考的资料在这。”小哥掏出一叠厚厚的纸,随后又掏出一根黑色记号笔,说道:“但我还是推荐在白板上给你画一个模型图,我的想法非常简单,你看一眼就会明白,但我相信你会大受震撼!”

  “额,这是您的论文,不是金教授的论文?”

  苏飞瞪大了眼睛,一个硕士生能在变形金刚论文入库仅半个月就推导出预训练模型?

  好吧,作为本科生就提出变形金刚的作者本人来说,的确有这么个可能,难道这个小哥也开挂了?

  “bro,这也是我瞒着我们金教授来参加这次学会的原因,金教授觉得我的成果有待商榷,他们就是做事太谨慎,不懂得抢得先机的重要性。”小哥说得眉飞色舞,颇有一种独自一人远征美国的豪迈之气:“而我,要在这里,在斯坦福,在acl向他们说明我们大韩民国的真正实力!”

  好吧,苏飞总算知道这个有着重大成果的海报却无人问津的原因了,敢情您这是瞒着导师来的?

  偷了他邀请函进来的么?

  “稍等一会儿,马上就好。”

  小哥拿着黑色记号笔在白板上写写画画,

  这位小哥的言行吸引到了不少人的目光,他那自信且流畅的书写动作,让苏飞也觉得是不是真是一个特立独行的天才。

  怀着一丝期待和一丝好奇,苏飞认真地看着这位小哥的模型结构和证明过程。

  简而言之就是疯狂做减法。

  变形金刚由六个编码器和六个解码器组成,每个编码器和解码器里又分为多头注意力层、归一化层和线性层等等,这位小哥直接把六个解码器全砍了,编码器也砍了五个,剩余的一编码器里把里边各层也砍了好几个……

  emmmm……虽然你说你的想法很简单,但这也简单得太过分了……

  苏飞终于忍不住了:“冒昧地问一句,你做过实验么?”

  “实验?噢,bro,为了赶这次acl,我加班加点,实在没时间,但我保证我的这个结构是有效的,因为经典的elmo预训练模型也是这种简单的单层结构!”

  我特么……苏飞差点吐血,我的elmo的确也是疯狂做减法,但elmo模型和注意力机制有个毛线关系?

  敢情这位就是把elmo模型抄一半,再把变形金刚抄一半,组合成自己的论文?

  特么的!抄的左一篇右一篇全是我的论文!

  “或许你不了解变形金刚的设计意义,之所以这样重复性地叠加编码器和解码器是为了获取更高层次的特征,这个是由作者本人多次实践得出的结论,大幅度削减这些结构会让训练结果非常不稳定,elmo的单层结构是因为作者在建模之初只有一个命名体识别任务,不需要提取更高级的特征向量……”

 

本章未完,点击[下一页]继续阅读-->