首页 体育 教育 财经 社会 娱乐 军事 国内 科技 互联网 房产 国际 女人 汽车 游戏

字节跳动春招开放6000个岗位,在技术大牛身边工作是怎样的体验?

2020-05-22

近期,字节跳动宣告,本年春季招聘为大学生敞开超越6000个全职及实习生作业岗位。这一招聘数字,超越字节跳动以往每年春季招聘的规划,也让字节跳动成为本年互联网职业罕见的“不缩招”企业。

字节跳动招聘担任人表明,2020年,字节跳动会持续加大对人才的培育,倾泻更多渠道资源,协助社会发明更多的作业岗位。字节跳动将为应届毕业生供给宽广安稳的开展时机、完善的新人培育体系、相等敞开的作业气氛,以及有竞争力的报答和福利。

此前,2019 ACLFellow名单出炉,字节跳动人工智能试验室科学家李航当选。ACL Fellow是对NLP范畴从业者的最高认可。据ACL官网信息,李航因在「信息检索方面做出根底性奉献,特别在学习排序、深度学习和对话生成方面做出卓越奉献,一同促进了我国NLP的开展与商业化」而当选。

李航获东京大学核算机科学博士学位,曾任微软亚洲研讨院主任研讨员和华为诺亚方舟试验室首席科学家。2019年5月,李航编写的机器学习入门“蓝宝书”《核算学习办法》再版,字节范儿约请李航就新书内容、参加字节跳动的体会、年青技能人的生长、机器学习的未来和人工智能趋势等论题进行了共享。

在李航身边作业是一种怎样的体会?

字节跳动有的职工说,当然是很高兴,都知道他是职业里的技能大牛,在微软亚洲研讨院、华为诺亚方舟试验室等闻名安排有着丰厚的从业阅历。还有许多职工说,其实也没有那么奥秘,他总是穿戴衬衫西裤而不是码农的T恤,开会带着纸质簿本记东西,习气用手表看时刻,温文儒雅,一副大学教授的姿态。

他的另一个身份是《核算学习办法》的作者,这本书被许多人亲热地称作“蓝宝书”,是不少技能人入门机器学习的启蒙读物。他出书过三部学术专著,并在顶尖世界学术会议和期刊上宣布过上百篇论文,具有40项授权美国专利。

在以下访谈中,李航就新书的内容、参加字节跳动的体会、年青技能人的生长、机器学习的未来和人工智能的开展趋势等论题与咱们进行了共享。

关于新书

Q:《核算学习办法》第二版相对于榜首版有哪些更新?

A:核算学习即机器学习,榜首版首要是介绍了监督学习的算法与模型。第二版首要是在曩昔六年的时刻里,弥补了无监督学习的八个办法,并对榜首版的监督学习办法做了一些修正。虽然现在90%以上的机器学习都是监督学习,但无监督学习其实是机器学习的要点和难点,即让机器自己发现数据里的规则,它是未来完结强壮人工智能的重要推动力。未来我还预备花3-4年时刻把深度学习和强化学习加进去。由于我都是业余时刻写作,所以花的时刻比较久。

Q:许多人把《核算学习办法》叫做蓝宝书,是入门机器学习的启蒙读物,但一些学生看这本书会觉得费劲,能不能引荐一些入门的办法?

A:这本书的内容自身是最根底的,也便是机器学习范畴咱们都应该把握的东西,从这种意义上来说的确是一本入门书本。可是我并没有从入门的视点写这本书,而是更多地把一些最基本的概念,纲举目张地整理出来,也是我自己再学习和考虑的进程。你也可以以为是从教材的视点来写这些内容,因而这本书合适屡次阅览,需求常常检查,而不是看一遍就完事。

这本书比较合适有必定根底的读者,首要是数学根底。它不太合适特别入门的初学者,也不太合适概率论、核算学都不太了解的入门者,这些根底常识可以经过其它课程或教材快速补全。当然,读者也可以一边阅览《核算学习办法》,一边补全根底常识,这样学习或许功率更高。

当然,我期望《核算学习办法》不仅仅是教材,它还能为业界的工程师供给一些有用的协助。

Q:能不能给咱们共享一下阅历,年青技能人员怎样自我生长?

A:我觉得有几件作业比较重要。一是树立远大的抱负和方针,挑选自己喜爱做的,拿手做的,能给自己带来利益的作业的交集去做。拟定有应战的方针,想想期望自己5-10年后成为什么姿态。二是一旦有了方针之后,在日常的作业中扎厚实实地去做。其实没有捷径。

其他,咱们谈到技能人员的作业的时分,科学家和工程师的思想办法应该是不相同的。工程师的思想办法应该是面向问题处理问题,而科学家的思想应该是树立普世价值的理论和办法。在AI Lab的搭档们更是这样,需求明晰自己其时做的作业是哪种性质的。抱负是不断培育自己两方面的才能,但也有偏重。

关于参加字节跳动

Q:问答社区上有一个问题“怎样点评李航参加今日头条母公司字节跳动?”,所以你为什么参加字节跳动?现在为止,感觉怎样?

A:字节跳动有很好的产品和许多的用户,有人工智能研讨需求的大数据,公司也有许多优异的人才,总归这儿具有做技能开发最好的环境,有许多有意思的问题可以和咱们一同去做。事实证明,这是一个正确的决议,公司的机制和文明很好,咱们做起事来心情愉快,功率也很高。

Q:越来越多人工智能方向的专家从校园走向了工业界,怎样看待这种现象?

A:这取决于你自己想做什么作业,校园合适做研讨,工业界更偏产品和运用。人工智能年代需求运用大数据,校园很难有这样的环境,促进许多教师挑选到工业界。核算机科学范畴,现在跟曾经有很大的不同,曾经的研讨许多是大学先工业界后,现在是一起推动,乃至是反过来了。

我先后在NEC和微软的研讨部分作业过,它们更像是传统工业界的研讨部分,不直接担任产品的开发。字节跳动是我待过的第4家公司,这儿的研讨部分是这傍边最挨近产品的部分,许多东西需求在实践的场景中运用,这很挨近美国的一些互联网公司的做法,既有偏产品的作业又有根底研讨。

Q:你享用这种balance吗,莫非它不是一种角力吗?

A:我个人定见:抱负的状况是70%的精力做运用,30%放在相关的根底研讨上,当然中心没有一个明晰的边界。咱们需求为未来做一个很好的布局。这是这个年代技能开展的必然趋势。许多东西需求有实践数据以及实践场景去验证,机器学习原本也是这样一种技能。所以我很享用这种balance,而不以为是角力。

Q:现在首要在处理什么问题?

A:做好内容渠道。现在首要是开发自然言语处理和机器学习的技能,期望可以开宣布更好的智能信息处理技能,协助咱们更好地取得信息和常识。比方跟查找团队协作的精准问答,是为了协助用户愈加精确地获取高质量的信息。还有在头条的新闻引荐,用算法协助前进内容质量,打压低质内容,前进优质内容。

归纳来说便是要让每个用户在信息获取进程中有更好的体会,真实得到自己想要的东西。最抱负的状况便是咱们每个人都有智能帮手,想要什么信息帮手就给你什么。

Q:你开端读的是电气电子工程专业,为什么终究进入了机器学习范畴的研讨?

A:算是机缘巧合吧。我最早触摸人工智能,是大一的时分在京都大学的人工智能试验室,80年代末是人工智能很火的时分,那会儿看到机器翻译、图画识别就觉得很有意思。到90年代,我在日本NEC公司的研讨部分作业,偶尔的时机参加机器学习的小组,开端了研讨之路。

这期间阅历了人工智能的起起落落,但也感触到了整个范畴的巨大开展。那个时分只要专家在谈论AI,现在变成众所周知,咱们都能去谈论的论题,最典型的便是AlphaGo。咱们也现已在运用许多人工智能技能的产品,这是一个质的腾跃。欠好的当地是,感觉咱们会有一些浮躁,咱们的研讨和技能开发仍是应该更厚实一些。

能坚持在研讨路上的诀窍或许是坚持年青的心态吧,我感觉现在的心态跟20年前读博士的时分没有什么不同。做研讨很苦楚,也很高兴。要去做出一个比已有的办法更好的办法很不简略,研讨进程中的波折和懊丧也挺多的。但当你把一个的确work的东西做出来的时分,你的确会有很大的成就感。可以比方生长间隔跑,跑的进程傍边会觉得自己很累,可是当你抵达了结尾,会享用到完结一件作业的高兴,大约便是这种感觉吧。

Q:所以你算是见证了人工智能在我国的开展,你看好它的开展趋势吗?人工智能的未来到底是什么样的?

A:是的,2002年复旦大学安排过一个机器学习研讨会MLA,其时只要不到30人参会,但现在现已是近千人的规划了。不到20年的时刻,人工智能在我国现已有了日新月异的开展,这是让人意想不到的。

我国市场大、人才多、从业者尽力,这是其他国家没有的优势。可是也要注意到,咱们在立异方面的才能离美国还有必定间隔,这或许需求几代人的尽力。现在最基本最中心的概念和办法大多仍是在美国开宣布来的,咱们的快速开展更多仍是表现在产品落地上。我信任咱们速度很快,但仍是需求不断尽力,不断前进自己的立异才能,真实的立异仍是需求挺长时刻的。

咱们可以把人工智能了解为人类很好的东西,不要把它特其他夸张,至少未来很长一段时刻内是这样,就像你的秘书或许帮手。

关于机器学习未来

Q:你最近的一篇论文要点讲了脑科学,有一个观念是说机器学习很重要的内容便是对人脑的研讨,所以脑科学给人工智能带了来什么?

A:科学开展到今日,咱们对外部世界有了不少了解,可是对咱们自己内部的“世界”——人脑,咱们了解得还远远不行,这是当今最大的一个未知范畴。脑科学便是研讨这个问题的科学范畴。从核算机器的视点看,人脑是一个十分了不得的核算机,它的能耗还不到30瓦,就能做那么多杂乱的核算。

人工智能期望开发智能性的东西,离不开对人脑信息处理机制的了解。脑科学的开展,对人工智能是有启示和指导作用的,特别是自然言语处理这一块。人工智能有三大运用范畴——声图文,也便是语音、图画、文字,言语是最难的了。前两者是感知才能,而言语是认知才能。此外,看或听一个东西的时分,仅仅大脑的部分在作业,但运用言语的时分,是整个大脑在作业,所以说十分杂乱。假如咱们期望核算机可以像人相同去操作言语运用言语,那就需求对人的言语处理机制有进一步的了解,重视脑科学的研讨成果,多去进行跨学科的研讨。

Q:机器学习怎样跟深度学习结合?

A:《核算学习办法》的榜首版中,介绍了许多算法,都是十分根底与经典的机器学习办法,可是在深度学习年代,咱们更多的是依据阅历、试验和「启示式」办法了解模型,这些经典算法被咱们重视得比较少,反观常见的深度学习办法与技巧,却不必定有传统办法那样的理论。

其实传统机器学习与深度学习在技能上是一脉相承的,中心并不可以分裂。在我面试职工的时分,也会发现这样的问题,咱们对深度学习了解得许多,但对传统机器学习了解得十分少。这种现象并欠好,例如咱们在 TensorFlow 上完结某个模型,然后就直接跑试验,这样对许多基本概念了解得都不行。抱负状况下,咱们应该更全面地了解机器学习的概念与理论,再做深度学习实践,也便是说对传统机器学习的了解有助于更好地把握深度学习技能。

此外,虽然深度学习在很多使命上都有极好的作用,但也不能说传统机器学习就没什么用了。例如在小数据集或简略问题上,SVM 或 GBDT 这些办法在实践中用得仍是挺多的。

Q:有人说机器学习无疑是最有期望完结打破的方向之一,你怎样看待这个判别?对机器学习的未来有什么等待?

A:机器学习是人工智能的中心范畴,简直所有的人工智能技能其实都是机器学习技能,无疑机器学习技能的开展决议了人工智能的未来。期望机器学习能有更多的打破,促进整个范畴的开展。我以为,长时间来看,机器学习与推理和常识的结合,类脑学习或类脑核算是这个范畴的未来开展大方向。

Q:近年各种自然言语对话体系如漫山遍野般地出现,所以核算机多大程度上可以自若地和人进行对话?自然言语对话的应战在什么当地?未来或许会有哪些打破?

A:从功用的视点,核算机也有或许可以像人相同,自若地进行自然言语对话,可是现在这个出题无法证真或证伪。原因是尚不清楚人脑的言语了解机制,用核算机完好模拟人的言语了解依然十分困难。但在特定范畴,特定场景下,和人相同进行自然言语对话的核算机的完结,咱们现已看到。问题是怎样进行扩展,可以以更低的开发本钱掩盖更多的范畴和场景。

言语了解的中心是向内部表征的映射。多义性和多样性是核算机进行言语了解最大的应战。要完结详细的使命,表现核算机的智能性,界说和运用内部表征看来是不可或缺的。根据剖析的办法本质上是重要的,乃至是在谈天机器人的场景。根据检索办法更合适于单轮问答的场景。根据生成的办法只能用于特定的场景。多轮对话要表现完结使命的整个逻辑,有限状况机表明。敞开式的对话意味着动态地改动使命,所以在现在的技能条件下,是十分困难的;在特定范畴使命明晰的条件下的对话,实践可行。

近年,深度学习和强化学习的运用,使得对话有了长足的前进。首要表现在表征学习、端到端学习上。事实上需求符号表征和神经表征,深度学习和符号处理的结合,这应该是未来开展的重要方向。

Q:最终共享一部你最喜爱的科幻电影吧?

A:我看的电影不多,形象深入的AI相关的是斯皮尔伯格导演的《AI》,让人去考虑机器与人的智能的本质区别。

热门文章

随机推荐

推荐文章