猎聘网单艺:机器学习在人才招聘领域的应用
由51CTO主办的WOTI2017全球创新技术峰会将于7月21日拉开帷幕。本次峰会将围绕机器学习、人机交互和智+应用三个大主题展开,数十位专家级嘉宾将带来多场精彩的技术内容分享。
记者在会前采访了猎聘网首席数据官单艺,他在猎聘网主要负责机器学习技术和产品研发、商业数据分析以及大数据基础设施建设,是此次WOTI2017全球创新技术峰会重要演讲嘉宾之一。他的演讲主题是自动化建模下的高效机器学习应用开发。
单艺,毕业于清华大学和美国University of Arizona,管理信息系统专业学士和硕士学位。拥有17年的数据挖掘和系统研发经验,曾经入选“影响中国大数据产业进程100人”。之前曾任Omni-Dimension Inc(毕肯互动)和WPP Group/奥美ITOP 24/7 Networks的CTO,负责数据驱动的互联网广告优化技术和精准广告网络的研发;空中网悟空搜索副总裁和美国Yahoo!网页搜索资深工程师,从事大规模搜索技术和文本挖掘技术的研发。
当问到机器学习和深度学习在中国的发展时,单艺老师这样说:“ 在搜索和广告业务中,机器学习的运用已经相当成熟。在搜索中,从网页的抓取解析、内容分析、搜索排序都大量使用了机器学习;在广告业务中,CTR预估、广告排序竞价以及受众定向中也都广泛应用了的机器学习技术,取得了很好的效果 。近两年,在搜索、推荐和广告中,运用深度学习进行排序也取得了很好的进展。”
机器学习在猎聘网快速发展
在互联网招聘行业,机器学习的运用正在快速发展。在招聘行业中,实现人才和工作机会的高效匹配,即准确、高效地匹配人和职位,是一个核心业务需求,也是一个较为复杂的业务。
单艺强调,要解决好这个问题,就需要能够让机器对职位需求和简历进行深入分析、抽取和理解,然后在几百个维度上对职位、简历、候选人和HR进行准确的匹配。而这就必须要使用基于机器学习的自然语言处理、匹配和排序模型。
机器学习在猎聘网的应用中能够达到何种效果呢?“通过使用自然语言处理技术,已经能够实现对职位需求和简历进行深度分析理解;同时运用基于机器学习的人岗匹配预测模型进行匹配、推荐,已经达到一个比较令人满意的效果。”单艺无不自豪的说。
自动化建模代替传统建模
传统的机器学习开发方法已经能够帮助猎聘网实现很多决策和预测的自动化。例如,搜索排序更加准确、广告更加有效果,也使得人岗匹配更加符合人才或者候选人的需要。但是,在后续的发展中,单艺意识到,传统的机器学习渐渐引发了新的问题。
机器学习建模的过程基本上是靠专家手工完成,是一个比较费时费力的过程。整个过程一般要分为优化目标定义、数据收集和清理、特征设计、算法选择、算法调优等多个步骤。靠专家手工来做,耗时很长,非常依靠专家的经验,而且结果不一定是最优的,总体成本过高。
于是,单艺就带领团队进行自动化建模下的高效机器学习应用开发。单艺透露,开发工作中主要使用贝叶斯优化的思路来实现自动化的建模工作流程,具体的方法将会在7月22的WOTI2017全球创新技术峰会——深度学习会场看到。
应用机器学习的意义
机器学习在很多企业中都有广泛的应用,但是,在什么样的场景下或者遇到了什么问题,应用机器学习才有意义?
单艺认为,从销售商机的排序分配、精准营销、业务流程的自动化、风险管理,到互联网中常见的推荐、匹配业务都可以运用机器学习的算法。“抽象的来说,如果企业有基于数据的决策和预测问题,而且这些问题里面有一定的规律可循,那就可以尝试运用机器学习,或者用算法来支持人的决策和预测。”
与此同时,企业在运用机器学习之前,要有明确的应用场景和目标。只有明确了目标之后,才能够进行相应的算法设计和数据的收集工作。单艺强调,数据的收集和质量保证在机器学习中是非常重要的事情。另外,为了开发机器学习应用,企业必须要有相应的机器学习团队或者小组。猎聘网的机器学习团队就是从实际的应用问题出发,一步一步构建项目组,逐渐成型。
值得关注的人工智能方向
“人工智能在互联网公司、金融、还有其他行业都会有越来越多的应用。“单艺表示,比如说,像医疗、交通、保险、娱乐和服务行业都会有很多的应用。
最后,他推荐了三个值得关注的人工智能方向:第一个方向是自然语言理解和对话,这将改变人机交互的模式;第二个是如何解释模型的决策依据而不是黑盒子,我们需要可信任的模型;第三个方向就是在训练数据少的情况下如何进行有效的学习。
【51CTO原创稿件,合作站点转载请注明原文作者和出处为51CTO.com】