字节跳动创始人张一鸣谈“今日头条”App:你的头条你决定
当搜狐CEO 张朝阳终于承认自己在移动互联网大潮中一错再错,想清楚自己的新闻客户端布局的时候,一款叫做“今日头条”的App 应用已经成了他的拦路虎。
“每一屏五条新闻中会有两三条我感兴趣的内容,就像定制的报纸一样。别的客户端新闻经常不是自己感兴趣的,得不停地翻屏找自己关心的东西,效率差。”像周帆这样的互联网从业者,行业新闻是每天必做功课,“今日头条”就是他最常用的新闻客户端,其他新闻客户端都不会把他关心的事放到首页。
凭借为用户“定制”移动报纸,截止到2012 年12 月31 日,“今日头条”的用户总量已经接近1,000万,在新浪微博的日分享信息超过10 万条。按照第三方网站App Annie 统计,在App store2012 年三季度的媒体类客户端中,“今日头条”排名第二,仅次于苹果官方的“iBooks”,超越了“腾讯新闻”、“搜狐新闻”等互联网大佬。
其开发商北京字节跳动科技有限公司(下文简称“字节跳动”)在创立不到一年就获得了来自海纳亚洲(SIG)和以及华尔街著名经济学家、投资银行家的首轮风险投资,融资额达到500 万美元。
今年29 岁的张一鸣,就是字节跳动的创始人,从牛仔裤上的油渍上你很容易看出他是一个典型的技术宅男。出生于福建龙岩的张一鸣从高中时代起就酷爱计算机,2001 年进入南开大学先后就读于微电子和软件工程专业。他在大四时编写的电路板自动化加工软件PCBS 曾获得过“挑战杯”二等奖。
大学毕业后,张一鸣在一次短暂而失败的创业后进入旅游搜索网站酷讯。作为酷讯的第一个工程师,他全面负责酷讯的搜索研发,一年后成为高级经理,最终担任技术委员会主席。2008 年由于混乱的管理,张一鸣离开酷讯加入微软,终因受不了低效率的工作方式离职。
2009 年初国内第一个微博网站饭否吸引了他,他开始担任技术合伙人,负责饭否的搜索、消息分发、热词挖掘、防作弊、用户排名等后台系统方向,为社交分析储备了大量技术。
当饭否被关闭之后,海纳亚洲找上门来,希望出资由张一鸣创立一家房产信息网站,张一鸣由此创立九九房。在九九房,张一鸣开始涉足移动开发,6 个月间推出掌上租房、掌上买房等5 款移动应用,在当时的移动互联网环境下实现150 万用户,是房产类应用的第一名。
“当时觉得自己这么好的技术用在房产行业上太小了,就想做一家移动互联网公司。”张一鸣由此辞去九九房CEO 职位创立了北京字节跳动。
移动互联网的争夺是流量的争夺,而在用户的主要入口中,浏览器、搜索、输入法、社会化媒体、即时通讯工具等领域格局已经基本确定。新闻客户端是仅存的依然能诞生巨头的战场,也就成了移动互联网的下一个必争之地。
按照易观国际《2012 年上半年新闻客户端市场研究报告》,即便是截至2012 年一季度,移动互联网的4.5 亿用户中移动阅读的活跃用户就已经达到3.45 亿。而在移动阅读使用者中,52.5% 的人经常阅读报纸类,39.8% 经常阅读资讯,新闻客户端是他们获取这两类信息的主要入口。
在张一鸣看来,同其他基础入口相比,新闻客户端用户渗透率高,无论国内外,基本是App 第一应用;使用频率高,用户甚至只有半分钟空闲时间都会打开;留存度高,某款游戏会玩腻了,但资讯是长期需要,不会删除的;有很高的可附加性,可以附加商业信息、生活信息、广告,相比之下,闹钟等应用虽然常用、留存度高但是没有可附加性。
“今日头条”新闻的有效性是其特点,哪怕只能用半分钟等候电梯、只能打开客户端首页也能找到自己感兴趣的新闻,而且同一天不同时间打开首页新闻都会各不相同。“我们只给你最想看的新闻,而不是那些你不关心的新闻。”
相比于新闻客户端,张一鸣更愿意把“今日头条”称为是兴趣媒体。当搜狐、网易等新闻客户端将门户新闻直接搬到手机上,推送给用户千篇一律的新闻时,“今日头条”会甄别用户的独特需求,只推送那些单个用户感兴趣的新闻。“网站上都会讲奥巴马如何如何,实际上用户更感兴趣的可能是自己家门口的地铁站发生了哪些事情。”
在用户的主要入口中,新闻客户端是仅存的依然能诞生巨头的战场,也就成了移动互联网的下一个必争之地。
这份移动报纸的“定制”可不是通过人工编辑出来的,而是通过一整套机器算法的资讯流水线来实现的。“本质上我们跟搜狐新闻、网易新闻是两码事,他们更像是门户新闻网站在移动端的延伸,更偏向于用传统的方式做媒体,而我们是以技术实现一切,没有人工编辑。”张一鸣说。
“定制”的基础是基于对用户社交兴趣的数据挖掘。当用户用新浪微博账号初次登录“今日头条”时,他的兴趣和阅读偏好在5 秒之内被分析出来,最感兴趣的新闻随即被推送到眼前。此后,随着他在“今日头条”页面每一次的点击阅读、顶、踩、评论等阅读动作,他的兴趣被更精准地分析出来,变得越来越懂他。“今日头条”不需要用户自己思考“我喜欢什么”,而是主动去理解用户“你的喜欢”。
对于“你的喜欢”的判断来自三个层次:大家都喜欢的新闻(即通常意义的社会热点)、兴趣相近的好友喜欢的新闻和你会喜欢的新闻。而对于每条新闻评论的排序也很酷,优先展示社交好友的评论,其次是社交网络的意见领袖,而不是那些不加筛选的路人甲的评论。
“定制”背后的技术壁垒颇为复杂。来自于酷讯的搜索技术、来自于饭否的社交分析技术、来自于九九房的移动互联网技术被张一鸣结合在了“今日头条”之中。
用户分析、搜索、推荐是“今日头条”的技术三部曲。用户分析的背后是大规模的数据挖掘和机器学习。“常见的用户类型分析是手机型号,还有就是位置,在哪个城市。但是这个分析维度太低了。”张一鸣基于社交数据和用户行为挖掘将人分为上万个纬度,建立不同的模型。“这样我们可以发现你历史上的所有行为是‘小清新+ 科技’还是‘三俗+ 古典’。你最近从宅男变潮了,我们也会发现。我们都需要及时地进行很大量的运算。”
张一鸣笑着说。这些用户分析模型和维度也是由计算机自动搭建和计算的。基于社交数据和用户行为挖掘技术来实现产品的公司,目前在国外做得比较好的有Zite、Prismatic 几家公司。
在搜索技术上,国内具有独立研发搜索引擎的公司并不多,“不超过5 家”。在搜索引擎浸淫多年的张一鸣说。同时,手机搜索同互联网搜索相比有着不同的特点。通常用户常常对使用电脑搜索精度要求不高,每页20 条,结果不满意就翻页。而在使用手机时,由于时间短暂就要求高效,三条之内必须有一个有用的结果。信息分析精度要求大大提高,需要尽量提取网页内容正文,去除网页冗余信息,甄别同一内容不同主题的文章,去掉重复。
在信息推荐上,使用互联网搜索引擎时,不同用户搜同一关键词的展示结果一样。而“今日头条”则是每个用户的每次请求都会更新。“这导致计算量很大,用户一个小时前浏览了哪些内容,在一小时后的搜索中就要考虑进去,并呈现出不同的结果。”张一鸣说。
在新闻中会插入大量的图片和视频等多媒体信息,相应会需要强大的多媒体搜索、去重技术。这是字节跳动的另一强项。“国内拥有多媒体处理技术的公司少于3 家,已发布产品的只有两家。同一个人同一个场景稍微动一下,对机器而言就意味着完全不同的图片,怎么识别、去重很难。”张一鸣很是自豪,字节跳动的图片检索精度能够达到98% 以上。
从机器识别的角度看,张一鸣把信息归纳为五种,短文本、长文本、图片、视频和结构化信息(例如商品,对它描述需要同时包括文本、图片等多维度)。实际上,张一鸣通过“今日头条”搭建的并非只是一个新闻客户端,而是一个可以全面处理这五种信息的“用户分析+ 搜索+ 推荐”的技术平台。
字节跳动已经基本完成了这五种信息处理的技术储备,并开始用产品的形态呈现出来。除去“今日头条”之外,字节跳动旗下还有“内涵段子”、“搞笑囧图”、“内涵漫画”、“好看图片”、“今晚必看视频”等12 款应用。总体表现不俗,其中的“内涵段子”在娱乐类排名一度超过唱吧。
“这个平台无所谓搭载什么信息都可以。将来商业信息、生活信息、折扣信息都可以搭载。这会是一个商业价值介于门户和搜索之间的巨大市场。”张一鸣的野心不小,他相信当“定制”折扣、“定制”吃货等一系列定制信息出现时,一个巨大的商业市场由此呈现,“在2013 年,我们将开始自己的商业化尝试,但不会以盈利为主要目标,我们相信只要能给用户创造足够大的价值,商业价值的实现会是水到渠成。”