注册    登录
新闻
热点专题 首页 > 空间动态 > 热点专题

启迪之星|投资人创业的“野心”:带着30万家创业公司数据,她瞄向了二级市场【秀场】

发布时间: 2017-10-31 阅读:218

烯牛数据  秀场

■ 2016年6月 烯牛数据成立

 2016年12月 获得来自启迪之星创投等机构的800万元天使轮投资

 2017年7月 APP上线(此前PC和微信端已上线)

 2017年9月 拥有30万家创业企业数据,投资人用户1万人

■ 目前,烯牛数据正在进行pre-A轮融资,计划融资2000-3000万人民币。

 

一个能够抵挡住诱惑的人,常常并不是因为TA无欲,而是因为TA心中有更大的图景。李锦香大概就是这样的人。她微笑着拒绝客户的一个个订单的时候,这位曾经的投资人,现在的创业者说她并没有犹豫。

 

李锦香 烯牛数据创始人

 

2016年以前,李锦香是戈壁创投的VP,这一年6月,她和时任戈壁创投CTO杜强,以及在德国人工智能研究中心做研究的周煜东一起创业了,公司叫烯牛数据,是一家大数据驱动的一级市场量化投资平台。

 

经过2年的发展,烯牛拥有30万家创业企业的数据,建成了国内最大、最全的一级市场数据库。最重要的是,这个库里并不是“一潭死水”,对于数据的智能化处理,让用户都能在这个库里,把碎片化的信息拼接起来,并且随时打破,按照不同的指标任意组合。

 

烯牛数据PC和微信端在2016年12月中旬上线,APP在今年7月上线。短时间内,烯牛数据积累投资人用户一万多。

 

 

30万家创业公司全维度数据

每日新增创业企业近400家,机器完成数据采集分析

 

烯牛数据有着目前国内最大、最全的一级市场数据库,拥有30万家创业公司的数据,以及1万多家的投资机构的数据,并且保持着每日将近400家、新闻数据有4000条的新增。

 

30万家,这是一个什么概念?李锦香说,覆盖近几年在网络世界中被报道过的几乎所有创业公司。

 

“大部分数据我们是从网上抓取的,抓取本身难度不大,最难的是对数据的清洗、分析、分类等处理。”比如说,有的企业2016年融资,可能2017年才曝光,很多数据服务商无法识别;而有的公司名称是通用性词汇,如何区分也有难度。

 

在海量的数据中,识别出一家新的创业公司,并且找到它的团队、产品、工商信息、融资轮次、新闻事件、媒体专访等一系列数据,需要一套智能的算法。李锦香说烯牛的智能算法,已经走的比这个更远了。

 

在烯牛,用户可以看到的企业数据维度除了融资、产品等内容,还包含了企业的APP下载量、各类排行中的情况、招聘的职位,甚至官方微博的粉丝量活跃度。每一条数据后面,都附有来源,以备查验。每新增一个企业,机器会在2-3分钟内就能收集到它的全部材料,并做好分类。

 

 

于是,在烯牛数据中呈现的,是30万家企业的多维立体形象,而每天4000条以上的数据更新,随时跟进这每一家企业的动态,让30万个“形象”又都活了起来。

 

要想让数据说话,还需要对数据的深度挖掘。数据拼凑的“形象”需要随时能够被打破,按照不同的要求建立起新的模型。“标签”是烯牛数据对此的解决方案。

 

烯牛数据上的标签和特色标签

 

“每一条数据,一旦进入我们的库里,机器自动会给它打上不同的标签”,李锦香说,烯牛现在已经有标签近万个。其中除了所在行业、发展阶段等描述性的标签外,还有烯牛特色的量化标签,例如“媒体热议”、“招聘活跃”、“知名机构投资”、“团队优秀”等等。任意标签之间的组合,都对应着数据给出的答案。

 

全维度数据、标签化、实时更新,这些让创业者和投资人随时可以了解全国创业动态。如此大的数据量,需要多少人维护?不到10人。李锦香说烯牛数据所有呈现出来的信息基本都是机器完成,“人工会有较少的干预,且基本扮演审核的角色,而且人工的每一次干预都是反馈给机器,是机器自身学习的一种方式”。这在行业内处于绝对领先的地位。

 

 

创业数据的智能“超市”

通用化功能开发:把投资人需要信息推到眼前

 

多维度的数据,为烯牛做其他拓展性的工作,提供了可能。

 

假如某位投资人想了解在人工智能领域,专注机器学习方向,在天使轮阶段,在北京创业且团队优秀的创业公司,那么他点击就会发现10家创业公司和他们的详细信息。(如下图所示)

 

 

除了按照行业和轮次等等标签搜索创业公司、查找某企业的完整信息,了解一个行业的创业公司情况。烯牛数据还制定了一些通用化的功能为个人用户和企业用户服务。

 

用户可以基于不同的标签关系,创建各类型的专题,这不止能查找到库里的相关信息,符合条件的新增企业和信息也会被实时推送到专题里。机器也会根据每个用户在烯牛的行为去推荐企业。

 

追踪企业动态,是投资人可以在烯牛免费使用的另一个通用化功能。任何投资人感兴趣的创业项目,都可以点击追踪,只要互联网上有关于它的相关更新信息,机器都会自动推送到用户的手机上。

 

烯牛就像是一个创业和投资数据的智能“超市”,这里的一切数据都是实时更新,自动生成,“你可以在这面逛,我们也可以按照你的需求把你需要的企业推到你面前

 

烯牛数据也为机构用户制定了付费版的通用化管理系统,可以提供包含API的对接在内的4类服务。“为投资机构构建大数据驱动的管理系统,行业内是我们最先提出的,现在也有同行在做,但我们的优势是与数据库的联通”,烯牛的所有数据都会为投资机构的投前、投中、投后的管理服务。

 

除了在发现正在融资的企业,一键录入企业信息,追踪企业信息,共享公司内每位投资经理负责的投资情况,公司例会等等基础服务外,烯牛数据还会提供“统计数据”,显示公司投资的转化率等信息,并会有信息提示本机构没有推进的案子,有多少是被什么机构投资了,等等。

 

在投后管理中,有数据图会告诉用户所投资企业在不同阶段的发展,动态追踪,竞品情况等等,一目了然。

 

“很多人很烦管理系统,觉得他反而会降低自己的工作效率,尤其是干活的人。我们在这里面希望能够把数据和管理系统结合起来,尽量帮大家提升效率。”。

 

烯牛数据的管理系统是按账号和功能模块来收费的,即使有管理系统的投资机构也可以单独购买追踪、项目推荐等模块,通过数据真正地提升效率。

 

烯牛数据团队

 

瞄准一二级市场联动和量化投资

不贪恋小钱,不做定制化,专心一级市场的数据挖掘

 

李锦香说,烯牛数据现在还没有BD的团队,也没有特意的去做销售的工作,但是还有很多投资机构闻声而来。他们看中了烯牛在数据上的实力,有不少机构提出想做定制化的管理系统。

 

“我们会根据大数据,制定一些免费和付费通用化的功能和管理系统,但是坚决不做定制化”,对此李锦香的态度也很明确,原因是“太牵扯精力,也限制了自身的发展”。

 

李锦香觉得,假如把时间花在沟通一家家的沟通需求上,还不如去把数据做精。“假如专注在定制化的系统上,拼了命我们的增长也是线性的,但是数据的挖掘和分析不一样,也许前期我们走的慢,但是一旦时机成熟我们的增长是呈指数性的往上走”。

 

李锦香觉得自己不能贪恋小钱,那么她心里的“大钱”是什么?基于数据的拓充和挖掘,探索量化股权投资和一二级市场的联动。

 

现在,烯牛数据已经基本完善了面向投资机构的通用化产品,下一步除了加强市场销售外,烯牛的重点还会在持续的进行数据的挖掘和智能化的研发上。李锦香觉得,新的投资时代要来了,在那个时代里,一级市场的企业数据是重中之重。

 

VC本身是一个朝阳产业,很多公司都在做早期的投资,包括创业公司都在投创业公司。因此,李锦香认为VC的概念以后会泛化,股权投资会越来越活跃,对于数据的依赖会越来越强。

 

首先一级市场的股权交易会变得活跃。对此,李锦香说烯牛会基于数据,研发更深度的算法——“不仅能够找到项目,还能判断项目的潜力”。那么,一旦一级市场能够形成一个有效的交易市场,“我们基于数据就可以做很多的东西”。

 

一级市场变得活跃还有多远?李锦香觉得快的话2、3年就可以。“2014、2015年的时候出来过一波众筹,其实就是在往前跨一步。虽然现在股权众筹不活跃了,但这是调整期,未来再出来一波股权投资浪潮的时候,肯定不是之前那么粗放的形态,这个时候数据就是发挥巨大作用”。

 

一二级市场联动,是李锦香对未来投资市场的另一个判断。

 

李锦香所指的“联动”并不是让二级市场的上市公司去投一级市场,虽然很多已经在这么做。她说的“联动”更多的是说一级市场的热点,会影响到二级市场,因此可以把一级市场的数据用到距离交易更近的地方。

 

“一级市场前瞻性会更好,走在前面会带动二级市场的一些热点或者大家关注的领域的变化”,李锦香说。比如从去年开始,一级市场人工智能就火得一塌糊涂,但从今年开始,二级市场才开始布局和人工智能相关的投资组合。

 

此外,她认为,一级市场和二级市场的从业者也在做趋同,“很知名的一些投资机构,开始一二级一起做”。在这个趋同和联动的过程当中,李锦香觉得最重要且被忽略的东西就是一级市场的数据和智能化的数据分析。随着近两年双创的发展,一级市场的体量和生态都发生了很大变化,具备了为二级市场提供成熟的数据产品的潜力,完成信息的流转。

版权所有 - 北京启迪创业孵化器有限公司 京ICP备13021136号 京公网安备11010802010945号 400电话:400 150 0019