还记得地铁里的虚拟超市吗?在地铁里,顾客可以像逛超市一样浏览成排商品图片,拿起手机对屏扫一扫,即可购物走人。智能手机和摄像头技术的发展让图片识别的应用范围越来越广,只是,在上例中,顾客实际扫描的还是不显眼的二维码,而非更大更直观的商品自然图片…
现在,国内的一个 90 后团队推出了一整套基于“端到云”的图像识别服务:开发者通过他们的插件,即可让自己的应用打开慧眼,识别自然图像,而且可自定义识别样本。
慧眼开发平台的图像识别解决方案包含三块:
基于 web 的项目管理平台:开发者可以在平台上创建项目,上传、编辑需要被用户识别的目标图像;
开发插件,即所谓的“端”:开发者通过慧眼的全平台(支持 Android、iOS、WP 和 Adobe
AIR)插件,即可在用户手机端完成图像检测和采集功能。图像识别服务后台,即所谓的“云”:被采集的图像将被传送到慧眼自己的服务器组,在云端完成与目标图像的匹配和具体的识别运算,减少手机端的运算压力。
慧眼团队的负责人郭少豪说,图像识别技术在企业的互动营销中应用很广,而他们的团队也是基于先期为客户定制这类应用的经验,才决定推出这个平台。他给我举了两个例子,他们之前给国内的某知名英语培训机构做过服务,让用户在机构的网站和微博上通过智能手机扫描找到特殊图片,完成互动,给机构带来流量。另外一个案例是,为某创意工作室开发明信片识别应用(如上图),用户下载应用,对着明信片扫一扫,就能在移动端实现购买。
所以,慧眼开放平台的目标客户是需要定制应用的企业客户和初级应用开发者,可以让他们摆脱复杂的模式识别算法和底层研发。
对于商业模式,慧眼也有一个较为清晰的规划。第一阶段:主要通过为企业客户定制基于图像识别技术的互动营销 app 获取一次性收入;第二阶段:通过提供插件和 SDK 服务实现与开发者分成;第三阶段:通过插件的用户基础与开发者共享流量,通过流量变现。
不过,实际在市面上提供类似的图像识别服务的公司,并非慧眼一家。另外一家公司“天使眼”,跟慧眼的业务非常类似,同样是提供识别算法服务,但目前已经没有再更新 SDK。相比天使眼,郭少豪认为他们的平台在用户体验、商业模式和上线时机上都有一定优势。
单就视觉识别应用而言,在国外,Google 开发的Goggles就是个中翘楚,可以识别文字、书籍、商标、地标、酒、名片、条形码、艺术品等等。在国内,腾讯旗下实验室也研发了一款视觉识别应用SOSO慧眼,目前可识别并搜索图书、电影海报等,也准备向开发者开放 SDK。
但郭少豪说,SOSO 慧眼因为依靠的是大数据,所支持的识别样本范围相对较少,而且当前的平台是封闭的,识别库将牢牢掌握在运营方;相比之下,慧眼的平台是开放的,开发者可以个性化创建自己的识别样本,不依赖庞大的数据库,具有更高的自由度。
郭少豪说得有一定道理,不过,就慧眼以及同类的视觉识别产品,我也有两个质疑:1. 自然图像识别的快速度和准确度依然会是一个门槛;2. 既然开发者可以自动添加识别样本,那么样本库本身不能太简陋,客户端的使用场景也也不能太局限,或者用户安装客户端能带来明显好处,否则,用户的动力可能会不强。
再来谈谈文中开头说到的二维码。郭少豪认为,他们的自然图像识别服务跟二维码技术虽然有竞争交集,但更多的是互补关系。二维码的解析速度快,但是形势单一、拍摄自由度也受限。相比之下,自然图像识别可支持大型户外媒体广告的远距离拍摄等,丰富了整个图像识别技术的使用场景。以往的 O2O 和电子商务借助的是二维码,不过,随着自然图像识别技术的优化,未来用户直接扫描原始图片,也不是没有可能。
而就整个行业而言,郭少豪也有一些自己的看法。目前许多传统的移动应用,如电子地图、游戏、LBS、购物、试衣、互动营销等,都已经加入了增强现实元素,Google 甚至是发布了以 AR 技术为主导的未来眼镜。在他看来,增强现实的崛起,对于其根基技术——图像识别,本来就是一个利好消息。增强现实也会是他们未来发展的一个方向。
慧眼开发平台来自国内一个 90 后的团队,郭少豪同样是一名少年极客,目前已经出版《创意之钥——Android 手机交互应用开发》、《Android3D 游戏开发与应用案例详解》两本专业书籍,其他成员同样是在广东高校就读的 90 后,之前专注于提供创意互动应用的定制服务,目前已经磨合一年。
P.S. 慧眼提交的求报道文档非常细致,有报道需求的创业者应该要学习他们的态度: joycechen@36kr.com。
Categories
Submit a Comment