搜狗搜索事业部总经理茹立云近日表示,搜狗以图搜图功能要优于百度,比谷歌中国更本地化。
据了解,普通的图片搜索,是通过输入文本关键词的形式搜索图片资源,搜狗识图搜索能实现以图搜图,即通过上传图片、鼠标拖拽、鼠标选图、输入图片URL地址等多种方式搜索,找到互联网上与这张图片相似的其他图片,并且利用图片识别技术,进一步分析图片内容的主题,找到与这张图片同主题的其他图片。这也是继百度之后又一搜索企业推出“识图搜索”功能 。
转播到腾讯微博
搜狗提供的以图搜图功能对比图(腾讯科技配图)
茹立云指出,搜狗识图并非效仿百度,两者在搜索结果上完全不同。实际上搜狗识图搜索更类似于谷歌,但是谷歌搜索结果中经常会出现一些英文或者繁体字,搜狗本土化做得更好。
以下是对话茹立云实录:
茹立云:首先我们会去看到,用户对图片的需求是非常大的,我们从自身的数据,还有第三方的数据可以发现,除了图文搜索以外,垂直搜索里面图片是比较大搜索需求。在以前的图片搜索只是能够根据输入关键词找对应的图片。就是说,你已经知道某个概念了,你把这个概念对应的图片找出来。
但是实际上,我们各种用户查询的分析,互联网上这种问题,在搜狗上查,这张图片是谁?这种结果有的时候是上千万,很多用户他看了一张图片,但是想知道这张图片是谁?他的来源是什么?他背后也什么故事,他是不是真实的?这种需求潜在着很多。
那么很难用之前的已经知道一个概念,去把这图片找出来,那你就是撞大运了,猜他是一个什么概念,看看有没有这样的图片?之前的这种需求的满足非常广,我们推出这种,以图搜图,你通过图片的上传,可以搜出或者我可以告诉你这个图片是谁?这样的话用户的这类需求就可以满足。
我们会发现之前的几类产品,都存在明显的缺陷,首先第一位,使用特别不便捷,你要搜一张图,要么是把这个图片拷下来,再打开首页,再输入进去看。但是我们现在的一种方式是跟浏览器的结合,用户想调查某一个图背后的故事,特别便利,大部分用户的图片都是网络图片,他只要把鼠标移到这个图片上,通过浏览器的功能或者插件,他马上告诉你,这张图片是谁,跟他同组这个图片是什么?有几张类似的图片,他们很容易去判断潜在的东西。
第二块像谷歌、百度,百度的识图更新度非常复杂,现在数据库,半年内现在东西都差不多。搜狗这一块可以做到当天的图片当天就能够搜索出来。很多用户去搜的时候,可能是比较热点的一些图片,比如说前一段北京的暴雨这些图片,你需要有一个及时度,这些图片出来之后,首先他在什么范围内有这些图片,还有他最初的源头是什么?可能这个图片三个月以内的,可能百度现在的一套就搜索不出来。
比如谷歌,他存在一个问题,比如说你去搜一些图片的时候,他经常给你出韩文、日文,甚至阿拉伯文,作为普通的网民的话,他肯定对语言的掌握没有那么精深,英文大家基本上还可以读一读,但是韩文、阿拉伯文,西班牙语这些东西,就是看到了也不知道他是什么东西?所以本地化的支持上,受到更多的简体中文一种方式。
用户看到搜图的结果,能够看懂,另外一块我们刚刚发现用户存在一种需求,他看到一张图片,觉得很好玩,他想找其他类似的图片,类似的图片可能跟这张图片,从一般的基于图片的内容来讲,没有的那种特征,没有办法把他找出来,他可能形状上,并不一定类似,但是现在比如说,像谷歌推出了能够找形状类似的图片。
百度没有这种东西,搜狗可以通过这种纹理、颜色、形状这些特征之外,还可以通过图片间的链接关系,把同主题图片找出来。
人脸技术技术近几年并无真正突破
腾讯科技:其实你们的图片识别就是很容易让人联系到人脸识别,这里面涉及到一个关于隐私方面的问题,你们具体在人脸识别这一方面有什么样的突破性的发展?另外,你们如何规避隐私方面的问题?
茹立云:搜狗在图片上的积累,技术上积累,或者经验上积累,会比搜狗公司还要长,我们现在带领这个图片团队的人,是一位在图像领域有十多年研究的清华大学的博士,做相关的研究工作。
据我了解,人脸识别技术近几年全球范围内还是没有真正意义上的突破,他能够做还是在一个封闭的数据体上,去找人脸的匹配或者比对。
比如说大家可能看到一个产品,像微软相册的这种产品,因为是跟你相关的这种人,出现在照片里的人也不会太多,一般的家庭十几个人就挺多的了,如果朋友圈大一点,就几百个人,这种范围内的是可以匹配的,类似的像facebook上的,你圈一个人,他就在你的相册里面给你找出来,某种意义上来讲,还是一种封闭式的,你要去分个类,可能就是几百甚至上千了不起了,但是如果你一旦开放到整个互联网的话,互联网数亿的人,你要去做匹配,现有的技术我觉得要做到精度很高,我觉得基本上还达不到。
这是本身人脸这么一个技术,可能大家会担心的一个点,我在街上随便拍一个照片,我可能把他背后其他的照片找出来,甚至找出他是谁,现在来讲是有一些难度的。
这里最关键的是很难去表示人脸的这些特征,怎么样把这些特征数据化,成为一种可高速索引的一个数据库,现在技术上还达不到。
谷歌称不建人脸识别数据库为推Goolge+
经过近半年的独立研发和紧张筹备,搜狗图片搜索昨日正式推出了具备以图搜图功能的新产品——识图搜索,可通过上传图片等方式搜索找到相似其他图片。
腾讯科技:我们看到谷歌董事长施密特称谷歌不会建立人脸识别数据库,但是有一些公司也会越过这条红线,你们识图搜索越来越精准的时候,你们是否会踏过这条红线?
茹立云:谷歌的这个话有所指,人脸数据库,尤其是跟他个人的隐私相关的,更多在SNS类似的网站上,因为谷歌推goolge+之前,也没有SNS。所以他对隐私的这种说法,某种程度上是为了更好的去推广goolge+,是goolge+的宣传亮点,他对隐私的处理比Facebook更好。
施密特说这个话是有所指,有背后的含义存在的。另外,一方面现在的识图的技术,刚才我提到了,一个是找基本上类似的这种图片,另外一个找同组级的图片,里面还不需要用到人脸识别的技术。找类似图片的话,现在有一套技术,按照同组级图片,根据一些基本的特征,链接这几样东西。 |