紫微星还很小很年轻,要低调、要克制,这时候表露心扉,人家把你当神经病。
周不器深吸了一口气,脸上挤出了一个笑容,“行吧,那就不说这个了。搜狗收录的中文网页,已经有100亿了,百度有多少?”
“70亿吧。”
“嗯?百度还不如搜狗?”
“怎么可能?”
李彦红啼笑皆非。
换了话题,他心情就好了,脸上的笑容也多了,谦谦温和地说:“互联网上的中文信息其实并不多,连英文的千分之一都不到,其中存在大量的同质化的内容。搜狗的中文网页收录量达100亿,反而说明其技术不够好。”
“为什么?”
“缺乏排查机制啊。大量重复的同质内容,有什么用?收录进来只会浪费搜索效率,影响搜索速度。”
“谷歌呢?”
“谷歌是都有收录,可人家的技术好啊,大数据算法之下,再大的网页量也能在极短的时间内检索出结果。可百度、搜狗都不行,就只能缩小网页检索量的规模,提高搜索速度。”
周不器点了点头,这才想起来,这个道理好像许良杰、程秉皓跟他讲过。
不得不说,李彦红在和谷歌的竞争上,在各方面都做到了极大的优化,值得效仿学习,回去得跟王小船说一声。
“对了,大数据算法……你们百度有吗?”
“没有。”
“百度都没有?”
“岂止是百度,微软、雅虎、IBM都没有,全世界就谷歌有。不是发了三篇理论性论文嘛,不过没公开代码。美国那边有团队在根据论文做分布式算法……咦?紫微星不是也在做分布式计算吗?那就是大数据算法的雏形。”
周不器揣着明白装糊涂,“这样啊,那百度呢?百度是国内第一大搜索引擎,总不能只通过减少检索量的方式取巧吧?总归要大数据算法支持。”
李彦红瞥他一眼,笑着说:“这可是商业机密了。”
“不能说?”
“等处理完股票的事,打败了谷歌中国,外部忧患就算解除了。到了明年,百度有意向做这方面的研究。”
“分布式?大数据?”
“嗯。”
“要不要合作?”周不器眼睛里流露着满满的期待,“我们的分布式算法都做出模板了,咱们合作,说不定可以事半功倍。”
李彦红心中哼了一声。
只以为这小子是想占百度的便宜。
做技术研发,国内任何一家互联网公司都没资格跟百度深度合作。紫微星的分布式数据库项目是做了快一年了,在分布式领域有了很深的研究。
可那又如何?
给百度三个月时间,说不定就能反超。
李彦红本身就是技术大牛,他有自己的骄傲,觉得跟周不器这种外行谈技术合作,有点掉价,平淡而坚定的道:“百度不需要帮手。”
“帮你打打下手呗?”
“不需要。”
“那行吧。”
周不器心凉了半截。
就觉得想为国为民做点好事,怎么这么难啊?