在各行各业中,“长江后浪推前浪,前浪死在沙滩上”的例子不胜枚举。如当Salesforce大红大紫的今日,有谁还记得那个时代的宠儿Sibel?而在目前搜索引擎市场中,谷歌一枝独秀,而依托于中国本土,百度业绩也颇为可观,它在2018年的收入也突破了1000亿人民币。然而可能谁都不曾注意到,在谷歌百度之前,曾经有一个老前辈在搜索技术方面取得过突破性进展,开创了许多搜索引擎至今仍在使用的技术,并第一个创造了全网页内容的索引工具,它便是 AltaVista。
来源:Peter Morville/ Flickr. CC BY 2.0
当AltaVista处于全盛时期时,谷歌并不存在。不过后来,谷歌没用多久就甩开了老前辈,并迫使其并入到雅虎之中,最终也随雅虎的没落而消逝。对于任何成功的企业来说,AltaVista的消亡都是一个警示。尽管它是一个先驱者,甚至比它的竞争对手还先进得多,但事实证明,当用户抛弃你时,你做什么做都是错的。
而为了了解AltaVista的兴衰过程,我们需要回到它诞生之前的世界之中。
ALTAVISTA之前的网络
当Tim Berners-Lee(万维网之父)首次创建网络时,他编写了一个虚拟图书馆(Virtual Library),用以手动记录用户发布的所有网站。
各种搜索引擎提供了在线可用内容的列表,通过用户手动提交和编译索引。
但所有搜索引擎或目录都存在一个共同问题:它们会显示出不同的结果。它们也不能自动找到新的网站。后来,W3Catalog是第一个可自动获取网站数据并将其格式化为可搜索数据库的搜索引擎,不过它的列表依然依赖于其他目录。
很明显,这给了潜在新竞争者机会,它(们)可以提供一个通过自动扫描而编译的完整搜索数据库。具有讽刺意味的是,最终填补这一职位空缺的搜索引擎的出现几乎是个意外。
意外诞生的ALTAVISTA.DIGITAL.COM
1995年,AltaVista由美国DEC公司(Digital Equipment Corporation)发布。当时,DEC是域名www.digital.com的持有者,所以AltaVista的原始域名是altavista.digital.com。
不过,DEC创建AltaVista的目的并不是为了在互联网上掀起风暴,也不是为了开发人员创造的一个蓬勃发展的商业机会。事实上,AltaVista只是DEC超级计算机AlphaServer 8400 TurboLaser的一个测试用例。该超级计算机使用64位处理器,可以非常快速地搜索大型数据库,搜索引擎便是其威力的展示。
来源:Tony Johnson, Stanford University
AltaVista这个名字来自于DEC总部所在的帕洛阿尔托(Palo Alta)当地的生态风景。当时,Louis Monier发明了网络爬虫工具Scooter,他是DEC西部研究实验室的一名计算机科学家。之后,Scooter在1995年8月完成了第一次完整的“网页爬取”(web crawl),将大约1000万页面信息返回到原始的AltaVista索引中。此外,人们普遍认为是Paul Flaherty提出了AltaVista的想法,而Michael Burrows则亲自编写了索引器。
在对DEC的1万名员工进行测试后,AltaVista搜索引擎于同年12月15日正式向公众推出。
ALTAVISTA的崛起
很快,AltaVista便受到了各类网络用户的欢迎。它索引的页面数量大约是竞争者能够处理的页面数量的10倍。
访问者可以访问比以往任何时候都多的内容,这仅仅是因为AltaVista更擅长索引最远端的网络。这也让他们对结果能够进行更多的控制。
AltaVista的发布是1995年媒体世界中的一件标志性世界,这在很大程度上归功于DEC的AlphaServer硬件。《纽约时报》指出,AltaVista允许用户进行“高度定向搜索”,并将AltaVista的技术称为“超级蜘蛛”。
起初,大家对于AltaVista是否会免费或收费存在一些争论。但DEC认为AltaVista是展示其计算机硬件能力的一个好例子,这是一个营销工具。让AltaVista成为了一个受欢迎的搜索引擎成为了DEC的重要目标。
来源:Brent Payne/ Flickr. CC BY 2.0
但是,DEC低估了用户对AltaVista的喜爱程度。在1995年该搜索引擎推出的那一天,它的访问量约为30万。一年后的1996年,它每天的接待数量已达1900万。到1997年,它每天会吸引8000万游客,而在1998年,它需要20台多处理器服务器才得以支持接收到的所有搜索查询任务。
ALTAVISTA的“第一”
AltaVista的受欢迎程度不断飙升,不单是因为它的搜索结果质量,也因为它是搜索引擎领域的开创者,它引入了许多其他搜索引擎创建者甚至都没有想到过的高级功能:
1 AltaVista是第一个允许用户使用自然语言搜索的搜索引擎。这意味着,例如输入“什么是一个服务器”(what is a server),将得到关于服务器的搜索结果,而不是“what”、“is”和“a”。
2 它是第一个尝试使用自己的数据创建完整网页索引的搜索引擎,而不是使用从不同来源编译的列表或部分结果的目录。
3 它的爬虫工具,Scooter,能够索引全文页面,使AltaVista成为第一个可搜索的网页全文数据库。
4 它扩展了布尔操作符(boolean operators )在搜索中的使用。像一些竞争的搜索引擎一样,它支持AND,OR,或NOT。但是它还支持另外两个操作符:NEAR和(即括号)。
5 它允许搜索者限制从一个域得到结果的数量。这减少了干扰和结果中的重复页面,这在网络重复内容司空见惯的时代非常重要。
6 它是第一个允许多语言搜索的网站。1997年,该公司在马来西亚和西班牙开设了镜像网站。
7 它是第一个允许人们在搜索文本内容的同时搜索图像、视频和音频的网站。
8 它是第一个可以将整个网站翻译成英语、西班牙语、法语、德语、葡萄牙语、意大利语和俄语的工具。它还使用了后来被雅虎收购的Babel Fish翻译器。
但是,就是这样一个伟大的开创者,最终也没有避免消亡的命运。
ALTAVISTA的死亡
自1996年,当AltaVista为雅虎搜索门户提供补充搜索结果时,它便进入了一个动荡时期,而最终以被竞争对手收购而告终。
第一个重大冲击是DEC于1998年被康柏(Compaq)收购,至此DEC不复存在,公司所有硬件都被重新命名为康柏。大约在这个时候,康柏还以230万美元到330万美元的价格收购了域名altavista.com,具体价格取决于人们所相信的消息来源(真实的数字其是一个严格保密的秘密。)
后来,康柏的互联网服务部门决定,将通过多样化的功能,以用自己的游戏方式击败雅虎。它把AltaVista变成了一个更复杂的门户网站,摒弃了以前用户喜欢的简单搜索表单,取而代之的是一个越来越杂乱的主页。
来源:Christiaan Colen/ Flickr. CC BY 2.0
与AltaVista精简的搜索体验相比,这一举措让AltaVista愈发贴近于自己的竞争对手们,以让用户们转用了一个提供简单搜索体验的新产品:谷歌(Google)。
1999年,AltaVista 83%的股份被Lycos搜索引擎的所有者CMGI收购。该公司当时的估值约为23亿美元,可能会进行首次公开募股(IPO)。但到了2001年,由于CMGI难以让AltaVista实现盈利,公司最终取消了IPO计划,并进行了裁员。
也大约在这个时候,谷歌在用户中受欢迎程度超过了AltaVista,它第一次处理了比竞争对手更多的搜索请求。得到了教训后的AltaVista想要亡羊补牢,它开始放弃门户布局的实验,返回到一个简单的搜索表单,但是为时已晚。
2003年2月,境况不佳的AltaVista再次被Overture以1.4亿美元的价格收购。4个月后,雅虎又收购了Overture,这标志着AltaVista这个品牌的终结。2011年,所有在AltaVista品牌下建立起来的搜索技术都被并入了雅虎搜索中,就像15年前它的搜索结果被雅虎吸走一样。最后到了2013年,雅虎悄悄地关闭了AltaVista。
AltaVista的经验与教训
公平的讲,AltaVista从未有过充分发挥其潜力的机会。对DEC来说,这是一个意外的成功故事,该公司将其视为一种营销工具,而不是一种有用的服务。事后看来,AltaVista是DEC鼎盛时期糟糕战略方向的受害者。
而后,当AltaVista被认为是一个严肃的搜索工具时,它的关注点已经转移到了一个门户网站,而用户并不喜欢这样的它。而在收购和财务困境一直困扰着AltaVista的同时,谷歌开始取得进展。
许多专家认为,雅虎决定不加表示地关闭AltaVista是相当草率的。但到2013年AltaVista关闭时,几乎可以肯定,哀悼其消亡的人们其实早已不再使用它进行搜索。
AltaVista,一个值得铭记的名字
在雅虎关闭AltaVista时,AltaVista被视作了互联网时代的恐龙,最终的命运似乎也就是成为化石并被收入博物馆。
但是,从某些方面来讲,AltaVista并未完全“消亡”,它在改变用户对搜索的期望方面做出了杰出贡献,为谷歌等后辈铺平了道路并留下了遗产,其开创的诸多模式也得以被谷歌们继承与发展。
参考原文:https://digital.com/about/altavista/#
作者:Claire Broadley
翻译整理及编辑:张飞逸
2019中国软件渠道伙伴大会来了,请扫描二维码或点击阅读原文报名加入,4月11日,让我们齐聚北京,一起探讨2019年的挑战与新生。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。