将搜索进行到底
自从我们跨进网络时代的那一刻起,生活就开始变得丰富多彩,网络资源浩如烟海,任凭我们自由翱翔。对我们每个人来说,在网络中都可找到自己感兴趣的内容,这就是网络的魅力所在,在这个庞大的数字图书馆里,“没有搜不到,只有想不到”。网上的搜索引擎主要就是提供这种搜索服务,它们中很多都提供免费服务,不同的搜索引擎针对不同的使用对象,此外,搜索本身也有很多技巧可供使用。可以这么说,只有全面掌握了搜索技能,才真正学会了上网,下面就让我们一起来感受网络魅力,将搜索进行到底。
主要搜索引擎介绍篇
一、Yahoo(英文网址:www.yahoo.com、中文网址:cn.yahoo.com)
很多的朋友曾经都是通过打开Yahoo页面来确认自己是否真正上网了,Yahoo的魅力由此可见一斑,长期以来它也成为搜索引擎的代名词,Yahoo模式更是人们亦步亦趋追随的流行时尚。Yahoo属于分类搜索引擎(也可称为目录服务),它的最大特点是信息无休止地横向扩张,服务内容从目录搜索到综合信息门户,服务范围从一个地域到有着不同语言文化背景的几十个地域,把人工分类的网站目录数据库与机器自动生成的关键词数据库相互融合,几乎涵盖所有的网络资源。
Yahoo不是单纯提供所有网站网页的全文检索服务,而是将其收集到的网站及网页分门别类加以索引和文摘(由人工完成),以一个分层的线性目录来为用户提供按图索骥式服务,随着人们对信息需求的广泛和深入,它开始逐步开展信息的定制服务,以减轻用户层层寻找信息的负担,并帮助用户有效定位于一些重要的网站。
在中文Yahoo上可搜索绝大部分繁体、简体中文网站的信息,利用关键词搜索时,搜索结果将分为4类,即相关分类、相关网站、相关网页和相关新闻(图1)。
适合搜索:网页、专业技术类
二、Google(www.google.com)
Google一词来源于“Googol”,表示一个非常巨大的数字概念,隐喻着要穷尽所有Web资源的壮志豪情。Google是一种基于链接评价体系的搜索引擎模式,它主要基于这样一种认识:一个网页的重要性取决于它被其他网页链接的数量,特别是一些已被认定是“重要”网页的链接数量。每一个链接都是一张价值不等的“选票”,所获选票的总价值将决定谁是这场比赛的优胜者,谁将被安置在最重要、最显赫的位置上。这一技术非常有效,尤其是网络资源的膨胀必然产生更多链接,从而为Google评价文件重要性提供更多的依据。Google提供网站、图像、新闻群组和网页目录这4种搜索类别,分别搜索不同的信息(图2)。
除此之外,Google还提供许多其它的特性,例如“手气不错”,可直接打开最符合待查内容的网页;而在查找结果中的“网页快照”,可将系统缓存的大量原始页面内容呈现在用户面前,不仅大大提高搜索速度,而且可作为系统紧急状态的备份资源使用,并帮助用户查找那些曾经有过的Web内容。对于那些时限要求不是很高的搜索来说,往往有事半功倍的效果。
在Google上利用关键词搜索信息时,搜索结果将按照搜索信息的相关度大小来罗列,最符合搜索内容的网页出现在搜索结果的最前列。
比较而言,Google搜索效率最高,得到的信息特别全面而且按照搜索信息的相关度大小来显示,对用户来说无需费时费力即可找到相关信息。
适合搜索:图片、新闻类
三、百度(www.baidu.com)
在提供搜索引擎的中国主要网站中,超过80%由百度提供,这些网站包括Sina(2002年6月前)、Sohu、Tom.com、263在线等。百度本身也提供搜索引擎服务,用户可在上面搜索到网页、新闻和Flash三种类别的信息(图3)。百度搜索引擎使用高性能的“网络蜘蛛”程序自动在互联网中搜索信息,可定制、高扩展性的调度算法使得搜索器能在极短时间内收集到最大数量的互联网信息。它中文信息库非常巨大,总量达到6000万页以上,并且还在以每天几十万页的速度快速增长。百度搜索效率也较高,得到的信息较全面。
此外,还有很多优秀的搜索引擎可供使用,其中包括新浪(search.sina.com.cn)、网易(www.163.com)和天网(e.pku.edu.cn)等。
适合搜索:FTP、音乐等免费资源
搜索技巧篇
不同的搜索引擎搜索方式可能也不尽相同,不过总体上来说差别不是太大,它们之间有很多的共同点。Google强大的搜索功能使它拥有相当大一部分忠实用户,因此本文以Google为例,介绍Google的一些基本搜索语法和高级搜索技巧,希望能抛砖引玉……
一、搜索入门
要用Google搜索,当然首先要进Google网站——www.google.com。Google的首页很简单,搜索可分为4个功能模块:网站、图像、新闻组和目录服务,默认是搜索所有网站。具体搜索时,在搜索框内输入一个关键字回车即可看到搜索结果。每个Google搜索结果都包含从该网页中抽出的一段摘要,这些摘要提供了搜索关键词在网页中的上下文,可帮助你迅速决定这些搜索信息是否对你有用。
可以看出,关键词的选取在信息搜索中的作用尤为重要。一次成功的搜索由两部分组成:正确的搜索关键词、有用的搜索结果。一次成功的搜索也经常由好几次搜索组成,如果对自己搜索的内容不熟,即使是搜索专家也不能保证第一次搜索就能找到想要的内容。有经验的搜索者会先用简单的关键词测试,他们不会忙着仔细查看各条搜索结果,而是先从搜索结果页面里寻找更多的信息,再设计一个更好的关键词重新搜索,这样重复多次以后,就能设计出很棒的搜索关键词,也就能搜索到满意的搜索结果了。
一般来说,关键词应该同时选择两个或两个以上,而且还要抓住核心。例如想下载“唯一”这首歌曲,可以选择关键词“唯一、下载”。
此外,在搜索过程中,一定要避免犯以下常见错误:
1.错别字。例如查找谢霆锋时写成了“解霆锋”、“谢庭锋”、“谢霆峰”、“谢廷锋”等,自然查不到结果。2.关键词太常见。搜索引擎对常见词的搜索存在缺陷,因为这些词曝光率太高了,以至于出现在成百万网页中,使得它们事实上不能帮你找到什么有用的内容。比如搜索“地址”,本身这个关键词的意义就不大。3.不会挑选关键词。例如在搜索的时候选择:“高考分数出来了吗?”。本身这个关键词信息就不明确,如果将搜索关键词换成“高考,分数,发布”可能会取得较好效果。
二、搜索技巧
1.增加关键词
简单的搜索可能导致搜索结果比较凌乱,对我们的实际需要帮助不大,因此我们需要进一步缩小搜索范围。如何缩小搜索范围呢?增加关键字。例如查找“交通大学”,搜索结果中会出来很多包含交通大学字样的所有网页,如果再加上“西安”,就只会出来有关西安交通大学的信息了。
Google自动使用“and”进行查询,如果你想缩小搜索范围,只需输入更多的关键词,并在关键词中间留空格或逗号就行了,Google只会返回那些符合你全部查询条件的网页,而不需要在关键词之间加上“and”或“+”。
2.减除无关资料
如果要避免搜索某个词语,或过滤掉一些信息,可在这个关键词前面加上个减号(“-”,英文字符),但在减号之前必须留一空格。
示例:搜索所有包含“交通大学”和“西安”但不含“图书馆”的中文网页,可以搜索:“西安 交通大学 -图书馆”。
另外,减除无关资料还可减小中文里边的分词错误,举例来说,搜索关键词“品行”可能搜到大量“商品行情”,又如搜索关键词“和会”,得到的搜索结果可能大量包含“展览和会议”、“吉祥物和会歌”、“亚太经和会议”等。它们文字中都有“和会”,但不是你要搜索的“巴黎和会”“中东和会”。这是中文本身特点导致的搜索缺陷,可利用减除无关资料的方法来将这些分词过滤掉,例如在搜索的时候选择关键词“和会 -和会议 -和会 -和会歌 -和会务 -和会员 -和会计”。
注意:操作符与各个关键字之间不能有空格。比如“交通大学 - 西安”,搜索引擎将视为关键字为“交通大学”和“西安”的逻辑“与”操作,中间的“-”被忽略。
3.搜索结果至少包含多个关键字中的任意一个。
Google用大写的“OR”表示逻辑“或”操作。搜索“A OR B”,意思就是说,搜索的网页中,要么有A,要么有B,要么同时有A和B,网页中只要存在A和B之一即可。
注意:“与”操作必须用大写的“OR”,而不是小写的“or”。
实际上,我们在具体使用搜索引擎时,绝大多数的时间里都是在使用搜索引擎最基本的语法“与”、“非”和“或”,这3种搜索语法Google分别用“ ”(空格)、“-”和“OR”表示。因此,快速搜索的一般方法为:目标信息一定含有的关键字(用“ ”连起来),目标信息不能含有的关键字(用“-”去掉),目标信息可能含有的关键字(用“OR”连起来)。
需要注意,很多搜索引擎支持通配符号,如“*”代表一连串字符,“?”代表单个字符等。Google不支持通配符,只能做精确查询,关键字中的“*”或者“?”会被忽略掉。此外,Google对英文字符大小写不敏感,例如搜索“China”和“CHINA”时,搜索结果将一样。
4.搜索短语或者句子
Google的关键字可以是单词(中间没有空格),也可以是短语(中间有空格)。但是,用短语做关键字,必须加英文引号,否则空格会被当作“与”操作符。例如搜索一个专用名词“I Love You”,即搜索同时有“I”、“Love”和“You”的专用短语。
5.强制搜索
Google会忽略最常用的词和字符,这些词和字符称为忽略词。Google自动忽略“http”、“.com”和“的”等字符及数字和单字,这类字词不仅无助于缩小查询范围,而且会大大降低搜索速度。如果在搜索时想带上这些忽略词,可以使用英文双引号将这些忽略词强加于搜索项,例如:输入“http的发展”时,加上英文双引号会使“的”和“http”强加于搜索项中,此外,在关键字前加上明文的“+”号,例如搜索“+http +的发展”也能实现强制搜索。但是,大部分常用英文符号(如问号、句号、逗号等)无法成为搜索关键字,强制也不行。
三、高级搜索
通过上面的搜索技巧,想必你已能解决绝大部分的搜索问题。不过,如果想更迅速更贴切找到需要的信息,还需要了解和学习搜索的高级技巧。
1.利用Google上的高级搜索功能。
在Google的主页上点击“高级搜索”链接,即可出现高级搜索的页面,可在此定制搜索的详细信息,例如网页语言、网页更新日期和网域等(图4)。
2.指定网域
有一些词后面加上冒号对Google有特殊的含义。其中有一个词是“site:”。要在某个特定的域或站点中进行搜索,可在Google搜索框中输入“site:xxxxx.com”,例如在教育网(edu.cn)上搜索关于图书馆建设方面页面,可以搜索:“图书馆 建设 site:edu.cn”,即可搜索到教育网站内有关图书馆建设方面的资料。
注意:site后的冒号为英文字符,而且冒号后不能有空格,否则“site:”将被作为一个搜索的关键字。此外,网站域名不能有“http://”前缀,也不能有任何“/”的目录后缀;网站频道则只局限于“频道名.域名”方式,而不能是“域名/频道名”方式。
3.查找某一类型的文件
“filetype:”是Google开发的非常强大实用的一个搜索语法,也就是说,Google不仅能搜索一般的文字页面,还能对某些二进制文档进行检索。目前,Google已经能检索微软的Office文档如“.xls”、“.ppt”、“.doc”和Adobe的“.pdf”文档等。
例如搜索:“当前经济形势 filetype:doc OR filetype:pdf”,即可检索到有关当前经济形式的“.doc”和“.pdf”文件(图5)。
4.按链接搜索
有一些词后面加上冒号对Google具有特殊的含义,其中的一个词是“link:”,查询“link:”显示所有指向该网址的网页。例如,“link:www.google.com”将找出所有指向Google主页的网页,不能将“link:”搜索与普通关键词搜索结合使用。
5.在URL链接或网页标题中搜索
例如,在URL中查找“西安交通大学”,可以搜索:“inurl:西安交通大学”,而如果想让搜索的关键字如西安交通大学在网页标题中,格式如下:“intitle:西安交通大学”(图6)。
分类搜索篇
上面讲到的是我们对网络资源整体的信息搜索,而在平时,我们用得比较多的主要还是一些具体的应用,例如我们想搜索一些图片、软件(有可能是正版的)或电影,这时都可利用分类搜索来查找。
1.图片搜索
Google上的“images.google.com”就是一个非常专业的图片搜索引擎,在这里你可随心所欲地搜索各种你想要的图片。利用图片搜索可以很容易地查找到一些零散的图片,例如你可搜索美国总统布什的照片,搜索结果可显示出布什在各种新闻报道中的照片,显得非常详细和全面(图7)。如果待查找的图片在网上有很多主题“Gallary”,如诸多电影电视明星的照片,它们一般在网上都有独立的在线相册,用“images.google.com”的图片搜索查到这些分类后一一打开即可。
因此,“images.google.com”对于很多报纸杂志的编辑,绝对是一个雪中送炭式的工具。比如要在某个版面上插一张专题图片,用Google的图片搜索功能几秒钟就可搞定。
2.电影搜索
随着宽带网的普及,网上在线看电影已不再是什么新鲜事。很多网站本身也都提供电影的搜索和下载服务,用户可以去“http://www.chinafilm.com.cn/”上查找最新的电影信息,该网站目前已经包括影片10 283部、影人2287位(图8)。此外,DVD不完全手册网站(http://www.mov8.com/)也提供对DVD影片进行查询。
3.歌曲搜索
有了MP3的歌曲搜索,对我们来说,流行音乐即可一网打尽。音乐搜索网站也有很多,例如九天音乐网(http://www.9sky.com),可算上是中国数一数二的音乐网站。它是2000年突然涌现出的一个音乐网站“新军”,它提供的信息量非常巨大,更新速度非常快,紧跟音乐潮流(图9)。
它提供的音乐类型有3种,主要以MP3为主,RM与ASF为次,是一个大的音乐社区。此外,它还提供MTV、歌曲排行以及图库等。它具有非常强大的歌曲搜索功能,可按照专辑、歌曲、歌曲名来搜索。
此外,音乐极限(http://www.chinamp3.com或http://www.chinamp3.net)和SoGua也提供歌曲的搜索。
4.FTP搜索
FTP已成为众多网友共享文件的一种主要方式,在FTP上一般都会存放很多有价值的文件,而且由于很多FTP都是私人架设,上面可能存在一些正版软件,因此,如果查找文件,通过搜索FTP一定会给你带来惊喜。
北大天网除了提供中英文的信息搜索之外,它的一个主要特色就是提供FTP的搜索服务,它是由中国教育网在北京大学设立的一个较优秀中文搜索引擎,主要以教育网内的网页信息为主。它提供的FTP搜索也仅限于教育网内,不过由于教育网内的资源非常巨大,因此通过它查找的FTP信息也非常丰富。在天网FTP上可搜索图片、电影、音乐、文档、程序和源代码等资源,在搜索的结果中,还以图标形式生动地显示文件类型,而且如果FTP资源不可达,将以红叉标注(图10)。
利用软件也可以搜索到FTP上的资源。FTP Search软件就提供这项功能,首先设置搜索IP的范围和同时开启的线程数,接着即可在网络上搜索FTP资源了,利用软件搜索FTP得到的信息特别全,而且可靠性高,在搜索结果中还能看到FTP中的文件列表,令人一目了然(图11)。
FTP Search的下载站点为:ftp://ftp.dlut.edu.cn/pub1/unix/ftp/ftpsearch/ftpsearch-1.0.tar.gz,下载之后解压缩即可运行。
5.P2P搜索
P2P是Peer-to-Peer的缩写,译为点对点。它可让你非常方便地直接连接到网络其他安装了P2P软件的计算机上,从而进行文件的共享与交换。如今,已经涌现出一大批优秀的P2P软件,其中包括PP点点通、Workslink等。
本文以PP点点通为例,介绍利用P2P软件进行资源搜索的方法和技巧。
登录PP后,首先进入“资源搜索”,可看到一个非常友好和熟悉的人机界面。界面分为左右两栏,在左栏“查询关键字”中输入要查询文件的关键字和搜索范围,点击“开始搜索”按钮之后在右栏就可看到PP找到的相关文件和数据,例如在“查询关键字”中设置为空,在搜索范围内选择音乐,结果就出来了数以万计的MP3音乐文件(图12)。
如果需要下载,双击所要的文件,设置好下载的类别和存放目录之后即可开始,PP也支持断点续传功能,如果上次下载时因某种原因被意外终止,PP在重新启动时就会自动进行连接。PP的下载站点为http://www.pp365.net/,Workslink的下载站点为:http://www.workslink.com。
搜索插件篇
为了方便用户,很多搜索引擎现在都提供搜索插件,这些插件一般都能独立使用,而且集成在浏览器中,用户无需打开搜索引擎的主页面即可随心所欲地搜索,对于经常进行网络搜索的用户而言,这些集成化的工具确实很管用。它们主要包括如下几个。
1.Google工具条
Google提供的工具条集成于浏览器中,用户无需打开Google主页就可在工具条内输入关键字进行搜索。此外,工具条还提供其他许多功能,如显示页面PageRank等。最方便的一点在于用户可快捷地在Google主页、目录服务、新闻组搜索、高级搜索和搜索设定之间切换。欲安装Google的工具条,可访问“http://toolbar.Google.com/”,按页面提示选择简体中文版本即可自动下载并安装。不过,Google工具条目前只支持IE5.0以上版本。
安装好的Google工具条在IE的地址栏下显示。利用它搜索时跟用Google页面没什么区别(图13)。
2.百度的IE搜索伴侣
如果你的浏览器还没有IE搜索伴侣功能可安装它,网址是http://bar.baidu.com/,这时你会见到IE搜索伴侣安装提示,需要注意,如果你的电脑已安装了其它搜索插件,首先需要将它们删除,否则IE搜索伴侣无法安装。不过百度网站本身也提供清除其他搜索工具栏的程序,你只需要在百度IE搜索伴侣页面上点击清除即可,接着即可进行伴侣程序的安装。
3.天网搜霸
天网搜霸是北大天网搜索推出的一款IE搜索插件,汇合网络上最棒的各种搜索引擎,包括天网文件搜索引擎、天网网页搜索引擎及其他国内外著名的搜索引擎,让你随时随地轻松查找。与“Google工具栏”及“百度IE搜索伴侣”不同,“天网搜霸”排除门户观念,并不仅支持天网搜索的文件搜索引擎和网页搜索引擎,还兼容任意其他搜索引擎或检索系统,轻松切换各搜索引擎而无需每次访问各引擎的主页。天网搜霸所需的操作系统也必须是IE5.0或更高版本。