搜索引擎的种类
搜索引擎按其工作的方式分为两类:一类是分类目录型的检索,把因特网中的资源收集起来,由其提供的资源的类型不同而分成不同的目录,再一层层地进行分类,人们要找自己想要的信息可按他们的分类一层层进入,就能最后到达目的地,找到自己想要的信息;另一类是基于关键词的检索,这种方式用户可以用逻辑组合方式输入各种关键词(Keyword),搜索引擎计算机根据这些关键词寻找用户所需资源的地址,然后根据一定的规则反馈给用户包含此关键字词信息的所有网址和指向这些网址的链接。
1.使用双引号进行精确查找
简单查找往往会反馈回大量不需要的信息,如果查找的是一个词组或多个汉字,最好的办法就是将它们用双引号括起来(即在英文输入状态下的双引号),这样得到的结果最少、最精确。例如在SuperSo超级搜索引擎的Search(查询)框中输入"电脑技术",就等于告诉SuperSo超级搜索搜索引擎只反馈回网页中有“电脑技术”这几个关键字的网址,这会比输入电脑技术得到更少、更好的结果。
2.使用加减号限定查找
很多搜索引擎都支持在搜索词前冠以加号(+)限定搜索结果中必须包含的词汇,用减号(-) 限定搜索结果不能包含的词汇。 例如:要查找的内容必须同时包括“盐城、信息、网络”3个关键词时,就可用“盐城+信息+网络”来表示;再例如:要查找“电脑”,但必须没有“技术”字样,就可以用“电脑-技术”来表示。
3.使用逻辑词辅助查找
比较著名的搜索引擎(如SuperSo超级搜索)都支持使用逻辑词进行更复杂的搜索设定,常用的有:AND(和)、OR( 或)、NOT(否, 有些是AND NOT)及NEAR(两个单词的靠近程度),恰当应用它们可以使结果非常精确, 另外, 也可以使用括号将搜索词分别组合,如要查找的内容必须同时包括“yancheng、infomation、network”3个关键词时,就可用yancheng AND infomation AND network来表示(注意:输入代表逻辑关系的字符时,一定要用半角)。
4.停用词
一些搜索引擎会忽略这些词,当你把停用词输入搜索框时,不管网上有多少数量的相关文件,它们一个都不会找回来给你。这些被叫做“停用词”(stop words),因为停用词可能太常见了以至于无法搜索出有意义的结果,或者是语言中的副词、连词、介词,或者是"be" 的变体如is、are、were、been等无意义的词,除非它们在一个短语中且有重要的名词和动词相伴。
5.大写字母
如果你在搜索关键词中使用大写字母,那么搜索引擎返回的结果将只有一种,其网页中含有大小写跟你的搜索关键词完全相同的单词。象人名和地名之类关键词使用大写字母是个好选择,但是其它对大小写没那么敏感的单词,如果也使用大写字母,可能使你错过很多有用的网页。
6.使用某个常见词
只要可能,尽量使用常见词的同义词。更好的方法是,想出不常用的甚至是罕见词来描述你的主题。这里的诀窍是不要把自己想得太聪明,不要使用不会被大多数网络写作者使用的关键词。
7.最常见的搜索失败(一)
搜索引擎没有帮你找到草堆中的那根针,而是给了你整个草堆。通常,这种搜索失败有两个原因,这两个原因其实都很容易解决。第一,你用来搜索的关键词太短了,可能只有一两个字。第二,你要搜索的内容太常见了,以至网上有巨大数量的相关内容。
最常见的搜索失败(二)
网站已搬走;转向地址未知 搜索到的网站已搬走,地址未知。网站就象人,有时会被迫迁移。学生毕业了;网页从免费社区搬到有独立域名的大网站了;人们改变ISP了。当遇上这种事时,你最好赌一下运气,搜索你在寻找的文件的标题或者作者的名字。搜索标题很简单,只要用双引号括起来进行短语搜索就行。
最常见的搜索失败(三)
上次能搜到的内容,这次却搜不到了。你做了所有努力,可是,上星期还带给你很好搜索结果的搜索请求,这次无论你怎么努力,都只搜索到一堆无用的结果,你想要找的网页已经 不见了。发生了什么事?有关搜索引擎的一个肮脏的小秘密是:搜索引擎永不停息的从它们的索引库中抛弃已索引的网页。有时是成千上万的网页。有时这些被遗弃的网页会重新出现在索引库中,有时不会。
8.词组搜索
如果只给出一个单词进行搜索,那么将发现数以千计甚至以百万计的匹配网页。然而如果再加上一个单词,那么搜索结果会更加切题。在搜索时,给出两个关键词,并将两个词用AND(与逻辑)结合起来,或者在每个词前面加上加号,这种与逻辑技术大大地缩小了命中范围,从而加快了搜索。幸运的是,所有主要的搜索引擎都使用同样有语法。一个带引号的词组意味着只有完全匹配该词组(包括空格)的网页才是要搜索的网页。例如在搜索说明中,有“this exact phrase(这个确切词组)”这个词组,那么搜索引擎只搜索包含“this exact phrase(这个确切词组)”的网页。
9.使用关键词搜索时有那些技巧
用最少的词表达清楚所查信息的主题,比如想查流氓兔动画,只需要输入"流氓兔"就可以了,不需要加上"动画",因为"流氓兔"就是一个动画作品。少用修饰词,如果检索结果太多,可以用修饰词去掉一些不想要的信息。太长的关键词改用逻辑组合,比如想查孙燕姿的歌曲,可以输入"孙燕姿""歌曲",中间空一格或是加上一个"+"号或者加上"and"组合检索就可以了,最好不要用"孙燕姿的歌曲"来查,那样会把许多相关的信息漏掉。
10.怎样使用265的目录导航检索方式
目录导航检索是按照信息所属的类别层层点击查找信息,您只要遵循一定的查询规律(与图书馆的图书分类法类似),就能很快找到您需要的所有网站信息。用目录导航检索时最关键的是要考虑清楚想要查找的信息属于哪个类别。比如查找"计算机杀毒软件",首先浏览265的八十大类,看到"计算机与互联网"类目,应当是属于这个类目,点击进入下面有"软件",点击"软件"进入下面有"**与安全",再点击"**与安全"进入下面有"杀**软件",最后点击进入"杀**软件"就会找到许多有关杀**软件的的网站。
11.265的类目主要涉及哪些行业或领域
目前,265"分类目录"共有八十大类,包括娱乐休闲、工商经济、公司企业、文学、国家与地区、计算机与互联网、教育、艺术、体育与健身、卫生与健康、生活服务、社会与文化、社会科学、新闻与媒体、科学与技术、旅游与交通、政治与法律、个人主页,五万多不同层次的子类目,形成了一个十分庞大的树枝状结构,几乎涉及到所有行业或领域。
12.使用目录导航检索方式有哪些技巧
窍门一:如果想查找的信息不是很具体,通过搜狐的分类目录搜索通常会比寻找单个的网站来得有效。例如,要找关于体育彩票的信息,在"首页<娱乐休闲<彩票<体育彩票"类目下有许多高质量的网站。这比起通过输入关键字后,在搜索结果页面中一页一页翻动要效率高。
窍门二:如果在迅速浏览过关键词搜索结果后,看到了似乎合适的一个网站,就可以点击该网站所在的类目,在这个类目下可能就有许多相关。
13.网站搜索和网页搜索有什么不同
网站和网页就象是一本书和书中的书页一样。网站搜索的检索结果基本上就是每个网站的首页链接;网页搜索检索结果是一页一页的网页。
265的网站搜索力求信息的"精",充分发挥人工编辑的优势,每个收录的网站都经过浏览和筛选,只收录质量高的网站,保证了检索出的信息质量。如果想查找企业、单位等信息,用网站搜索可以找到比较简洁准确的结果;网站搜索也有一定的一类信息查找功能,比如查找到一个音乐网,就会包括歌手介绍、歌曲下载以及相关的其他信息。
网页搜索一般都是由"机器人"或是"网络蜘蛛"采集信息,力求信息的"全",并且对信息的揭示更加深入了一步;缺点是信息比较杂乱。用网页搜索适合查找比较具体的信息,比如一首歌、一个产品等。
SuperSo超级搜索的网站搜索和网页搜索互为补充,满足不同的信息检索需求。
15.用逻辑"与"、"或"、"非"进行高级检索
逻辑"与"的组合搜索,用空格、"+"、"and"组合,例如,计算机 **,计算机+**,计算机and**; 逻辑"或"的组合搜索,用"or"组合,比如计算机or电脑;多条件逻辑组合,比如计算机or电脑and**; 中英文数字混检,比如mp3歌曲。
16.搜索结果怎样排序
搜索引擎的搜索结果一般都是按照相关性进行排序,相关性比较高的放在前面,相关性低的放在后面。各个搜索引擎确定相关性的原则各有不同,YOK超级搜引擎的相关性排序是将网站的质量、指向这个网站的链接数量多少和与关键词的相关性算法综合起来决定搜索结果的排序(商业性网站除外)。
17.一些类目后附带的@标记是什么意思呢
分类类目后面的“@”表示,这个类目会同时出现在多个不同分类类目下面。
18.使用逻辑词辅助查找
SuperSo超级搜索的搜索引擎都支持使用逻辑词进行更复杂的搜索界定,常用的有:AND(和)、OR(或)、NOT(否)及NEAR(两个单词的靠近程度),恰当应用它们可以使搜索结果非常精确。另外,也可以使用括号将搜索词分别组合,如[(新闻OR足球)AND米卢]NOT(“新闻”OR足球)。
19.使用双引号进行精确查找
如果查找的是一个词组或多个汉字,最好的办法就是将它们用双引号括起来,这样得到的结果最少、最精确。
20.不同的搜索引擎的差异
有针对性地选择搜索引擎用不同的搜索引擎进行查询得到的结果常常有很大的差异,是因为它们的设计目的和发展走向存在着许多不同,有的专用于USENET的搜索引擎,而有的则是针对邮递列表或IRC等的搜索引擎。使用时要根据自己的需要在SuperSo超级搜索选择合适的搜索引擎。
21.使用加减号限定查找
很多搜索引擎都支持在搜索词前冠以加号“+”限定搜索结果中必须包含的词汇,用减号“-”限定搜索结果不能包含的词汇。
22.根据要求选择查询方法
如果需要快速找到一些相关性比较大的信息,可以使用目录式搜索引擎的查找功能。如果想得到某一方面比较系统的资源信息,可以使用目录一级一级地进行查找。如果要找的信息比较冷门,应该用SuperSo超级搜索搜索引擎查找。
23.查找信息源
有时词组搜索太精确或者一个词组无法准确表达所需信息。那么可以直接到信息源,这种技术“简单得似乎不值一提”,但却很有效。根本不用搜索引擎,直接到提供某种信息组织的站点去。很多时候我们可以用公式“
www.公司名.com”去猜测某一组织的特点。从而得到所要搜索的信息的主要词组。
24.为什么要使用“搜索引擎”
搜索引擎是一种用于帮助INTERNET用户查询信息的搜索工具,它以一定的策略在INTERNET中搜集、发现信息,对信息进行理解、提取、组织和处理,并为用户提供检索服务,从而起到信息导航的目的。
养成使用搜索引擎的好习惯
作为一般人每天的上网时间总是很有限的,如何在最短的时间取得有效的信息就成为了未来生活的一个重要方面。大多数网民平均每天的上网时间在2~3小时,然而其中的大部分时间都花在搜寻的过程中了。如果我们将这种过程极大地缩减,那么就能够取得更大的建树。SuperSo超级搜索搜索引擎所带来的正是互联网的加速,而不仅仅是一种软件的加速,并且是人们认知方式的加速。
25.搜索引擎的第一定律 相关性定律
当用户输入检索词时,搜索引擎去找那些检索词在文章(网页) 中出现频率较高的,位置较重要的,再加上一些对检索词本身常用程度的加权,最后排出一个结果来(检索结果页面) 。词频统计其实根本没有利用任何跟网络有关的特性,是前网络时代的技术。然而,网络时代的主要文献是以网页的形式存在的,而几乎每个人都可以随心所欲地在网上发表各种内容,词频相同的两个网页,质量相差可以很远,可是按照搜索引擎的第一定律,对这两个网页的排序应该是一样的。为了能够派在某些检索结果的前几位,许多网页内容的制作者绞尽脑汁,在其页面上堆砌关键词,搜索引擎对此防不胜防,苦不堪言。
26.搜索引擎的第二定律 人气质量定律
科学引文索引的机制,说白了就是谁的论文被引用次数多,谁就被认为是权威,论文就是好论文。这个思路移植到网上就是谁的网页被链接次数多,那个网页就被认为是质量高,人气旺。在加上相应的链接文字分析,就可以用在搜索结果的排序上了。这就引出了搜索引擎的第二定律:人气质量定律。根据这一定律,搜索结果的相关性排序,并不完全依赖于词频统计,而是更多地依赖于超链分析。超链分析的方法98年以后逐渐被各大搜索引擎所接受,由于链接是网络内容的一个根本特性,这时候的搜索引擎才开始真正利用网络时代的检索技术。
27.搜索引擎的第三定律 自信心定律
谁付的钱多,谁的网站就排在前面,而且付费是根据网民点击该网站的情况来计算的,仅仅在搜索结果中出现并不需要付费。这就是自信心定律的最早实践者!根据这一定律,搜索结果的相关性排序,除了词频统计和超链分析之外,更注重的是竞价拍卖。谁对自己的网站有信心,谁就排在前面。有信心的表现就是愿意为这个排名付钱。需要声明的是,自信心定律也是我自己给这一模式起的名字,以前的文献中并没有人这样总结过。
28.分类目录搜索
分类目录将网站信息系统地分类整理,提供一个按类别编排的网站目录,在每类中,排列着属于这一类别的网站站名、网址链接、内容提要,以及子分类目录,这就像一本电话号码簿一样,典型代表是“雅虎”和“搜狐”。你可以在分类目录中逐级浏览寻找相关的网站,分类目录中往往还提供交叉索引,从而可以方便地在相关的目录之间跳转和浏览。你也可以使用关键词进行检索,检索结果为网站信息,这种检索也称之为网站检索。
29.图形图像搜索
图形图像搜索引擎是专门搜索图形、图像(照片)的搜索引擎。但是现在的图形图像搜索引擎仍然是通过文本关键词查询相关的图形图像信息,它所采用的基本技术同传统的网站搜索引擎或网页全文搜索引擎基本相同,唯一的区别是多了一些对图形图像的专门处理技术,例如生成图像微缩图标的技术、多媒体数据库技术等等,但是这些技术应该属于多媒体技术范畴更加合适,而不属于搜索引擎技术。
30. 元搜索
元搜索有一个妮称,叫做“妈妈”搜索引擎,因为这类搜索引擎自己并不收集网站或网页信息,通常也没有自己的数据库,而是将搜索请求同时发送到多个传统的搜索引擎(例如将查询请求发给InfoSeek,Excite,AltaVista,Yahoo,HotBot),然后对各个搜索引擎的反馈结果再进行整理后返回给查询者。元搜索引擎向其提交查询请求的搜索引擎称为目标搜索引擎。
31. 搜索行为分析
搜索行为分析技术的核心是跟踪分析用户的搜索行为,充分地利用这些信息来提高用户的搜索效率。提高搜索行为分析效率的途径主要有两种:“群体行为分析”和“个性化搜索”。现在许多搜索引擎推出的“热门关键词”服务就是一个群体行为分析的典型例子。“热门关键词”随时提供用户使用最多的关键词,用户可以直接点击这些关键词连接。由于人们的从众心理,“热门关键词”往往也是你想查询的关键词。个性化搜索则是搜索行为分析技术最有前途的方向。通过积累用户的搜索个性化数据,将使用户的搜索更加精确,更符合每个用户的需求。
如何缩小搜索范围
有时查询会得到过多的结果。为得到最实用的资料,您需要进一步缩小查询。这就是"缩小搜索"或"在结果中搜索"。您只要输入更多的关键词筛选查询出来的资料,或者在您想删除的内容前加上减号"-"(切记要在减号前留一个空格位。),即可缩小搜索范围。
32.常见错误:关键词太常见
搜索引擎对常见词的搜索存在缺陷,因为这些词曝光率太高了,以至于出现在成百万网页中,使得它们事实上不能被用来帮你找到什么有用的内容。比如,搜索“电话”, 有无数网站提供跟“电话”相关的信息,从网上黄页到电话零售商到个人电话号码都有。所以当搜索结果太多太乱的时候,你应该尝试使用更多的关键词或者减号来搜索,不使用过于通用的词汇来搜索,设计一个类似“上海 常用电话”这样特殊的搜索关键词,会给你真正有用的结果。当然,如果你想找的是一串汽车网站或一串MP3网站,那么用“汽车”、“MP3”搜索就是正确的。
常见错误3:多义词
要小心使用多义词,比如搜索“Java”,你要找的信息究竟是太平洋上的一个岛、一种著名的咖啡、还是一种计算机语言?搜索引擎是不能理解辨别多义词的。最好的解决办法是,在搜索之前先问自己这个问题,然后用短语、用多个关键词或者用其他的词语来代替多义词作为搜索关键词。比如用“爪哇 印尼”、“爪哇 咖啡”、“Java 语言”分别搜索可以满足不同的需求。
常见错误4:不会输关键词,想要什么输什么
搜索失败的另一个常见原因是类似这样的搜索:“现代爱情故事歌词”、“信息早报在济南发行情况”、“铃羊车的各种图案”、“上海到成都列车时刻表”。网友错把搜索引擎当成是听话的服务员了,其实搜索引擎是很机械的,当你用关键词搜索的时候,它只会把含有这个关键词的网页找出来,根本不管网页上的内容是什么。
常见错误5:在错误的地方搜索
2001年7月23日这一天,正逢高考发榜,各大搜索引擎竟有超过100万次以上的搜索跟高考查分有关。考生们不知道,搜索引擎从抓取网页、解析、索引到提供检索是有一个周期的,各搜索引擎的信息滞后周期从一周到一月不等,所以找最新内容应该去看新闻,用搜索引擎是找不到最新内容,只能找到一个星期或一个月以前的内容。另外,搜索引擎对动态内容,如:论坛、数据库内容,以及带frame结构的网页检索能力较弱,所以这类信息也不适合用搜索引擎搜索,而是应该去相关的网站寻找,当然,寻找相关网站的任务搜索引擎是当仁不让的。
在你逐渐获得网络搜索经验的过程中,避免这些常见的搜索错误将成为一种自然而然的习惯。无论何时,当你得不到或得到意料之外的搜索结果时,记得检查一下你用的搜索关键词,分析一下搜索结果,弄明白发生了什么事,你可能会发现又一个需要避免的搜索错误。
34.MP3搜索技巧之一:精确关键词
用歌手名搜索不能搜到歌手全部作品,搜歌曲直接用歌曲名搜索,如果歌曲名太常见,搜索结果很多,可以用歌曲名加歌手名一起搜,在歌手名和歌曲名之间要加一空格,如搜 “吻”,无法快速找到想要的mp3,用 “吻 萧亚轩”作为关键词很快找到了。
35.关键词
关键词,就是你输入搜索框中的文字,也就是命令搜索引擎寻找的东西。关键词的内容可以是:人名、网站、新闻、小说、软件、游戏、星座、工作、购物、论文等等,可以是任何中文、英文、数字,或中文英文数字的混合体。例如,你可以分别搜索“大话西游”、“windows”、“911”、“F-1赛车”等。你可以输入一个,也可以输入两个、三个、四个(多个关键词之间必须留一个空格)。你甚至可以输入一句话。关键词要求“一字不差”。例如:分别输入“舒淇”和“舒琪”,搜索结果是不同的;分别输入[电脑]和[计算机],搜索结果也是不同的。因此,如果你对搜索结果不满意,建议检查输入文字有无错误,并换用不同的关键词搜索。
36. 怎样搜索新闻中的图片
1)考虑新闻的来源:网站自发、用户提供、转载其它网站、转载报纸、转载国外媒体、、、
2)考虑新闻的性质:突发、历史事件、政治、社会、敏感、专题、例行、、、
3)考虑新闻的时间:刚发生、发展中、几天前、几周前、几月前、几年前、、、
4)考虑你看到那则新闻的网站的性质,以及该新闻在该网站的地位
5)考虑新闻图片的来源:专业图片社、用户提供、转载其它媒体、转载其它网站、、、你要考虑这些图片来源的不同情况,如有无网站、转发惯例等、、、
6)考虑该张新闻网站的去向:唯一还是传播,怎么传播,怎么保存,哪儿能找到
7)判断那张图片的属性,分析可用于搜索的特征。