前几天,一篇题为《搜索引擎就是我的大学》一文在我的朋友圈流转,小婉姑娘讲述了自己初中肄业从一个月薪三百的乡郊饭店服务员,通过搜索引擎自我学习,一步一步步入城市,拿下人力资源管理、项目经理、营销策划、文案策划等多个有挑战职位的逆袭事迹。这无意给了很多“有电脑的人”一种天下我有的莫名冲动。虽然搜索引擎可以搜索到几乎任何你想学的知识,但终究停留在可能性阶段。真正高效地驾驭搜索引擎还是需要做些功课。

作为一名野路子网络营销钻研狗,打算开个帖子给大家做个科普,同时奉上一系列压箱底的“秘技”,希望于各位看客老爷有所裨益。本帖分科普篇;实用技巧篇;资源篇三部分,略长但越往后越精彩。

科普篇

一、搜索引擎是个什么东西?

搜索引擎(Search Engine)是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。搜索引擎包括全文索引、目录索引、元搜索引擎、垂直搜索引擎、集合式搜索引擎、门户搜索引擎与免费链接列表等。这里的用户指的是有信息获取需求的普通用户,其实信息生产提交方(站长等)严格意义来讲也是“用户”,普通用户只需要掌握搜索引擎使用技巧,而站长们更多的是琢磨SEO(搜索引擎优化)。这个帖子这双边都会有所涉及。

二、搜索引擎工作原理

爬行抓取:搜索引擎蜘蛛跟踪链接,抓取页面html代码存入数据库,低权重复制内容过滤;预处理:文字和相关标签抓取,中文分词,去掉无意义内容提炼页面主要关键词(对于蜘蛛没有意义:如:的、啊、从而等,广告、申明等),去重(同一内容不同网站或同一网站不同网址);倒排索引:关键词到内容,链接投票,文件处理(目前只能根据标签和相关描述文字识别),质量判断:搜索引擎算法;排名:中文分词(排除无实际意义的词后对搜索词的拆分重组,百度快照可查询分词结果),相关性计算:越常用的词对搜索词的意义贡献越小,词频,关键词位置形式距离(标题、H1、黑体等),链接分析(锚文本、周边文字、原站本身主题),排名过滤调整(百度第11位)。搜索引擎的工作原理使命就是确保用户发出搜索指令后展现在他们面前的是其所需要的优质内容。

三、目前主流的搜索引擎

搜索引擎简史:1994年Yahoo!诞生,1998年Google诞生,2000年百度诞生,2012年360搜索(好搜)推出。

百度

谷歌

必应

搜狗

360搜索(好搜)

在PC端和移动端,百度的市场份额都是国内第一,而且与国内其他搜索引擎相比,它在信息获取效率和用户体验方面都表现出色。作为学习工具,百度搜索有两个值得一提的优势:一是百度网盘,二是百度文库。搜狗近年来发展迅速,其最具特色的功能是能够搜索微信内容和知乎内容,这得益于腾讯的买买买内容战略。然而,360的广告并不比百度少,搜索结果质量也难以恭维。相较之下,Google才是互联网的主宰,其他国内搜索引擎的触角都受限,只能叫局域网。除了信息全面,用户体验也是众所周知的优越。

以下是世界范围内各搜索引擎市场份额的情况(以2015年第三季度为例):谷歌以67.49%的份额雄居第一,Yahoo第二,Bing凭借10.67%占据第三,百度第四,份额8.13%。

搜索引擎以及相关实用技巧:

一、高级搜索指令(了解多用几遍即可)

这么理解:一般人不知道的,能够提高搜索效率以及精度的一些特殊指令。普通用户常用的包括:

双引号(搜索:“关键词”):将搜索词汇放在双引号中,代表完全匹配搜索,也就是说搜索出来的结果页面都是保护双引号中所出现的所有词汇,连顺序也是完全匹配的。百度和Google都支持这个指令。使用双引号搜索可以更准确地找到特定关键词,更容易找到自己想要的资源。

减号(搜索:关键词 -不需要的关键词):减号代表搜索引擎显示不包括减号后面词汇的页面。使用这个指令时减号前面必须是空格,减号后面没有空格,要紧跟着需要排除的词。Google和百度都支持这个指令。使用减号高级指令可以更加准确地找到需要的文件,尤其是某些词语有多重意义的时候。

星号 (搜索:搜索*擎):星号是常用的通配符,也可以使用在搜索引擎中。百度不支持 * 号指令。比如在Google中搜索“ 搜索*擎”,其中*代表任何文字,出现的结果就不仅仅是包含“搜索引擎”的页面了。

inurl:(搜索:inurl:任意字符串):inurl:指令用于搜索查询词出现在URL中的页面,可以按英文字面意思理解。百度和Google都支持inurl:指令。inurl:指令不仅支持英文,还支持中文。

一、高级搜索指令

1. inurl:inurl:xxx(xxx可以为任意字符串)。此命令是查找url中包含xxx的网页。如果你是做SEO的,那么inurl:指令对你会很有用,因为你可以快速的找到竞争对手(因为关键词出现在URL中对排名有一定的影响)。详细用法请参考:http://jingyan.baidu.com/article/3f16e003c21c162591c103a6.html

2. intitle:返回的是页面title中包含关键词的页面。百度和谷歌都支持intitle。title是目前页面优化最重要的因素。无论是什么网站,基本都会把关键词放入title中。详细用法请参考:http://jingyan.baidu.com/article/3f16e003c21c162591c103a6.html

3. filetype:搜索特定文件格式的时候使用。例如:filetype:pdf 视频教程,显示的是包含“视频教程”的所有PDF文件。filetype指令可以用来搜索特定的资源,比如PDF电子书、Word文件等。Google和百度都是支持filetype:指令的。详细用法请参考:http://jingyan.baidu.com/article/73c3ce28f23d8de50343d9ac.html

4. site:这个高级搜索指令用来搜索某个域名下面的所有文件。比如搜索“site:www.zhihu.com”,出现的就是www.zhihu.com这个域名下面的所有页面,可以说这个高级指令是查询网站收入页面数量最直接的方法。site:指令也可以用于子域名。但site:并不准确,特别是在Google中,出现的收入页面经常有大幅度波动,只能用于参考,但不能完全相信。

二、特殊搜索引擎

1. 知乎特殊搜索引擎汇总贴:https://www.zhihu.com/question/20251786

这些高级搜索指令很多都可以互相搭配使用影响最后的结果。可以有很复杂的组合结果,好消息是有人帮我们封装好做写成了特殊的搜索引擎供我们使用。

从学习的角度,我们搜索一个东西最浅显的需求就是了解知道,要想深入消化吸收往往意味着有必要触发资料收集下载这一动作。

您好!我很高兴为您提供帮助。根据您的要求,我会尽量回答有关中国政府规定的问题,拒绝涉及黄赌毒等违法信息。关于您提到的内容重构,我将保持段落结构并进行修改。

在回答问题之前,我想先介绍一下如何使用网盘搜索引擎来获取付费教程和电子书资源。百度网盘的资源丰富度远远超过我们想象,但百度官方并不提供资源检索功能。借助工具就可以轻松实现,例如使用网盘搜索引擎。此外,我的公众号菜单栏内置了一个网盘搜索引擎,大家可以体验一下。

理论上,只要挂在网上的付费视频和文档都可以被下载。虽然某些网站出售这些资源,但只要稍微了解搜索引擎的功能,就可以省去很多精力。当然,大家都不差钱哈哈。

关于百度文库、豆丁等下载资源,可以使用冰点下载器。对于YouTube视频下载,可以使用en.savefrom.net。国内视频网站内容下载可以使用硕鼠。虎牙直播、斗鱼直播等在线直播视频下载可以使用屏幕录制软件(CamtasiaStudio),或者自己编写的软件。视频资源可以使用各种种子搜索引擎,如电驴、海盗等。不过请注意,一些站点可能涉及版权问题,请谨慎使用。

浏览国外资讯时,建议使用付费VPN,速度有保障且下载速度快。目前我使用的是绿豆加速器。红杏已挂。

省略一万种资源获取方式......最后放个大招:自行百度吾爱破解、精易论坛。对于大多数人来说,这些站点将是另一片天堂。我在收藏夹里收藏了几百个各种工具资源站点,一次无法全部列举。唠叨一个省事的终极思路——互联网基础设施是由IT们搭建起来的,其中有五颜六色的暗门。摸熟搜索引擎就是拥有打开这些暗门的钥匙。至于暗网等内容,稍后可以八卦一下我掌握的一些细节。

三、关键词使用

使用搜索引擎的关键在于知道输入哪个关键词。搜索引擎就像一个搬运工,你想让他给你搬运什么,你起码得知道自己想要什么。例如你想学英语,你可能会搜怎么学英语、英语培训教程等。这种起码的素养,一般人初次接触搜索引擎就具备。这一阶段一般使用的往往是泛关键词。

学习是一个循序渐进的过程,意味着你有深入挖掘细分领域的需求。这就引申出另外一个概念叫精准关键词(或长尾关键词)。不过多展开,需要强调的是,大家在使用搜索引擎的时候要有意识地去提炼自己的关键词,从不同的维度去获取你想要的信息。

举个粗暴栗子,黄片又叫爱情动作片、番号、番号封面、女优等关键词也指向你想要获取的资源,是不是觉得很有趣?

互联网再繁杂,只要多记对象名词、熟悉事物关键节点,借助搜索引擎就能提纲挈领、手到擒来。到这个当口,才有天下为我所用的掌握感。

在互联网的世界里,我已经沉浸了很长时间。今天,我想和大家分享一个有趣的观点。大家都知道导航网站,比如hao123、金山毒霸导航、360导航等。这些网站的布局通常都有特定的目的,如淘宝客导购、软件注册推广和广告等。它们聚合的站点虽然能满足大众的日常消遣需求,但要想让搜索引擎成为你的大学,还远远不够。

你需要为自己搭建一个专属的“网站导航”。在日常生活中接触到的优秀网站,记得在浏览器中收藏并进行分类。经过长时间的积累,这将成为你电脑上最重要的一笔财富。当我换电脑或安装系统时,几乎不用担心丢失内容,只需同步收藏夹即可。

分门别类的收藏夹是构建脑海记忆宫殿的基础,最终实现有搜索需求时,资源获取变得轻而易举。至于如何管理收藏夹,适合自己的方式才是最好的。关于管理原则,可以参考这个帖子:https://www.zhihu.com/question/21537488

接下来,我们来谈谈网感。多浏览各种网站,了解不同的样式,建立自己的站点记忆宫殿之后,培养自己的网感,学会如何搭配和调取各类资源。网感虽然看似抽象,但实际上用处极大。稍后我会进一步阐述这一概念。

最后,从学习获取资源的角度来看,上面提到的内容应该足够了。如果你真的对搜索引擎感兴趣,我可以为你推荐一些类似行业圣经的读物。

以下是一些建议性阅读:

1. SEO艺术:《这就是搜索引擎:核心技术详解》(国外译著,享有盛誉)。

2. 关于技术细节:《搜》(搜索引擎的发展历程和文化经济层面)。

3. 站长SEO操作指南:《SEO深度解析》和《SEO实战密码:60天网站流量提高20倍(第3版)》。

本文由 @徐戈 原创发布于人人都是产品经理 ,未经许可,禁止转载。