seo优化基础知识91
作者:赢搜网络 前的搜索引擎在抓取网页和分析时是有一些限制的,有时候并不能完整个了解网页,它们所看到的内容并不一定跟我们所看到的一样,我们将会在本章中介绍如何修改以及建构您的网页。 可索引的内容 为了可以让搜寻引擎更好的理解网页内容,您应该使用html格式在您最重要的内容上,尽管搜寻引擎抓取的技术已经越来越好,但是在抓取时还是会自动忽略一些图片、flash、Java、视频等等非文字内容。如果您必须使用这个格式建构网站时,我们提供以下方法可以让搜寻引擎更容易抓取您的网页数据。 为图片使用替代文字:在图片的Html中加入<img alt=”文字介绍”>,可以让搜寻引擎抓取文字描述。 建立网站的搜寻框:可以导航网站内容,以及所以网站的连接。 使用有提供文字检索的Flash和Java插件。 有许多网站在可索引内容方面有许多问题,因此我们必须很仔细的检查。网络上有提供许多好用的工具如Google的页面暂存、SEO-browser.com、MozBar等,可以让我们知道,页面有那些东西是搜寻引擎可以看到并且可以索引的。 如果你的网页中只有图片,而没有任何文字的描述,那么在索引中可能只会出现一片空白,对搜搜寻引擎来说这个页面是没有任何内容的。 所以不仅要做好页面,也要让页面可以让搜索引擎看见也是很重要的。 网站的连接结构 搜寻引擎的抓取是透过您提交网址或是连接来进行网络中的爬取数据,所以它们一定要可以联系到网站的路径才能收入你的网站数据,许多网站犯了很关键的错误,他们用了搜索引擎无法访问的方式建构,使得搜寻引擎无法了解他所有网站的内容。 google索引A→所以B,无法索引C 搜寻引擎从网站A页面开始爬取,A页面中有B页面的连接,它就会再爬取完A页面时继续到B页面爬取,但是如果网站的C页面没有跟A、B页面产生连接,那么搜寻引擎就无法直接联系到C页面,以至于无法索引C页面的内容。 连接的形式 连接可以建立在图片、文字、视频,所有在页面上可以让你点击的地方,可以让用户从这个页面往另一个页面移动。这些连接是网络中的导航元素,我们统称为超连接。在html语法中是这么显示的<a href=”连接网址”>连接名称</a>,这是最基本连接形式,搜寻引擎非常容易理解,而且这个连接还是影响排名的因素之一。 搜索引擎无法访问页面的原因 需要填写表单才能进入页面:如需要登入帐号才能宽看整个页面,搜寻引擎并不会填写这些信息,所以当你的网站需要填写完这些表单才能进入时,搜寻引擎则不会访问你的页面。 连接建立在不可以解析的Javascript中:如果Javascript作为连接,你可能会发现搜寻引擎并不会抓取,或是给予这个连接较少权重。 Meta Robots标记或是robots.txt中阻止页面连接:在Meta元素中限制爬中抓取这个网站的连接,或是在robots.txt禁止爬虫抓取,都能让页面无法被搜寻引擎索引,这些通常是用在您不想显示在搜寻结果的页面上。 使用Frames或是Iframes:通常来说,建立在Frames跟Ifarmes中的连接都是可以抓取的,但是可能会引起搜寻引擎结构上的问题,所以除非您是一个非常了解搜寻引擎索引方式的专家,不然最好少用。 搜索框:很多网站中,都只放了一个搜索框,但是搜寻引擎并不会自己去使用搜索来查询您有哪些网页,所以你的网站中,只有一个搜索框而没有其他内部的连接,那么你的网站就不会出现在搜寻引擎的结果中了。 使用Java、Flash:Google已经在2017年宣布停止支持Flash,也就是如你是用Flash制作网页,而Flash中的内容是完全不会被索引到的。 单一个页面中有几千个连接:Google为了防止垃圾网站和作弊网站,搜寻引擎只会抓取一定数量的连接,所以如果单一页面的连接太多,可能导致无法访问网站中所有连接到的页面。 nofollow语法:在连接中使用 <a href=”https://seobook.tw”rel=”nofollow”>SEOBOOK</a> 上面这个连接方式会让搜寻引擎碰到这个连接时,当作是文字而已,并不会访问他所连接的内容,这个连接也不会增加、降低网页的权重跟价值,这点对于SEO来是很重要的,如果您不想因为垃圾评论的连接降低您网页的权重,您可以使用nofollow在评论的地方来避免垃圾连接。 如果能避免以上这些错误的方式,搜寻引擎将可以轻松地访问您所有的页面,并将其收入索引 |