导读:Google于年宣布,自年首次开始为PDF文件编制索引,已索引了数亿个PDF文件。截止目前,PDF文件不仅可以被谷歌抓取、索引,还可以参与排名,并因其很好的兼容性和一致性,被广泛应用于政府、学术界及商业环境。本篇文章我们将研究PDF谷歌SEO相关知识并如何使PDF更加SEO友好。
目录:
lPDF可以参与谷歌排名吗?
l谷歌如何看待PDF
l什么时候适用PDF
l如何使您的PDF对SEO友好
lPDF效果如何追踪
一.PDF可以参与谷歌排名吗?
目前PDF文件谷歌可以抓取、索引和排名,他们在搜索引擎结果中带有自己标签(PDF),以提醒用户结果是基于PDF的。
(PDF参与谷歌自然排名)
一些PDF甚至可以获得了谷歌精选摘要FeaturedSnippets,排名谷歌自然排名第一位。
(PDF谷歌自然排名第一位)
二.谷歌如何看待PDF
一)谷歌可以索引任何PDF文件吗
通常谷歌可以从使用各种字符编码的PDF文件中索引文本内容(以任何语言编写),前提是它们没有密码保护或加密。如果文本嵌入为图像,谷歌可以使用OCR算法处理图像以提取文本,PDF中的图像也会被收录在谷歌图片搜索结果中。
官方表示,一般的经验法则是,如果您可以将PDF文档中的文本复制并粘贴到标准文本文档中,谷歌应该能够索引该文本。
二)如何看待PDFSEO
尽管Google索引并会对PDF进行排名,但该格式与网页相比会存在一些缺点:
1.不适合移动设备。PDF在设备上具有一致的外观,这意味着我们无法针对移动端做出更加友好的PDF。
2.缺乏导航。大多数PDF不包含导航元素,使人们更难探索其他内容。
3.缺少一些SEO属性。PDF文件具有许多SEO元素,Title、Description等。但也缺少许多元素,例如nofollow、UGC和赞助商链接等单个链接属性。
4.可能不会经常爬。由于PDF很少更改,因此与更新更频繁的页面相比,它们的抓取频率往往更低。
5.跟踪比较困难。大多数常见的跟踪器在网页上运行JavaScript,而不能在PDF文件中工作。
正因为如此,正常我们新增网站内容时一般建议是页面形式而不是PDF文档。
三.什么时候适用PDF?
尽管说PDF会存在一些缺陷,但是以下情况使用PDF会更加的友好
1.电子书
电子书通常有插图、信息图表和指南。
2.离线内容
如果您的内容可以从离线选项中受益,那么PDF是首选途径。这也适用于信息量大的博客文章。但需要注意,避免网站存在相同内容文章,以避免因内容重复而受到处罚。
3.规范文件
PDF通常格式繁重,并带有大量图像和插图,是规范文档的理想格式。
鉴于规范文档的打印频率,PDF可确保每个人都以相同的方式查看您的文档。
4.白皮书
PDF通常比大多数在线内容要长,适合制作白皮书。考虑到人们在白皮书上做笔记的频率,最好提供可打印的选项。
友情提醒:
1)您要确保您的PDF包含指向您网站其余部分的链接。否则,没有链接交互的PDF将影响您的点击率(CTR),这可能会影响您的排名,因为算法会考虑用户在您的网站上花费了多少时间以及浏览了多少。
2)下载PDF的选项也是获取访问者联系信息的绝佳机会。只需提供PDF下载以换取他们的姓名、电子邮件等
四.如何使您的PDF对SEO友好
PDFSEO规范与HTMLSEO规则基本相同,大部分HTML的on-pageSEO同样适用于PDF。而且一些时候PDF文档效果会更佳,所以我们需要针对PDF做出SEO优化,以使其更加的谷歌友好,以便获取收录和排名。相关建议如下:
一)创造精彩的内容
不论页面格式如何,谷歌都偏向于良好的内容质量,这也就是为什么技术文档、白皮书等内容丰富的PDF经常会出现在谷歌SERP首页。
二)使用关键词丰富的文件名
我们很多时候会忽略PDF文件名,须不知有时谷歌会直接拿文件名作为PDF搜索结果的展示Title。所以我们需要认真对待PDF文件名.
1.文件名关键字相关且易于搜索
2.越短越好.理想的文件名长度在50-60个字符之间
3.尽可能将URL与PDF的标题相匹配
4.删除标点符号、哈希和停用词(and、or、but、of、the、a等)
5.始终使用小写字母
6.分隔单词时,尽可能使用连字符
三)添加优化标题Title
就像网页有标题标签一样,PDF也有标题。请注意,许多搜索引擎使用标题来描述其搜索结果中的文档。如果PDF没有标题,则文件名会出现在SERP中。针对PDFTitle优化,具体建议如下:
1.将最重要的关键字词组放在前面或附近。
2.以55-70个字符为目标(必要时可以超过这个值,但要避免过长)。
3.品牌或网站名称应位于标题标签的末尾。
4.使用人物、事件、物品等的全名
5.尽量减少停用词(a、and、the等)的使用
6.包括年度活动的日期或日期很重要的情况。
7.限制标点符号(连字符、逗号都可以;使用“and”而不是“”)
请注意,每个PDF中使用唯一的标题标签,避免PDF标题重复
四)添加优化描述Description
PDF的描述和页面的描述一样,会出现在SERP中的描述部分。针对PDFDescription请参照以下建议:
1.最多个字符,1-3个句子。
2.从行动词开始:Get,Find,Explore,Discover,Shop,Browse,Research,Compare………
3.尽量在文本中使用主要和次要关键字(如果可以的话,在第一句话内)。同时像付费搜索广告一样,要诱人!提供信息!
五)添加Heading标签
PDF同样可以添加H1,H2,H3等标签,并且作用相同。所以如果可以建议每个PDF文档中使用H标签。
以下是PDFHeading标签的优化建议:
lPDF的标题使用H1标签,且H1标签唯一。
lH标签的最大长度约为个字符,但通常更简洁。
l应始终包含并且通常以主要关键字开头。
l使用H2、H3和其他子标题,以使PDF内容更加具有结构性和易于理解
六)内部链接
和任何页面一样,内部和外部链接也会影响排名,链接之间可以传递权重。所以通过给您的PDF文档增加链接和您的PDF文档中包含指向其他页面的链接(PDF或html),会使得整个网站链接都在相互传递权重,而不是一个个孤岛。实际上很多PDF获得了很好的引用和链接指向,但如果PDF没有指向其他的页面链接,这时就会很浪费。
PDF链接指向时建议使用锚文本,以提供相关的语境,您的锚文本应该是:
l独特的
l简洁
l与链接到的内容相关
l关键字丰富,但不是关键字填充
七)让您的PDF适合移动设备
越来越多的人使用移动设备,所以针对PDF请注重移动设备的优化。因此,请按照以下步骤操作:
l左对齐您的文本:这样人们可以更快地滚动浏览您的文档,而无需先水平滚动。
l使用要点和粗体文本:这些技术将使浏览PDF变得更容易。
l谨慎使用图像:图像有助于帮助理解内容,但它们还会增加您的文件大小,因此请明智地使用。
l用副标题分解内容:这也将使您的文档更易于阅读。
l短段落:尝试将段落保持在3到4个句子(仅供参考)。
八)其他PDFSEO友好建议
1.使用更少的字体和较少的字体样式
2.优化PDF图像
如果您希望自己的PDF被索引,请确保它的文本多于图像
3.图片alt属性
爬虫无法识别图片内容,另同时避免图片未加载时的无法理解,请使用alt标签优化图片。其中alt标签建议如下:
l简洁
l描述性的
l关键字丰富,但不是关键字填充
五.如何跟踪PDF效果
前面说过PDF很难进行追踪,所以很多企业会设置下载选项或者表单提交的形式下载PDF,以此获取潜在客户。但是,我们还是会有一些可追踪您PDF情况的方法,包括:
1.下载链接事件追踪
您可以查看PDF链接点击、下载及表单提交时的数据,以便了解用户点击PDF、文件下载和表单提交时的次数。
追踪方式:GTM事件追踪或GA中的EventMeasurement
2.服务器日志
任何文件都会存储在服务器上,PDF文档也不例外,因此您可以通过服务器LOG日志去了解PDF的文档访问情况
3.第三方工具
在数据分析工具中PDF数据很少能被追踪和统计,但借助于第三方工具可以查看PDF文档的流量数据情况,及分析出网站中Top的PDF文档。一般可追踪的工具有:Googlesearchconsole,SEMRUSH和Ahref。
下面是Semrush查询google内容中PDF文档相关数据截图:
(网站中有流量PDF文档,流量从高到低排序)
结束语:通常情况,我们更加建议您使用网页而非PDF,以获得更加友好的用户体验。但针对PDF效果较佳的情况,如白皮书、产品操作手册,请遵循以上建议,以在谷歌搜索结果中获得更佳索引、收录和排名效果。
参考资料: