URL標準化是什么意思?如何標準化URL

 二維碼 8
發表時間:2021-01-17 11:59作者:敖游來源:遨游建站網址:http://www.52wangou.com.cn

URL標準化,英文全稱為URL Canonicalize?,F在互聯網越來越講究規范化,網站的URL標準化(URL canonicalization)是近兩年來在各大搜索引擎的搜索結果中出現的一個很大的問題。它指的是搜索引擎挑選最好的URL網址作為真正網址的過程。

通俗的說,就是將你的頁面URL唯一化。導致頁面URL多樣化的原因有很多,主要包括包含www及不含www,動態頁面及偽靜態技術,302的臨時重定向,一些JS或者Meta跳轉等等。這些因素最基礎的影響就是讓搜索引擎無所適從,到底哪個URL才是你要使用的?所以,就產生了URL標準化的概念。


URL標準化是什么意思?如何標準化URL


URL標準化是什么意思?


URL標準化是什么意思?URL標準化,英文:url canonicalization,來自“matt cutts”的博客文章:SEO advice: url canonicalization,中文翻譯:SEO的建議:URL標準化 “URL標準化”是一個動名詞,不好直接解釋,我把它反過來一下:

什么是一個標準化的URL?

很多情況下,我們認為以下這幾個鏈接都指向同一個頁面(首頁):

www.52wangou.com.cn

aoyouwl.com/

www.52wangou.com.cn/index.html

/index.php/index.php

aoyouwl.com/home.asp(ASP即“活動服務器網頁”,是Active Server Page的縮寫,ASP的網頁文件的格式是.asp。ASP主要特性是HTML 、 腳本和 ActiveX ( 網絡化多媒體對象技術) 組件等整合在一起,創建和運行動態的 、交互的和高性能的 Web 服務器應用程序。ASP 屬于 ActiveX 技術中服務器端的技術,這與通常在客戶端實現動態網頁的技術如 Java apple t、JavaScript 等有所不同,ASP 的命令和腳本語句是在服務器中解釋執行,執行后的結果產生 HTML。)

但是,從URL發送請求并返回網頁內容的過程來看,這些URL都是互不相同的。對于上述URLs,Web服務器完全可以返回完全不同的內容。當這些URL所對應的內容都一樣時(一般情況下都一樣的),谷歌需要從上述URLs中選一個具有代表性的,而忽略其余的。那么這個被谷歌選擇了的URL,就是一個標準化的URL。谷歌選擇的這個過程稱為“標準化”。


URL標準化的目的在于集中網站權重,通過技術手段可以實現。


什么是URL靜態化?


現在搜索引擎越來越智能化,搜索引擎已經能夠識別大部分的動態化的URL,站在整體角度,動態化的URL還是在一定程度上還是不如靜態化的URL收錄好。所以說我們在做好URL標準化的時候,把URL靜態化也是必須要做好的工作。大家請根據自己的網站空間具體的情況去做好這一項重要的操作吧,這里如果不懂的請及時咨詢下你的空間商是否支持靜態化的URL。

在談什么是URL靜態化之前,了解兩個概念:靜態網頁和動態網頁。

(1)靜態網頁:靜態網頁一般是以”.html”、”.html”、”.shtml”、”.xml”等后綴的格式結尾的頁面。

例如:http://www.52wangou.com.cn/wmjcsydwxljynx.html 就是一個靜態頁面的url。

(2)動態網頁:以.aspx、.asp、.jsp、.php、.perl、.cgi等形式為后綴,并且在動態頁網址中含有一個或者多個標志性的符號”?”。

例如:http://www.52wangou.com.cn/wzjs.html 就是一個動態頁面的url。


URL靜態化就是通過技術手段或者偽靜態規則將動態的網址變為靜態網頁或者是偽靜態網頁。網頁偽靜態恰好解決了靜態網頁難維護,動態網頁不友好的問題,一方面對于搜索引擎和用戶來說比較友好。但是同樣也存在缺點,就是占用cpu資源相對較大。


怎么實現URL靜態化?


我們可以看出上邊就是一個動態地址,就是數據基本都是在數據庫里面調用出來的,影響搜索引擎抓取,我們要通過上傳靜態化文件,將動態網址偽靜態。

url在網站優化中起到很重要的作用,網站內部優化不需要做到極致,但需要將能做的進了能做到最大化。

如果網站是使用的模板,最好到程序模板提供商處獲取rewrite規則。如果是獨立研發的網站程序,最好找專業程序員編寫代碼?,F在主流的網站建設系統(遨游建站)都支持偽靜態。只需要根據提示操作就可以了。

Apache環境下的偽靜態規則就是:

方法一:在本地創建.htaccess文件后寫入以下代碼,上傳到網站根目錄下,就完成URL偽靜態設置了。

RewriteEngine On

RewriteBase /

RewriteCond %{QUERY_STRING} ^(.*)$

RewriteRule ^topic-(.+)\.html$ portal.php?mod=topic&topic=$1&%1

RewriteCond %{QUERY_STRING} ^(.*)$

RewriteRule ^article-([0-9]+)-([0-9]+)\.html$ portal.php?     mod=view&aid=$1&page=$2&%1

RewriteCond %{QUERY_STRING} ^(.*)$

RewriteRule ^forum-(\w+)-([0-9]+)\.html$ forum.php?mod=forumdisplay&fid=$1&page=$2&%1

RewriteCond %{QUERY_STRING} ^(.*)$

RewriteRule ^thread-([0-9]+)-([0-9]+)-([0-9]+)\.html$ forum.php?mod=viewthread&tid=$1&extra=page\%3D$3&page=$2&%1

RewriteCond %{QUERY_STRING} ^(.*)$

RewriteRule ^group-([0-9]+)-([0-9]+)\.html$ forum.php?mod=group&fid=$1&page=$2&%1

RewriteCond %{QUERY_STRING} ^(.*)$

RewriteRule ^space-(username|uid)-(.+)\.html$ home.php?mod=space&$1=$2&%1

RewriteCond %{QUERY_STRING} ^(.*)$

RewriteRule ^blog-([0-9]+)-([0-9]+)\.html$ home.php?mod=space&uid=$1&do=blog&id=$2&%1

RewriteCond %{QUERY_STRING} ^(.*)$

RewriteRule ^archiver/(fid|tid)-([0-9]+)\.html$ archiver/index.php?action=$1&value=$2&%1

方法二

(1)打開httpd.conf文件,找到#LoadModule rewrite_module modules/mod_rewrite.so 注釋前面#

(2)打開httpd-vhosts.conf文件,在VirtualHost添加重寫規則,RewriteEngine _disibledevent=>

基本上就上面這兩個步驟,,這種Apache中URL地址重寫比較簡單。

方法三

在httpd.conf或.htaccess中使用RewriteRule:

RewriteRule “^/dir/ ([^./]*) \.html” “/dir/script.cgi?doc=$1″   [PT][PT]標記告訴Apache執行后續的所有操作。

一般第三種方法用的最多,針對asp.net、asp等還有他們自己的偽靜態規則,可以去研究一下。         

URL中包含關鍵詞

通過我們的大量的研究證明,當你在優化一個指數很高關鍵詞的時候,URL中包含該關鍵詞的拼音或者直接利用該關鍵詞作為域名在一定程度上,對我們的關鍵詞排名會有一定的優勢。所以說,當我們的在選擇域名或者給我們的網站建立一級或者二級目錄的時候,我們一定要在我們自定義的URL上去增加該關鍵詞的拼音或者直接利用該關鍵詞作為該目錄的網址。

標準URL大小寫

不管是我們在做內鏈還是在做外鏈的時候,我們在書寫網站URL的時候,一定要統一該URL的具體寫法,假設我們一直使用的是“小寫”的寫法,那么在以后我們不管是做內鏈還是外鏈的時候,我們全部統一成小寫,假如是利用“大寫”那么我們就統一成大寫。這樣做到的目的是為了更好讓搜索引擎識別,避免搜索引擎誤認為我們網站的URL重疊,從而對我們的網站降權。

盡量簡短

上面說過我們的URL中要盡量包含網站的關鍵詞或者拼音,但是我們的URL一定不能過長,我們的URL一定要盡量簡短,便于用戶記憶為佳,下次用戶訪問的時候,可能就會直接輸入你的URL地址進行訪問了。


為什么URL要靜態化?


Google官方對SEO的建議是不進行URL靜態化,原因有三點:

1、Google完全有能力抓取動態網址,多少個問號也不是問題。

2、動態網址更有助于Google蜘蛛讀懂URL含義,URL里的參數都有助于Google理解URL及網頁內容,并進行鑒別。而將網址靜態化后,這些參數的意義通常就變得不明顯了。

3、網址靜態化很容易弄錯,比如通常動態網址的參數調換順序,所得到的頁面其實是相同。尤其是對已經收錄了動態網址靜態化,收錄靜態頁面后的兩個網址Google就不容易判斷是不是同一個頁面,從而可能引起復制內容。

雖然說Google建議在SEO過程中不要URL靜態化,但是在實際過程中,我們歸根據實際情況對動態網址URL靜態化。我們完全相信Google的技術能夠對帶幾個參數的URL收錄,但是并不意味著雅虎,百度,微軟等搜索引擎能夠做到,尤其是針對于中文搜索引擎。并且在SEO實踐過程中發靜態的URL明顯排名靠前。動態網址一般比較長,不利于記憶,也不利于傳播。


URL標準化


Google如何挑選標準化的URL


在沒有做特殊設置的情況下,Google會根據外鏈的數量來確定標準化的URL,也就是哪個地址被外鏈引用的次數最多,哪個地址就是標準化的URL。所以我們在平時做外鏈的時候,就要確保地址的唯一性,不要有的地方用 “aoyouwl.com”,而有的地方又用 “www.52wangou.com.cn”。統一你的外鏈地址,讓Googel能夠快速的確認你的標準化URL,以便給予合適的排名。

同樣,我們在走內鏈的時候,也要考慮到標準化URL的問題!


谷歌是如何進行URL標準化的


首先我們要確定URL標準化設計的方面,主要是帶www與不帶www的地址,以及偽靜態造成的重復收錄等問題,我們可以采用不同的方式來解決這個問題。

常見的設置url是將不帶www的網址轉跳到帶www,一定做的是301(記住只能做301 !302不可做)。在我們做外鏈的時候一定要將網址寫成301跳轉之后的網址。例如:www.52wangou.com.cn 轉跳到 aoyouwl.com 以后在做外鏈或者錨文本時候,就不要帶www了,還有一些程序生成首頁會出現后邊帶index.html或index.php,我們可以利用技術手段將其去掉。



1、301重定向


301重定向的意思是告訴搜索引擎我們的網址已經永久性的變更了,當我們的網站在進行改版或者更換域名的時候,我們則可以使用這樣的一個301重定向的方式來告訴搜索引擎我們的網址已經永久性的變更了,這樣做可以把以前域名的權重全部集中到新的URL上,當然在這個傳遞權重的過程中可能會需要一定的時間,這個時候我們則需要慢慢的等待即可。

經常會碰到這樣的情況,其他網站鏈接你的站點時,會用下面的鏈接:

www.52wangou.com.cn

aoyouwl.com/

www.52wangou.com.cn/index.html

aoyouwl.com/index.php

而這樣導致:你站點主域名的pr值分散到其他幾個URLs了。

如果你用301重定向把其他三個URL轉到

www.52wangou.com.cn

PR也就集中在主域名:www.52wangou.com.cn 了。

如果,我們決定采用帶www的地址為唯一的地址,那么,我們可以使用301永久重定向代碼,301重定向具體辦法:

設置.htaccess文件(只適用于linux系統,并需要虛擬主機支持。)

使訪問aoyouwl.com/的時候就會自動轉到www.52wangou.com.cn

在.htaccess文件里寫上以下代碼即可。

RewriteEngine on

RewriteCond %{http_host} ^aoyouwl.com [NC]

RewriteRule ^(.*)$ http://www.52wangou.com.cn/ $1 [L,R=301]

將所有不帶www的地址進行重定向!


2、采用Canonical標簽


Canonical標簽經常會被用在偽靜態地址上。您可以查看本站所有頁面的源代碼,在Head部分都有一個“link rel=’canonical’”的標簽,來標明這個頁面的標準化地址,以便讓Google進行確認,防止重復頁面的收錄。百度目前不支持該標簽!


3、采用Robot.txt文件


由于百度不支持Canonical標簽,我們可以結合使用robot文件來禁止搜索引擎收錄部分格式的頁面,以防止偽靜態情況下的重復收錄!比如我們用wordpress搭建博客時,采用了偽靜態技術,另外也不希望一些管理文件被收錄,則常見的wordpress博客Robots.txt文件寫法為:

User-agent: * –所有搜索引擎蜘蛛

Disallow: /wp-*/ –不收錄以WP-開頭的文件夾

Disallow: */feed –不收錄feed(包括單頁,整站,評論的feed)

Disallow: */trackback –不收錄引用

Disallow: /*?* –不收錄動態頁


4、如何將無效的URL重定向到其他頁面?


很多時候,我們考慮把無效的URL比如:用戶拼錯的URL、不存在的URL重定向到別的網頁,例如網站的首頁、404頁面等。

在httpd.conf或.htaccess文件中使用ErrorDocument來捕獲404 (找不到文件)錯誤:

ErrorDocument 404/index.html

DirectoryIndex index.html/path/to/notfound.html

本功能會讓所有的404錯誤——每次當某人請求無效的URL 時,都返回 URL/index.html 提供的網站首頁。

這里需要注意兩點:

4.1、直接指向首頁是否是合適的?或者讓它指向到一個404頁面會更好些?如果在404頁面用javasctrip做一個跳轉到首頁,也是SEO允許的做法。

4.2、即使返回有效的文件,仍然會將404 狀態碼返回給客戶端和搜索引擎。這表示搜索引擎機器人來確認網站上的鏈接時,仍然會得到正確的結果(404狀態碼)。


5、改版時,如何保留原鏈接,創建新的URL?


具體操作辦法(僅適用于apache網絡服務器):

文件位置:apache->conf->httpd.conf

請在httpd.conf中使用Alias指令:

Alias /newurl/www/htdocs/oldurl

如:用戶訪問新的地址 example.com/newurl/id34.html 服務器將提供的內容原地址是 example.com/www/htdocs/oldurl/id34.html。

注意:Alias只會改變本地URL,如 fjseoer.com/newurl/id34.html 的/newurl/id34.html 部分,而無法改變URL的主機名稱部分(如:http://www.fjseoer.com/ 部分)。若要更改URL的主機名稱部分,請使用Redirect或RewriteRule指令。

遨游指南:本功能的Alias指令在 httpd.conf中是這一句: #Alias/webpath/full/filesystem/path 去掉前面的#,并做下相應的修改即可。

SEO過程中一般在這些情況下需要用到該功能:

5.1、當文件移動或文件目錄名稱發現改變,出于SEO需要,你需要保持舊的URL;

5.2、網站改版了,網站導航和鏈接發生變化,為了繼續持有原鏈接帶來的流量,你需要保持舊的URL;

5.3、你希望不同的人用不同URL來鏈接同一個的內容。(SEO一般不建議這樣做)


6、如何替換請求URL中的文字


以下解決方案,僅適用于Apache服務器。

在.htaccess文件中添加以下語句:

RewriteCond %{REQUEST_URL} “string1”

RewriteRule “(.*)”string1(.*)” “$1string2$2” [N,PT]

例如當客戶端發出請求URL:example.com/string1/abcstring1.html,則轉換為目標URL:example.com/string2/abcstring2.html。

其中[N]標記告訴Apache重新執行重寫規則,直到RewriteCond失效為止。只要請求URL中包含需要替換的字符串,它就會一直重復地執行。當所有的string1都被替換完畢,則RewriteCond失效。本例子中,RewriteCond執行了2次。[PT]告訴mod_rewrite把重寫的URL傳送到Apache來進行接下來的處理工作。

我們都知道,關鍵字是否在URL中對于網站SEO至關重要。對于建站初期不注重SEO的站點,特別是大型站點,本功能真是雪中送炭。

注意:使用本功能時,有時會把非目標字符也做了修改,假如例子中的“abcstring1”不是目標字符,但這個功能也會替換了它。


另外,敖游提醒各位:

1、網站所有URL盡量全bai部使用絕du對地址,可以有效的zhi防止網站被人dao家把惡意鏡像。還有一重zhuan要的作用就是,網絡中如shu果有人引用了你的網站內容,你會獲得來自外界的導入鏈接。

2、盡量把帶www與不帶www的域名區別開來,盡量使用一個為常用的URL,然后另外一個做好301重定向。

3、動態URL和靜態URL都差不多,正常來說影響不大,擴展名其實無關緊要。如:.html,.htm,.asp,.php等等,對搜索來說,并沒有什么區別,關鍵一點,我們在做錨文本時,盡量選擇一個常用的。

4、外鏈與內部鏈接盡量做到一致,意思其實同上,也就是做外鏈時盡量也做與錨文本一樣的URL。

5、URL 盡量用簡單的英文,最好能包括關鍵字的,一定要記住的我們URL不要大小寫混寫,建議全部用小寫字母。

6、做內部錨文本時,一定要注意哪一個關鍵詞指定的哪一個URL。千萬不要出現同樣的錨文本,而每次指向的URL不一樣。(建議做一個長尾關鍵詞記錄單,這樣可以一目了然,哪一個關鍵詞對應哪一個URL)


好了,今天的分享就到這里。很多朋友喜歡找本地的建站優化公司,不知道是出于何種考慮?敖游還是要老話重提一下,無論你是找企業網站優化、商城系統搭建,還是企業小程序設計、百度競價托管代運營服務公司,最主要的還是要看靠不靠譜,如果不靠譜,就算是在你隔壁,一樣讓你不勝其煩!遨游建站是做品牌,不會因為地域差別而影響服務質量,價格方面處于中等水平,售后服務,我們始終秉承“一次建站、終身維護”的宗旨,徹底解決你的后顧之憂!所以,與我們合作,無需擔心身處何地——我們始終以質量為服務基礎!


建站知識
建站問題
手機站問題
Twww.52wangou.com.cn
以信載商,良心建站。遨游始終秉承“一次建站、終身維護”的宗旨,竭誠為客戶提供最優質的互聯網服務。遨游建站率先植入seo優化理念,讓你的網頁更利于搜索引擎抓取,關鍵詞排名更靠前。可仿站、可定制。無論是傳統型企業官網、集團型品牌官網,還是營銷型網站、電商型網站、定制型網站、特殊行業網站(醫療、教育),全部搞定。我們都將為您提供專業、完善、貼心服務!放棄低質建站模式,讓您的網站脫穎而出!
遨游網站建設服務

VIP會員大促銷388x250mm.jpg

最新發布
北京-17073547034    廣東-17089798455   上海-13818415640    武漢-15997307676    河南-17073547034
全國建站、不分地域。遨游建站始終秉承“一次建站,終身維護”的宗旨,竭誠為全國實體企業轉型升級提供助力
無套路建網站;所有技術問題均可在線與我們溝通;簽署電子合同,快遞發票;人工越來越高,恕不接受上門咨詢服務
遨游建站不向灰色敏感、違法違規行業提供網站建設、商城系統定制、小程序設計、SEO優化服務;競價推廣服務不在此限制行列
本站布局及所有素材已提交《中國版權保護中心》,切勿鏡像。遨游建站提醒您:放棄低質建站模式,讓你的網站脫穎而出
請簡要描述您的需求,我們會在24小時內與您取得聯系
姓名
*
電話
*
問題
*
已加密 立刻提交
 
 

QQ咨詢圖標


微信咨詢圖標


17073547034


留言咨詢圖標


二維碼圖標


返回頂部圖標