多用戶網(wǎng)店系統(tǒng)優(yōu)化必須先了解搜索引擎原理,再做SEO優(yōu)化(上)
你知道“百度”這個搜索引擎是怎么工作的嗎?你有過這樣的疑惑嗎,同樣多用戶網(wǎng)店系統(tǒng)主題,為什么在百度上他的排名在我前面?其實都是百度的排序算法左右著我們的多用戶網(wǎng)店系統(tǒng)排名。那好,我們只要摸清楚百度是如何給我們這些網(wǎng)站排名的話,我們就能對癥下藥把我們多用戶網(wǎng)店系統(tǒng)優(yōu)化成它喜歡的多用戶網(wǎng)店系統(tǒng),排名自然就上去嘍!
其實,搜索引擎的工作過程大體上可分為三個階段:
一、爬行和抓取--搜索引擎蜘蛛通過跟蹤鏈接訪問網(wǎng)頁,獲得頁面HTML代碼存入數(shù)據(jù)庫。
二、預處理--索引程序對抓取來的頁面數(shù)據(jù)進行文字提取,中文分詞,索引等處理,以備排名程序調用。
三:排名--用戶輸入關鍵詞后,排名程序調用索引庫數(shù)據(jù),計算相關性,然后按一定格式生成搜索結果頁面。
那么問題來了!我們知道,要想讓我們的多用戶網(wǎng)店系統(tǒng)讓百度收錄到它的數(shù)據(jù)庫中,就必須讓百度蜘蛛在茫茫的互聯(lián)網(wǎng)中發(fā)現(xiàn)我們,蜘蛛的工作原理是順著網(wǎng)站的鏈接地址進行爬行抓取頁面信息,單從理論上來說蜘蛛可以爬行和抓取互聯(lián)網(wǎng)上所有頁面,但是實際上不能,也不會這么做,在這種前提下,蜘蛛所要做的就是盡量抓取重要頁面。 所以,我們SEO人員要想讓自己的更多頁面被收錄,就要想方設法吸引蜘蛛來抓取。
被搜索引擎認為符合重要頁面的幾個因素:
1、網(wǎng)站和頁面權重
2、頁面更新度
3、導入鏈接
4、與首頁點擊距離
我們只有讓我們的網(wǎng)站向上面這4條信息靠攏,才會被蜘蛛發(fā)現(xiàn)并收錄到數(shù)據(jù)庫中。好了,當我們的網(wǎng)站信息被百度收錄后接下來就可以分為以下幾個步驟:
1、預處理。在一些SEO材料中,“預處理”也被簡稱為“索引”,因為索引是預處理最主要的步驟。我們知道在百度數(shù)據(jù)庫中收錄的并不是現(xiàn)成的頁面,而是“HTML”標簽源代碼,搜索引擎預處理的工作內容首先除去HTML代碼后,剩下的用于排名的文字只是一行。
除了可見文字,搜索引擎也會提取出一些特殊的包含文字信息的代碼,如:META標簽中的文字,圖片替代文字,F(xiàn)lash文件中的替代文字,鏈接錨文字等。
2、中文分詞(這是中文搜索引擎所獨有的,誰讓我們的文化博大精深呢,沒辦法,就是任性!)。中文分詞方法基本上有兩種:
(1)、基于詞典匹配--將待分析的一段漢字與一個事先造好的詞典中的詞條進行匹配,在待分析漢字串中掃描到詞典中已有的詞條則匹配成功,或者說切分出一個單詞。
(2)、基于統(tǒng)計--指的是分析大量文字樣本,計算出字與字相鄰出現(xiàn)的統(tǒng)計概率,幾個字相鄰出現(xiàn)越多,就越可能形成一個單詞。
3、去停止詞 。停止詞--無論是英文還是中文,頁面內容中都會出現(xiàn)頻率很高,卻對內容沒有任何影響的詞,如“的”、“地”、“得”之類的助詞,“啊”、“哈”、“呀”之類的感嘆詞,“從而”、“以”、“卻”之類的副詞或介詞,這些詞被稱為停止詞。 因為這些停止詞對頁面的主要意思沒什么影響,所以搜索引擎索引頁面之前會去掉停止詞,使索引數(shù)據(jù)主題更為突出,減少無謂的計算量。
4、消除噪聲。所謂噪聲,就是除了停止詞以外,對頁面主題沒有什么貢獻的因素,比如:博客頁面的“文章分類”、“歷史存檔”等。
消噪的基本方法: 根據(jù)HTML標簽對頁面分塊,區(qū)分出頁頭,導航,正文,頁腳,關高等區(qū)域,在網(wǎng)站上大量重復出現(xiàn)的區(qū)塊旺旺屬于噪聲。對頁面進行消噪后,剩下的才是頁面主題內容。
5、去重。搜索引擎在進行索引前還需要識別和刪除重復內容,這個過程就稱為“去重”。其意義在于提升用戶體驗(搜索引擎不喜歡重復性內容)。
去重方法: “去重”的基本方法是對頁面特征關鍵詞計算指紋,也就是說從頁面主題內容中選取最有代表性的一部分關鍵詞(經常是出現(xiàn)頻率最高的關鍵詞),然后計算這些關鍵詞的數(shù)字指紋。
6、正向索引 。正向索引也可以簡稱為索引 ,搜索引擎索引程序將頁面及關鍵詞形成詞表結構存儲進索引庫。并由文件ID映射著其關鍵詞內容,一一對應。
7、倒排索引。正向索引還不能用于排名,最終用于排名的是倒排索引。所以搜索引擎會將正向索引數(shù)據(jù)庫重新構造為倒排索引,把文件對應到關鍵詞的映射轉換為關鍵詞的文件的映射。
8、鏈接關系計算。鏈接關系計算也是預處理中很重要的一部分。 搜索引擎在抓取頁面內容后,必須事前計算出: 頁面上有哪些鏈接指向哪些其他頁面 每個頁面有哪些導入鏈接 鏈接使用了什么錨文字 這些復雜的鏈接指向關系形成了網(wǎng)站和頁面的鏈接權重。
9、特殊文件處理。
搜索引擎除了可以抓取HTML文件外,通常還能抓取和索引以文字為基礎的多種文件類型,如:PDF、WORDS、WPS、PPT、TXT等文件。 目前搜索引擎還不能處理圖片、視頻、Flash這類非文字內容,也不能執(zhí)行腳本和程序。
做完上面這幾件事后,最后的工作就是多用戶網(wǎng)店系統(tǒng)排名了。由于這里寫不下,還望大家關注我下一篇文章哦,我會詳細講解搜索引擎是如何給我們的多用戶網(wǎng)店系統(tǒng)進行排名的。也歡迎大家有什么問題能跟我交流討論!
-
B2B2C多用戶商城系統(tǒng)支持企業(yè)自營與商戶入駐模式共存 會員一站式精細化營銷工具 多用戶分銷,帶來爆發(fā)式增長
系統(tǒng)支持平臺自營+供應商店鋪共存的經營模式(類天貓&京東模式),幫助企業(yè)打造生態(tài)級商業(yè)平臺為目的的電子商務系統(tǒng)。
免費試用系統(tǒng) -
B2B2B電商交易系統(tǒng)優(yōu)化供應鏈協(xié)作 授信及賬期支付 商品按照數(shù)量階梯設價
全渠道訂貨/采購及經銷商管理數(shù)字化系統(tǒng),實現(xiàn)供應鏈整合和交易便捷化。
免費試用系統(tǒng) -
S2B2B電商交易系統(tǒng)供銷一體化,提高市場集中度 集團管控一體化,有效實現(xiàn)供需匹配 移動應用一體化,提高運營綜合效率
上下游資源整合數(shù)字化解決方案,賦能產業(yè)供應鏈,構建產業(yè)互聯(lián)網(wǎng)生態(tài)體系。
免費試用系統(tǒng)
