網(wǎng)站托管公司,百度SEO
在搜索引擎優(yōu)化的實(shí)踐中將現(xiàn)象分開(kāi),并進(jìn)一步分析搜索引擎的工作原理。 實(shí)際上,在了解了搜索引擎的工作流程和該策略的基本算法之后,就可以在一定程度上避免不必要地使用不當(dāng)操作。 紀(jì)律嚴(yán)明,還可以快速分析許多搜索引擎搜索結(jié)果異常的原因。 搜索行為的中心是一個(gè)搜索引擎,該搜索引擎用于站點(diǎn)搜索,完全搜索和垂直搜索。 接下來(lái),作者將基于行業(yè)知識(shí)討論全文搜索引擎的基本結(jié)構(gòu)。 諸如百度和谷歌這樣的綜合搜索巨頭必須擁有更復(fù)雜的架構(gòu)和檢索技術(shù),但是宏原理相似。
搜索引擎的大致結(jié)構(gòu)可以分為兩部分:第一部分是經(jīng)過(guò)一系列處理后主動(dòng)抓取網(wǎng)頁(yè)并設(shè)置索引,以等待用戶(hù)搜索。 另一部分是分析用戶(hù)搜索嘗試并顯示用戶(hù)需要的搜索結(jié)果。
搜索引擎將主動(dòng)爬網(wǎng)該網(wǎng)頁(yè),并停止內(nèi)容處理和索引部分的過(guò)程和機(jī)制,如下所示。
第1步根據(jù)特定策略發(fā)出Spider,將網(wǎng)頁(yè)抓取回搜索引擎服務(wù)器。 步驟2停止鏈接提取,內(nèi)容處理,降噪,并提取檢索到的網(wǎng)頁(yè)的主題文本內(nèi)容。 步驟3停止中文分詞,刪除網(wǎng)頁(yè)文本內(nèi)容的停用詞等。 步驟4:在網(wǎng)頁(yè)內(nèi)容的分詞停止后,確定該頁(yè)面的內(nèi)容和被索引的網(wǎng)頁(yè)是否重復(fù),刪除重復(fù)的頁(yè)面并停止剩余網(wǎng)頁(yè)的倒排索引,然后等待 用戶(hù)的搜索。
步驟01:停止對(duì)用戶(hù)查詢(xún)的關(guān)鍵詞進(jìn)行分詞,并根據(jù)用戶(hù)的天文位置和歷史檢索特征停止用戶(hù)需求分析,從而利用區(qū)域搜索結(jié)果和個(gè)性化搜索結(jié)果向用戶(hù)展示更多的內(nèi)容 需要。
步驟02查找關(guān)鍵字的查詢(xún)結(jié)果在緩存中是否可用。 如果存在,為了更快地顯示查詢(xún)結(jié)果,搜索引擎將基于當(dāng)前用戶(hù)的各種信息來(lái)判斷其實(shí)際需求,并停止對(duì)結(jié)果進(jìn)行微調(diào)或?qū)⑵涠ㄏ虻骄彺嬷小?呈現(xiàn)給用戶(hù)。
步驟03,如果用戶(hù)查詢(xún)的關(guān)鍵詞在緩存中不存在,則索引庫(kù)中的網(wǎng)頁(yè)停止調(diào)用排名并顯示,并將關(guān)鍵詞和對(duì)應(yīng)的搜索結(jié)果加入緩存。
步驟04網(wǎng)頁(yè)排名基于用戶(hù)的搜索詞和搜索需求,停止索引庫(kù)中網(wǎng)頁(yè)的相關(guān)性,重要性(鏈接權(quán)重分析)以及對(duì)用戶(hù)體驗(yàn)的上下分析。 用戶(hù)的點(diǎn)擊和搜索結(jié)果中的重復(fù)搜索行為也可以告知搜索引擎用戶(hù)使用搜索結(jié)果頁(yè)面的體驗(yàn)。 這是最近作弊很多的部分,因此此部分將伴隨搜索引擎的反作弊算法干預(yù),有時(shí)可能會(huì)停止手動(dòng)干預(yù)。
根據(jù)以上搜索引擎架構(gòu),Spider,內(nèi)容處理,分詞,重復(fù)數(shù)據(jù)刪除,建立索引,內(nèi)容相關(guān)性,鏈接分析,區(qū)分頁(yè)面用戶(hù)體驗(yàn),反作弊,手動(dòng)干預(yù),緩存機(jī)制,用戶(hù)需求分析等模塊。