做網(wǎng)站優(yōu)化工作的SEOer都知道,網(wǎng)站的標題,關(guān)鍵詞和描述是網(wǎng)站優(yōu)化的基礎(chǔ)。但是如何設(shè)置這些東西,從而符合百度的算法和技術(shù)習慣并不是一個簡單的問題,F(xiàn)在筆者和大家分享一下百度的中文分詞技術(shù),讓大家對網(wǎng)站優(yōu)化有個更深入的認識。
所謂中文分詞就是將一些一個短句分為一個個單獨的詞,或者將一個短詞分為一個個漢字,比如網(wǎng)站seo優(yōu)化,可以是網(wǎng)站seo/優(yōu)化,也可能是網(wǎng)站/seo優(yōu)化,還有可能是被分為網(wǎng)站/seo/優(yōu)化,這就是中文分詞,那么對于搜索引擎來說有哪些分詞的技術(shù)呢?筆者總結(jié)下來主要分為五點。
首先:用戶改變關(guān)鍵詞習慣搜索得出的不同結(jié)果,如果在百度里搜索的關(guān)健詞的時候有加上空格或標點其搜索的結(jié)果是不一樣的,比如搜索濟南SEO和濟南 SEO,其結(jié)果是有區(qū)別的,這就是因為如果搜索是濟南seo,那么百度會根據(jù)自己的數(shù)據(jù)庫分析這是一個單獨的詞,但是如果搜索濟南 seo那么反饋的結(jié)果百度會認為你是需要搜索兩個詞。
第二:搜索引擎的正向最大匹配法,什么是正向最大匹配,就是將詞從左到右拆分,比如搜索濟南seo工作室,百度將會有以下顯示,這個就是從左到右的正向最大匹配法,會將濟南seo 工作室按照兩個詞拆分。
第三:搜索引擎的反向最大匹配法,通過正向最大匹配,相信大家都了解反向最大匹配了,就是百度會將詞從右向左拆分,比如搜索濟南優(yōu)化工作室,百度就會將濟南 優(yōu)化工作室作為兩個詞,這個拆分是從右向左的。
第四:雙向最大匹配法,對于有些詞百度會按照雙向最大匹配法來拆分,比如在搜索濟南網(wǎng)站優(yōu)化工作室時我們會發(fā)現(xiàn)百度將濟南網(wǎng)站優(yōu)化和網(wǎng)站優(yōu)化工作室都表明了紅色,也就是百度會將這個詞按照正反兩個方面同時最大匹配了。
第五:最少切分理論,對于最小切分理論其實是搜索引擎會將詞按照最少的切分方式分詞,也就是說如果可以分為兩個詞那么不會分成三段的,比如上海SEO工作室,這個詞百度就將其分為兩個詞,而沒有分為濟南 SEO 工作室。
通過以上幾點的分析,相信大家對于中文分詞都有一個比較詳細的了解,筆者建議各位站長盡量通過各個分詞技術(shù)研究用戶一般會搜索的關(guān)鍵詞來擬定標題的建設(shè)和關(guān)鍵詞的布局。
濟南網(wǎng)站優(yōu)化:http://m.mahangsq.com/