正文 計算機搜索引擎智能化技術研究

類別:都市言情 作者:電腦迷(2014年7期) 本章:正文 計算機搜索引擎智能化技術研究

    計算機搜索引擎智能化技術研究

    應用研究

    作者:譚勁鬆

    摘 要 現代科技的飛速發展使互聯網計術得到更好的運用,搜索引擎幾乎作為人們日常所需的必備品。但由於社會的進步,人們需求的增多,計算機搜索引擎技術已經不能夠滿足人們所需,所以計算機搜索引擎加入智能化技術能夠準確、迅速並且更加智能的達到用戶目的。本文重點分析了計算機搜索引擎計術及智能化技術的特點研究。

    關鍵詞 計算機 搜索引擎 智能化 技術

    中圖分類號:TP3 文獻標識碼:A

    0前言

    搜索引擎也可被稱作一種程序,通過對用戶提供的關鍵詞進行計算、分類、搜索、返回,達到向用戶推送需要信息的操作。但搜索引擎會因為數據庫信息龐大、語言信息複雜、SEO作弊優化等情況降低搜索效率及準確性,所以搜索引擎加入智能化技術勢在必行。

    1計算機搜索引擎計術

    1.1搜索引擎原理

    計算機搜索引擎的來源是根據數據庫內相關內容的搜索操作發展而成,目前的搜索引擎已經不再局限於數據庫內相關內容的搜索,發展到針對互聯網搜索的操作。

    搜索引擎技術種類繁多,我們常用的有綜合門戶類(百度、穀歌類)和鏈接評價類。無論哪種技術都是用戶通過對關鍵詞的設定在搜索互聯網數據庫中進行搜索,並能搜索到準確或備用信息返回給用戶。

    這種搜索是利用SPIDER蜘蛛在互聯網內各種開放性信息之間進行搜索,我們稱之為SPIDER蜘蛛機器人。蜘蛛爬行搜索是根據提供的關鍵詞,起始一個URL列表,利用鏈接形式進行整個互聯網的搜索,有的網站在ROBOTS文件中設置禁止蜘蛛爬行,這不屬於公開信息類,所以蜘蛛在搜索過程中將此類網站排除。直至URL列表為空或數據庫磁盤已滿,搜索終止。

    1.2搜索引擎的障礙

    搜索引擎目前具有一定的局限性,由於信息分類不夠準確、信息排序能力不強或信息更新速度慢、信息評價無作用等情況阻礙了搜索引擎的發展。

    信息分類不夠準確,因為在對信息建立時便不能準確處理,信息內容複雜,類別自然多樣化。當關鍵詞出現的概率和信息類別、信息內容處理不平衡時,導致信息分類不準確。

    人們現在所使用的搜索引擎,實際上為準確排序做了優化工作。但由於SEO優化過程中很容易投機取巧、進入極端優化,導致搜索引擎在排序方麵出現錯誤。某些網站在做SEO優化時采用作弊行為優化排名,這種行為在搜索引擎中很難被發現,所以會出現作弊網站的排名至前。眾所周之,互聯網的信息量巨大,為我們提供很好的生活幫助,但也是由於信息量過大,導致一些信息更新不及時,經常會發生一些信息不能跟進實時搜索或者信息搜索位置不變等情況。

    搜索引擎的障礙還體現於搜索引擎中收錄的信息評價能力弱,舉例說明,網站上設置多個關鍵詞,基本類似,這樣可以增加搜索引擎的收錄和排名,但這種收錄情況對用戶基本沒有用處。目前計算機搜索引擎還未能對信息進行客觀評價,從而篩選出關鍵詞和信息內容相匹配的信息。

    2搜索引擎智能化技術分析

    當計算機搜索引擎發現諸多障礙時,人們必須及時解決這些障礙。計算機搜索引擎融入智能化技術後,從原有的基礎算法更新到智能知識層麵的算法,實現與用戶之間自然語言的智能搜索。


>>章節報錯<<

如果您喜歡,請把《電腦迷(2014年7期)》,方便以後閱讀電腦迷(2014年7期)正文 計算機搜索引擎智能化技術研究後的更新連載!
如果你對電腦迷(2014年7期)正文 計算機搜索引擎智能化技術研究並對電腦迷(2014年7期)章節有什建議或者評論,請後台發信息給管理員。